作者:陈柯,经济学博士,上海社会科学院经济研究所助理研究员
原文题为《一种新的利用网络爬虫技术的土地价格指数编制方法》,发表于《数量经济技术经济研究》2017年第3期。
一、研究背景
土地是一种不可移动和复制的重要生产要素。一方面,土地价格直接影响了厂商的利润和生产经营状况,也是厂商进行区位选择时需要考虑的首要问题,土地价格塑造了生产、产业、创新在空间上的组织和聚集。另一方面,土地价格作为住房成本的重要组成部分,直接影响住房价格,进而影响居民的消费、储蓄和投资行为。对住房的过度投资有可能对实业投资产生挤出效应,同时不同技能劳动力对具有优良公共设施和高便利性的大城市高房价支付能力的差异,将会造成劳动力在空间上分布的不均匀。分税制改革以后,财权与事权的不对等使得地方政府逐渐走向以土地征用、开发和出让为主的 “土地财政”发展模式。地方政府为了在招商引资的竞争中保有优势,通常将工业用地价格维持在较低的水平,并通过抬高居住用地的价格来弥补财政的短缺。土地价格是与我国快速的工业化、城市化和大规模的基础设施建设密不可分的重要影响因素。
尽管土地价格在经济活动中发挥着核心的调节作用,目前在公开资料中,对如何客观估计我国土地出让价格水平,即土地价格指数的讨论并不多见。国土资源部发布有多地区城市地价指数,该指数对每一观察时期的土地出让价格按面积加权平均得到。随着我国城市空间的不断扩张和蔓延,早期出让的地块相较于后期出让的地块更多地位于市中心区域,因此该指数无法反映交易地块的位置异质性问题,所获得的指数数据与人们的直观感受有很大的差异。清华大学恒隆房地产研究中心等编制的土地价格指数采用了特征价格(Hedonic)模型控制地块的可观测异质性特征,但在现实中,具有相同的可观测特征的地块可能会因为历史、文化、规划等难以度量的和不可观测的特征出现较大的价格差异,上述特征价格模型无法控制地块的不可观测特征对其价格的影响。
本文为了克服土地价格指数研究对象即交易地块不可复现特点导致的问题,将经典价格指数模型中的重复交易法与特征价格法进行了综合,提出了一种编制土地价格指数的混合模型。首先借鉴重复交易指数构造方法,通过引入地理单元个体项,将地理单元中的地块视为重复交易;其次在地理单元内部,借助组内差分的手段控制地块不可观测特征所带来的异质性。混合交易模型为编制土地价格指数提供一种相对简便可行并可以同时控制交易地块的可观测特征和不可观测特征的新方法。为了实现混合价格指数模型的研究思路,需要在研究手段和技术上进行大胆的创新。本文在数据选取上使用了逐笔土地的协议出让和招拍挂数据,并引入了网络爬虫技术进行数据的采集工作。目前,在我国土地价格指数的相关研究中,未见相似规模和粒度的基础数据。
三、上海地区土地价格指数测算结果
(1)本文在构建了混合土地指数模型、完成了土地交易数据的互联网采集工作后,针对上海地区2008年至2015年的土地市场进行了价格指数的测算。年度土地价格指数测算结果表明,上海地区居住用地、工业用地以及商服用地价格指数的随时间的变化特征存在显著的不同。就总体变动幅度而言,居住用地2008—2015年的涨幅在3.5倍以上,而商服用地与工业用地的涨幅都在100%左右。就近几年来地块价格的波动情况而言,商服用地随经济周期的变化波动最为剧烈,分别在2008—2010年与2012—2015年两个时间段,出现了显著的震荡;而相对而言,居住用地在近两年来才出现剧烈的上涨;工业用地的价格水平则由于受到政府调控的原因,一直呈现较为平稳的趋势。这些特征比较符合近年来上海土地市场的实际变化情况:2008年房地产政策宽松,房贷利率折扣力度加大,引起居住和商服地价的快速上升;2010年政策开始收紧,10月上海颁布限购政策,资金转而流入一线城市的商业地产和三线、四线城市的住宅市场,引起随后几年上海住宅用地价格的平稳和商服用地价格的快速上升;经过一个建设周期后,三线、四线城市住宅市场和上海商业地产过剩,资金又开始回流到一线城市的住宅市场,造成2014年、2015年上海商服用地价格的快速下跌和居住用地的急剧上涨。
(2)本文提出的土地价格指数混合模型包含特征价格法的成分,因此该模型也有能力讨论地块属性对于土地价格的影响。本文发现,从土地出让方式的角度,招标出让对居住和商服两种类型的地块价格都有显著的正向影响;面积则对于工业仓储用地与商服用地价格分别具有显著的负向影响和正向影响,但对于住宅用地价格的影响并不显著;各类细分的用途对住宅用地与商服用地价格均产生了显著的正向影响。对于土地等级,在商服用地中则显得不显著,而在工业仓储与住宅用地回归中,高等级土地对两者的价格产生了负向的影响,似与现实有矛盾之处。考虑到土地等级是由政府部门制定的指导性意见,在协议出让为主的时期也许能有较好的价格解释能力。但在市场经济条件下,土地等级作为指导性意见对价格的解释能力值得商榷。此外,基准地价土地等级的划分本身存在定界模糊不清的问题,典型如多处等级界线划分依据仅为“沿路两侧”,而并未规定两侧纵深。同时本文也认为,同一地理分组内地块的共同不可观测特征在很大程度上已经反映了土地等级所能带来的影响。
(3)鉴于土地价格指数混合模型可以通过组内差分的手段控制地理单元的不可观测异质性,这一异质性亦可通过模型估计得到。经过这样的处理可以控制土地供需市场对价格的影响,从而最终得到地理单元本身的区位价值。以住宅用地为例,从地理单元的区位价值来看上海市东西向街道和乡镇的区位价值要高于南北向,且若干地区的价值,特别是在边缘地带的山阳镇、东北角的南汇新城镇以及崇明的城桥镇相对于平均水平具有非常显著的优势。山阳镇是上海市金山区区政府所在地,建有金山嘴经济园区,也是滨海新城、金山新城区开发建设的重点区域;南汇新城镇是获政府大力扶持的临港新城所在地,是上海自贸区的核心区域;城桥镇是崇明工业园区以及崇明区政府的所在地。由此可以发现新城建设、政府规划是影响土地价格的重要因素。另一方面,上海市西部地区住宅用地的价格高于平均水平,这反映了自然环境对地价的影响,此处为上海地区少有的山丘地貌区域,其周边形成了上海市的高档住宅区。
四、结论与展望
在关于土地数据的研究过程中,由于不可观测特征的存在且完全意义上的重复交易记录过于稀少,使得传统的特征价格方法与重复交易法在应用到这一领域时都存在显著的缺陷。本文采用了综合这两种经典方法的混合模型,以固定的地理单元控制位置相近的地块的不可观测特征,获得了与现实较为匹配的结果。在实际的指数编制过程中,应用网络爬虫技术采集到每笔成交数据,并通过计算机给各条记录分配街道、乡镇一级的地理区划,实现了操作上的自动化,具有较高的便利性。通过对固定效应的检验分析,证实了混合模型确实能够捕捉到地块所在的特殊位置对于其价格的影响。