2.1 空间异质和空间依赖
区域经济问题研究往往依赖于与地理相关的测量抽样数据。那么,是什么使空间经济计量有别于普通经济计量?当抽样数据具有地区性因素时,会产生两个问题:(1)设立的地区数据模型中存在空间异质性;(2)观测中存在空间依赖性。
传统计量经济学极大地忽视了这两个问题,违反了回归模型的GaussMarkov假设。首先,Gauss-Markov假设解释变量是固定重复抽样的,而空间依赖性违反了这个假设。这引发了对于可估计研究方法的需求。其次,在抽样数据中存在一元线性关系的情形下,由于空间异质性的存在,如果改变空间抽样数据,其关系也随之改变的话,就需要建立满足这种变化并能够得出适当结论的模型。
2.1.1 空间分布与空间异质
传统计量经济模型中变量和扰动项一般在时间轴(或一维空间)上分布。而空间计量经济学为验证空间异质性的存在,需要分析变量和扰动项在空间上的分布。
变量和扰动项在空间上的分布有两种类型:空间集聚和分散。而分散又可分为两种亚类型:均匀分布和随机分布。也可以说,变量和扰动项在空间上的分布有三种形态:空间集聚(如企业集群)、均匀分布(如农业在均质平原上的分布)和随机分布(如footloose enterprises)。
比较观测样本数相等、均值相等的三种分布,均匀分布的方差为0,随机分布的方差较小,而空间集聚的方差最大(如图2.1所示)。
图2.1 空间分布的三种形态
现实中,正是空间经济分布的非均匀或非随机导致了空间异质。所谓空间异质性(spatial heterogeneity),即空间差异性,是指每一个空间区位上的事物和现象都具有区别于其他区位上的事物和现象的特点(Anselin,1988)。
事物和现象在空间上是异质的,一方面在于各种事物和现象本身在空间上缺乏平稳的结构(如图2.2所示);另一方面也在于空间单元本身远不是均质的,在面积、形状等方面往往存在很大的差别(如图2.3所示)。
图2.2 2005年中国地级以上城市辖区人口分布
图2.3 2006年中国地级财政自给系数
从统计学角度看,空间异质性是指研究对象在空间上非平稳,这违背了经典统计学所要求的所有样本都来自于同一总体的假设(Anselin,1988)。
空间异质性可表示为:
式中,i代表空间观测单元,i=1, …, n。fi表示因变量yi与自变量xi、参数向量βi与误差项εi之间的函数关系。
通常,用一个线性关系描述如下:
式中,X i代表用于解释变量的向量(1× k),同时有随之变化的参量βi。y i是代表在i地的观测量的因变量,εi则代表线性关系中的随机变量。
作为空间异质性的一个图解,我们基于2004年中国经济普查的北京地区数据,以不同的距离为半径画圈,来测量和分析不同圈层中的就业数量状况。图2.4就业密度分布表明了不同的相互关系在不同的区位对就业发生着作用。当然这并不奇怪,众多区域科学理论都将就业分布解释为其与CBD距离的函数。尽管如此,这种明确的分布给出了与Gauss-Markov假设的对照,即使改变观测量,样本数据的分布仍表现出一种固定的形式和变化。图2.4就业分布的空间拟合见图2.5。
式(2.1)中,针对一个样本容量为n的截面观测数据,由于没有足够的样本数据信息用以对空间中的每一点作出估计(这与自由度问题相关),因而无法估计出一套n个参数向量βi。为此,需要简化空间相互关系。假如,将空间观测划分为城市和农村两部分,且将分析限制在两种相互关系之内,一种是城市观测数据集,另外一种是非城市观测数据集。但这可能会产生以下问题:(1)这两种相互关系与数据是否一致,或者是否有迹象表明有两种以上的相互关系?(2)估计工作的效率和所使用的简化之间是否有一个权衡?(3)如果这样的简化与样本数据信息不一致,所得到的估计是否是片面的?
为避免上述问题,空间计量经济学中通常应用Bayesian方法,以采用随机的限制条件而非精确的限制条件。
总之,空间异质性的存在意味着空间计量经济学的任务除了要发现整体的或总的空间模式,还要识别空间模式的局部差异,揭示空间差异特征。
图2.4 缓冲区切割示意图(中心区半径为5 km,缓冲区各圈层半径按3 km递增)
注:本图用不同半径的缓冲区来切割北京经济普查企业点位数据,并对切割出来的不同范围的企业进行就业人数汇总;再根据每个环带切割出来的企业就业人数除以每个环带的面积得到每个环带的就业密度。
图2.5 各区县就业密度拟合
2.1.2 空间依赖与关联
空间依赖(其较弱形式是空间关联)是事物和现象在空间上的相互依赖、相互制约、相互影响和相互作用,是事物和现象本身所固有的属性,是地理空间现象和空间过程的本质特征。空间依赖(spatial dependence)可以定义为观测值及区位之间的一致性(Anselin,2000)。当相邻地区随机变量的高值或低值在空间上出现集聚倾向时为正的空间自相关,而当地理区域倾向于被相异值的邻区所包围时则为负的空间自相关。可见,空间依赖意味着观测值由于某种空间作用而在地理上集聚,这些联系不同地区的作用有溢出效应及贸易、传播或其他社会经济的交互作用。由于直接作用于区域相互关系,像劳动力、资本流动、知识溢出、交通运输或交易成本等经济因素对空间依赖尤其重要。
Tobler(1970)将空间关联的普遍性上升为地理学第一定律(First Law of Geography),即“任何事物在空间上都是关联的;距离越近,关联程度就越强;距离越远,关联程度就越弱”。
造成空间依赖性的主要原因有两个,分别是空间要素在空间边界之间的流动(空间溢出效应),以及空间界限导致的区位、距离对空间的特征的影响。这表明,一个区位上的事物和现象可由空间系统中其他位置上的事物和现象决定或部分决定,这可由下面的空间过程加以表达(Anselin,1988):
式中,yi表示变量y在第i个空间单元上的观测值,i∈S, S是所有空间单元的集合。
式(2.3)中,空间中一个地点观测的数据会受到其他地点观测数据的影响。为何要估计这种影响呢?通常会给出两个原因。首先,与空间单位——如邮政编码、省(或地、县)、人口和经济抽样调查地区等——相关的观测数据收集都有可能出现测量误差。如果收集数据的行政区划界限不能正确地体现影响样本数据的潜在空间过程的本质,式(2.3)的情形将会发生。以就业政策的衡量为例,由于劳动力是可流动的,可能跨越行政区划界限在附近地区寻找工作,以劳动力的居住地为基础所进行的失业率和劳动力的调查就会存在空间依赖性。其次,同时也更重要的原因是,用来解释空间依赖性的原因在于社会人口结构、经济、区域事务的空间范围或许的确是建模问题的一个重要的方面。区域科学的一个重要前提是区位和距离是决定人类地理和市场活动的重要力量。其依据是空间影响渗透作用、地区层级和空间溢出理论。
从计量经济学角度看,空间关联是指空间数据之间缺乏独立性,违背了经典计量经济学的样本独立不相关假设。空间关联主要指空间自相关(Anselin, 1988)。空间自相关与时间序列分析中的时间自相关概念类似,但两者具有本质的区别。空间自相关是多维的,而时间自相关是一维的。用来分析时间自相关的时间序列方法不能直接用来处理空间数据的自相关特征。
只要数据是以空间单元组织的,就有存在空间关联的可能性。空间关联意味着在空间计量经济过程中有必要发现数据之间的空间关联关系,揭示形成不同空间结构模式或空间差异的内在关联机制。
作为这种空间依赖性的具体实例,中国各省区GDP份额提供了一个具有空间特点的经济现象的典型案例。图2.6表明GDP分布呈明显的中心—外围模式,以上海、江苏、浙江、广东、北京、天津为核心的东部沿海地区处于经济中心地位,东部沿海各省区GDP占全国的份额较高;而距中心越远的外围省区的GDP份额越低。而且随着时间推移,经济集聚的趋势明显。
图2.6 中国各省区GDP份额
对空间依赖性的考察与传统计量经济学方法有何不同呢?Gauss-Markov的样本数据回归方法可表示为:
y=Xβ+ε
其中,y代表由n个观测量组成的向量,X代表由k个解释变量的n个观测样本组成的n×k矩阵,β代表由k个待估参数组成的向量,ε代表由n个随机变量组成的向量。
Gauss-Markov的样本数据回归方法假设样本数据y的分布会与ε具有相同的变化,即y的每一个观测量的分布都遵循一个恒定的变化规律,且在这些观测量之间不具有协变性。
需要明确的是,中国内地GDP在各省区的分布不符合这个规律。如图2.3所示,GDP分布呈明显的中心—外围模式。这表明,由区域经济学样本数据中潜在的相互关系产生的空间依赖性,需要量化和模型化确定空间依赖性函数f的特征。
2.1.3 空间模式和自相关
一、空间模式
事物和现象在地理空间上并不是独立、随机分布的,而是相互联系、相互作用,呈现一定的空间分布格局。简言之,空间模式(spatial pattern)就是事物和现象的空间分布格局、特征及其演变等。如区域经济学中的核心—边缘结构。空间模式之所以产生和演变的根本原因之一是时间上和空间上的关联(Cliff和Ord,1981)。
空间模式大致包括以下几种类型:(1)时间关联模式:不同时间、空间区位相同的事物和现象之间的关联模式。(2)空间关联模式:同一时间、空间区位不同的事物和现象之间的关联模式。(3)时空关联模式:不同时间、空间区位不同的事物和现象之间的关联模式。
空间关联模式在本质上更加强调不同空间区位上事物和现象之间的关联所形成的空间模式。通过建立和检验与空间过程有关的假设,可以发现空间模式形成的动力机制。
二、空间自相关
空间自相关是空间场中的数值聚集程度的一种量度。距离近的事物之间的联系性强于距离远的事物之间的联系性。如果一个空间场中的类似的数值有聚集的倾向,则该空间场就表现出很强的正空间自相关;如果类似的属性值在空间上有相互排斥的倾向,则表现为负空间自相关(见图2.7)。因此,空间自相关描述了某一位置上的属性值与相邻位置上的属性值之间的关系。
图2.7 强空间正负自相关模式