社区统计和统计社区
对社区和居民社会生活的多数描述不太关注社区边界的具体划分,而是关注社会生活的质量和所在社区的公共附属品。过往对相互排斥和详尽的边界界定的关注更是少之又少,但在统计方法中这种界定很早就被优先考虑了。在本节中,我们将阐述本书使用的数据和方法,并对21个选入分析的大都市区进行介绍。
我们最大限度地利用了人口普查数据。据美国人口普查局的描述,街区(tract)是:
面积较小、相对不变的地区,是以小地区提供统计数据为目的,进而将大都市和某些其他地区进行划分后形成的区域。人口普查街区(census tract)确立后,其被设计成在人口特征、经济地位和生活条件方面相对接近的地区。一个街区一般有2500~8000名居民。
当然,这是理想状态。人口普查街区应该有4000人口的规模,一方面为使总体达到均衡要将这个数值设定得足够小,但另一方面也要为避免干扰抑制的问题(见下文)而将其设计得足够大。城市街区提供的数据更全面,然而,数据太多,经常要为保护个人反馈的隐私而受到干扰抑制。街区内的平均人口规模由于人口在城市间和内部的流动而很难前后一致。例如,从芝加哥到远郊的黄金海岸,或从芝加哥到圣安东尼奥。
我们的调查共涵盖近6000个人口普查街区的21个大都市区,街区平均规模为4200人。鉴于各街区人口规模之间的差异较大,我们将4000人作为一个统一标准。大约60%的街区规模为2400~6400人。附录B中详细描述了街区样本的统计特征与街区系统的发展和标准化。
正如1980年人口普查中的定义,人口普查街区构成了大都市区。标准大都市统计区(SMSA,下文简称“统计区”)由相邻城市构成,通常这些城市通过一个至少拥有50000人口的城市作为核心进行经济和社会整合。统计区包含了所有的郡县人口。大都市区的郊区(也就是单个街区)事实上与某些农村的特征相似。这种现象通常发生在自身郡县非常大的地区,比如西部地区。街区的建立理念基于时间跨度上的一致性,故而街区数据与其他小区域数据不同,我们在将第六章充分利用这一特性。
为达成我们的目标,我们将人口普查街区视为统计学意义上的社区。因此,我们在21个大都市中选取了5995个社区,包括2700多万人口。街区在规模、同质性、数据有效性和可比性等方面具有绝对优势。事实上,已有文献中,街区的定义与社区的概念(除了价值和观点)并不存在较大的差异。由于街区是我们所需的分析单位,这与对生态谬误的无休止的争论不太相关。我们并不打算用人口普查数据推断关于个人(实际上,公众使用微数据样本更容易直接获取这类信息)的特点,而是努力了解社群自身的特点。
事实上,几乎所有适用于州和国家的表格都是为人口普查街区创建的。我们统计了社区中关于每个人年龄、种族、性别、婚姻状况、教育、世系、职业、收入、住房类型及房屋质量的信息。原则上,国家层面上的大量分析对社区研究是可用的。然而在实践中,我们通常对基本特征的空间变化比其完整细节更感兴趣。此外,为减少因保障涉及私密的数据而导致的干扰抑制,我们也删除了许多详细的表格数据。
以前的研究主要使用的是在地理学和主题延伸方面差异巨大的街区小区域数据。一方面,尤其是有关种族隔离的一些研究,提供了统计区内几乎每个街块和街区以及主要城市的数据以进行一个或几个特征的分析;另一方面,一些研究人员专注于一个或适当数量的城市,他们提供了大量的人口普查主题特征以供统计处理。本书对此采取中间立场。由于我们想归纳国家居住模式中的分异,因此我们为有关大都市区的分析提供了大量特征,以便研究。