二 基于空间统计的非参数检验
景观考古分析中需要经常使用一些基于空间统计的非参数检验来考察一些景观要素与考古遗存之间的相关性。其中,最常用的非参数检验是“卡方检验”和“K-S检验”。下面我们尝试依据第六章第二部分练习的内容,检验考古遗址的分布是否与坡度相关。练习数据来源于希腊Kythera岛的考古调查项目。
1.加载并准备数据
(1)重启ArcMap,加载本章练习文件夹的子文件夹exec02下的矢量数据kip_sites和栅格数据k4_tg。其中,k4_tg为调查区域的数字高程模型,kip_sites为遗址点。
(2)在“地理处理”菜单下的“环境”中设置环境变量,其中“处理范围”“栅格分析”→“像元大小”和“掩膜”均设置为“与图层k4_tg相同”。
(3)启动ArcToolbox工具箱下的“Spatial Analyst工具”→“表面分析”→“坡度”,生成k4_tg数字高程模型的坡度,命名为slope。
(4)参照第六章第二部分的练习,统计遗址200米缓冲区范围内的坡度均值,结果保存为stat_sites.dbf。
下面我们就根据这些遗址所处200米缓冲区范围内的坡度均值,检验遗址分布是否与坡度相关。
2.计算非参数检验的背景数据
(1)启动ArcToolbox工具箱下的“Spatial Analyst工具”→“重分类”→“重分类”工具对话框。如图9-5所示:在“输入栅格”中选择分类对象slope;“输出栅格”为re_slope;在“重分类字段”中选择Value,即坡度值;点击重分类方法右侧的“分类”按钮,在“方法”中选择“定义的间隔”,并将“间隔的大小”调整为2,即按照2度进行分类。
图9-5a 重分类对话框
图9-5b 按照2度间隔定义重分类
(2)点“确定”后完成重分类,生成重分类后的坡度图re_slope。在导航栏中,右键点击re_slope图层,选择“打开属性表”。观察发现:COUNT一栏记录了按照0—2、2—4……分类的各坡度区域的栅格总数。
(3)右键点击“表选项”按钮下的“导出”,将该表格导出为stat_slope.dbf命名的文件。下面我们以此为背景数据对遗址的坡度分布进行统计检验。
3.KoImogorov-Smirnov检验
(1)关闭ArcMap,启动Excel软件。首先,利用“打开”菜单打开上述生成的表格stat_slope.dbf。
(2)生成两个新的数据列,分别为各坡度区域的面积“百分比值”(P_SLOPE)和“累计百分比值”(CP_SLOPE)。(图9-6)
图9-6 生成各坡度区域的“累计百分比值”
(3)利用Excel打开遗址坡度表格stat_sites.dbf。与上述坡度区域分类统计图不同的是,该表格是依据单个遗址统计的坡度状况,因此还需要按照同样的坡度分类进行分类汇总。
首先,生成一个新的数列,命名为index,分别输入坡度分类值:2、4、6……24。(图9-7)
图9-7 生成坡度分类值字段index
(4)启动“数据”菜单下的“数据分析”工具箱。(注:如果Excel中没有该工具箱,则需要从Excel的选项中手动加载该项功能。)启动其中的“直方图”分析工具。(图9-8)
图9-8 直方图分析工具
在“输入区域”中选择所有“MEAN”字段的数据(包括字段头);在“接收区域”中选择所有“index”字段的数据(包括字段头);选中“标志”选项和“累积百分率”选项;“输出区域”选择一个新的位置。
(5)点“确定”后生成分类汇总的结果,如图9-9所示:
图9-9 分类汇总后的各坡度区间内的遗址统计数量和数量累积百分比
汇总表中,index一栏为坡度分类区间;频率为各坡度分类区域中的遗址数量;累积%为遗址数量的累积百分比。
(6)分别将stat_slope和stat_sites表中的按照遗址坡度区间分类统计后的累积百分比一栏,拷贝到同一个Excel文件中,并在一个图表中将这两列数据制作成折线图。(图9-10)
图9-10 遗址坡度分布KoImogorov-Smirnov检验累积百分比曲线图
(7)计算可知:这两条曲线之间的最大间距为0.290939。根据Kolmogorov-Smirnov检验的阈值计算公式,在0.05的显著性水平上,Kolmogorov-Smirnov检验的阈值为:
1.36*SQRT((n1+n2)/(n1*n2))
=1.36*SQRT((66+114551)/(66*114551))
=0.16745
显然D=0.290939大于阈值0.16745,因此在0.05的显著性水平上,可以拒绝原假设而认为遗址的分布与坡度相关。