第二章 三江平原水资源时空分布研究
第一节 研究理论与方法
一、Mann Kendall非参数检验方法
Mann-Kendall非参数检验方法是世界气象组织推荐并广泛使用的非参数检验方法,它不需要样本遵从一定的分布,也不受少数异常值的干扰,且不需要作统计分析,计算简便,并且检测范围宽,认为干扰少,定量化程度高。因此,适用于水文、气象等非正态分布的数据[1-3]。
在M-K检验进行趋势分析时[4-5],原假设H0表示时间序列(x1,x2,…,xn)是数据样本独立同分布,不存在趋势;备择假设H1是双边检验;对于所有的i,j≤n,且i≠j,xi和xj的分布是不同的,检验的统计变量S计算如下式:,其中:
S为正态分布,均值为0,方差为
其中,t为任意给定结点的范围,当n>10时,Zc收敛于标准正态分布,并通过下式计算
在双边的趋势检验中,在给定的α置信水平上,若|Zc|≥Z1-α/2,拒绝原假设H0,即在α置信水平上,时间序列数据存在明显的上升或下降趋势。其中±Z1-α/2为标准正态分布的(1-α/2)分位数,α为检验的置信水平。其中,变化趋势的大小可用Kendall倾斜度β来表示,其计算公式如下:
其中,1<j<i<n。当β>0时,表示上升的趋势;β<0表示下降的趋势。
Zc为正,系列具有上升或增加趋势;Zc为负,系列具有下降或减少的趋势。若Zc的绝对值大于或等于1.28、1.64和2.32,分别表示通过了信度90%、95%和96%的显著性趋势检验。
当Mann-Kendall法用于时间序列突变检测时[6-7],通过构造一秩序列:
其中,当xi>xj(j=1,2,…,i)时,ri=1,否则ri=0。可见,秩序列Sk是第i时刻数值大于j时刻数值个数的累计数。
在时间序列随机独立的假定下,定义统计量:
UFi为标准正态分布,给定显著性水平α,若|UFi|>Uα/2,则表明序列存在明显的趋势变化。将时间序列x按逆序排列,再重复上述过程,同时使:
分析统计序列UFk和UBk,可进一步分析序列x的趋势变化,且可以明确突变发生的时间,并指出突变的区域。当UFk>0时,表明序列呈上升趋势;当UFk<0时表明呈下降趋势;当它们超过临界直线时,表明其上升或下降的趋势显著。若UF和UB这两条曲线出现交点,并且交点在临界线之间,则交点对应的时刻即为突变开始的时刻[7]。
二、小波分析
以小波函数系来表示或者逼近某一信号或函数即为小波分析的基本思想[8-9]。由此可知,具有震荡性、能够迅速衰减到零的一类函数即小波函数是小波分析的核心[10-11],即小波函数ψ(t)∈L2(R)且满足式(2-10):
若ψa,b(t)是由式(2-11)给出的子小波,则对于给定能量有限信号f(t)∈L2(R)的连续小波变换(Continue Wavelet Transform,CWT)为:
地学中观测到的时间序列数据大多是离散的,设函数f(kΔt)(k=1,2,…,N;Δt为取样间隔),则式(2-12)的离散小波变换形式为:
由式(2-12)或式(2-13)可知小波分析的基本原理即通过改变伸缩尺度a得到信号的低频高频信息,分析信号概貌或细节,实现对信号在不同时间尺度和空间局部特征的分析。
将小波系数的平方值在b域上积分,就可得到小波方差,即
小波方差随尺度a的变化过程,称为小波方差图。由式(2-14)可知,它能反映信号波动的能量随尺度a的分布[12-13]。
三、地统计学
地统计学是以区域化变量理论为基础,主要工具是变异函数,研究空间分布上同时具有随机性和结构性,即空间相关和依赖性的自然现象的科学[14-15]。从定义来看,地统计学主要包含3个方面:理论基础、研究工具、研究内容[16-17]。
1.理论基础是区域化变量理论
通常随空间位置的不同而表现出不同数量特征的变量称为区域化变量,其对应的现象称为区域化现象。区域化变量不同于普通的随机变量,依据符合某种概率分布而取值的变量称为普通随机变量,依据其在所在位置不同而取值的变量称为区域化随机变量。随机性和结构性是区域化变量两个最显著的特征。一方面,区域化变量作为随机函数,它是局部的、随机的、异常的;另一方面,区域化变量因为具有结构性,所以在空间上相邻位置的点具有一定的自相关性和依赖性。
2.研究工具是协方差函数和变异函数
可以将区域化变量的特征随机性和结构性均兼顾地描述出来的函数和模型,称为协方差函数和变异函数。它以区域化变量理论为基础,描述区域化变量,建立地统计学的两个最基本函数。
3.研究内容是克里金插值法
地统计学研究自然现象的空间分布规律。克里金插值法是地统计学的重要内容之一。克里金法的基础是变异函数理论及结构分析,实质是以区域化变量的原始数据及变异函数的结构特点为基础,对未被采样的位置的区域化变量的取值进行线性无偏最优估计[17]。
四、时态GIS
世界是动态的,人们都生活在特定的空间和时间当中,并在其中从事各种社会活动。地壳变化,河流湖泊干涸;城市拓展,人口变化;生物种群迁徙等,这些变化不论是否具有周期性,是否连续变化,都和时间密切相关。时态GIS由于可以表示时空过程而得到越来越多的关注[18]。
在时态GIS中,定义和表示时间特性是最基本的问题[19-20],以下讨论几个基本概念:
(1)时间。时态GIS中通常将时间分成事务时间和有效时间两种基本类型。有效时间指事件在现实中发生的时间称为有效时间,事件被记录在数据库中的时间称为事务时间。这两类时间在应用中是相关的。由于事件常是在发生后才被记录在库中,所以有效时间一般要早于事务时间;若两者相等,就可以认为现实事件就是数据库事务,而有效时间亦可能晚于事务时间,则意味着系统可包括未来事件的信息,这在一些应用中是很有意义的。
(2)时间粒度。由于计算机具有数字化的特点,所以时间用离散形式来表示。离散化程度的度量是时间粒度,当在对实体状态采样时,固定时间粒度越小越精确,但粒度太小会导致工作量增加。实际实现时,往往折中权衡两者。当系统状态改变,记录信息的时间粒度也是变化的,或者说时间粒度是由不同应用的需要来确定的。理想的时态GIS既可以支持用户选择各类粒度,又可以提供不同粒度间简单快捷的转换机制。
(3)时间戳。对事件属性之一的时间通常有两种处理方法:一种是仅用一个时间戳来标记事件发生的时间。优点是节省内存、免去冗杂数据和空值,缺点是在查询相关时间区段时系统应答时间很长。另一种相对较好,每个状态对应一个时间戳,用since、until来标记用以表明状态的一段区间。这种机制的优点是时间区段查询快捷,缺点是时间戳有时出现空值或者伪值使操作计算复杂化。
(4)应答时间。GIS用于响应用户查询和分析所需的时间称为应答时间。由于GIS处理的时空属性数据庞大,就会在查询效率与尽量经济地使用有限存储空间实现时空支持之间产生矛盾。时态GIS只能在两者间权衡,既要提高时空查询查询效率,又要尽可能控制数据冗余[21-22]。
五、灰色模型(GM)
灰色系统理论的研究对象是部分信息已知,部分信息未知的“小样本”“贫信息”不确定性系统,它通过对“部分”已知信息的生成、开发实现对现实世界的确切描述和认识。灰色系统理论经过30多年的发展,已基本建立起一门新兴学科的结构体系。其主要内容包括以灰色朦胧集为基础的理论体系,以灰色关联空间为依托的分析体系,以灰色序列生成为基础的方法体系,以灰色模型(GM)为核心的模型体系,以系统分析、评估、建模、预测、决策、控制、优化为主体的技术体系[23-26]。
灰色预测是基于GM模型做出的定量预测,按照其功能和特征可分成数列预测、区间预测、灾变预测、季节突变预测、波形预测和系统预测等几种类型。GM(1,1)模型是灰色系统理论应用中的重要内容,在许多领域的实际应用中都取得了很大的成功[27-28]。
采用灰色GM(1,1)用于数据处理的灰色模型与方法,不是找统计规律,也不是找概率分布,而是把随机变量作为灰色量处理,用数据处理的方法寻找数据间的规律,它弥补了数据处理方法的不足,为数据处理提供了新的科学方法。