3.2 R/S分析与长期持续性
Hurst效应实质上说明了时间序列中,变量内在的相关性存在长期持续的行为。Hurst提出了一个新的统计量H来识别这一系统性的非随机特征,即Hurst指数。这个指数和系统的分形维完全相关。这种统计方法应用范围很广,而且没有什么基本假设。如果时间序列存在非周期循环,使用R/S分析可以找出平均的非周期循环和由于长期记忆效应产生的持久性。传统的统计分析研究方法在研究各种自然现象抽象出的时间序列时,通常都忽略事件之间的长程相关性,认为事件只在短程范围内具有“记忆性”,而R/S经验关系式的存在却说明事件的发生具有长程相关性,后面事件的发生将受到前面事件的影响。它改变研究的时间尺度大小,研究其统计特性变化的规律,分析时间序列的长程相关性。这样,人们就根据整体和部分之间规律的相似性,将小时间尺度范围得到的规律应用于大的时间尺度范围,或将大时间尺度范围得到的规律应用于小的时间尺度范围,从而也可以用于预测性的研究。
R/S方法的具体算法为[22,26~28]:
首先将研究的时间序列{xi,i=1,2,…,M}分为A个不重叠的、连续的子序列Ia(a=1,2,…,A),并计算每个子序列的平均值为:
(3-1)
式中 ea——每个子序列的平均值;
xk,a——子序列Ia中的每个数据;
a——所划分的某个子序列的编号,其取值为(a=1,2,…,A);
t——每个子序列的长度,其取值为(2≤t≤M/2);
M——整个研究序列的总长度;
k——某个子序列中所含数据的编号,其取值为(k=1,2,…,t)。
从而得到各子序列的累积离差:
(3-2)
式中 yk,a——研究序列中各子序列的累积离差。
进一步,通过累积离差的最大值和最小值之差,计算出极差:
(3-3)
式中 Ra——研究序列的极差。
其中,极差R依赖于时间序列的长度t,并随t的增加而增加。为了研究数据中的统计规律性,Hurst使用了一个无量纲的参数R/S,其中S表达式为:
(3-4)
式中 S——研究序列的标准偏差。
当时间尺度t发生改变时,R/S也会随之而改变。Hurst发现对于许多自然界的时间序列,如河湖水位、降雨量、温度、气压、树木年轮、径流量等,R/S都满足下列关系:
(3-5)
式中 H——Hurst指数,一般处于0~1之间;
b——拟合参数。
如Hurst对尼罗河进行长期的水文观测,发现尼罗河流量的Hurst指数是0.72,具有正的长时间相关效应。通过数值试验,利用计算机产生随机时间序列,计算它的Hurst指数,其值接近0.5。如果把原始尼罗河流量时间序列随机打乱,再进行R/S分析,得到的Hurst指数指数值也接近0.5。这说明没有时间相关性的随机时间序列的Hurst指数为0.5,R/S分析是分析时间序列长期相关性的有效方法。
总体来说,当H>0.5时,数据之间满足正相关性或长期持续性,即过去一段时间的增长(减少)趋势将意味着未来相同时间间隔内有一个增长(减少)趋势,H值越接近1,持续性就越强;H=0.5表示研究的时间序列是白噪声序列,即序列中各个数据都是独立的,互不关联的,完全随机的,前一段时间的变化趋势不会对后面产生影响;H<0.5表明数据之间满足负相关性或反持续性,即过去增长(减小)趋势将意味着未来的减小(增长)趋势,H越接近0,反持续性就越强。