3.5 多重分形计盒维数
时间序列多重分形计盒维数一般是通过计算机用盒维数法求出不均匀分布物理量的概率分布,再借助统计物理量的有关公式进行数值求解。具体方法为[23,35]:
首先,我们对某一污染物的污染浓度进行归一化处理,用Ci表示,
(3-13)
式中 i——某一时间点,i=1,2,…,N;
Ii——时间为i时所对应的该污染物的污染浓度;
Ci——时间为i时所对应的该污染物浓度的归一化指数。
此时生成的新的时间序列为{Ci,i=1,2,…,N},N为时间序列的长度。
其次,用时间分辨率ε将归一化后的时间序列Ci分成许多不重叠的时间间隔。各个时间间隔中所有归一化的污染浓度之和用概率函数Pj(ε)进行表征。
多重分形系统的配分函数χ(q,ε)为Pj(ε)的q阶矩
(3-14)
式中 ε——时间分辨率;
q——矩的阶数;
n——某一时间分辨率ε下时间序列Ci分成的时间间隔总数;
j——时间间隔数目的编号,其取值范围为j=1,2,…,n;
——各个时间间隔中所有归一化的污染浓度之和;
χ(q,ε)——多重分形配分函数。
若研究的时间序列具有多重分形特征,则在某一无标度区间内满足如下的幂律关系
(3-15)
式中 τ(q)——q阶矩的Renyi指数。
τ(q)可通过对lnχ(q,ε)~lnε双对数曲线中线性区间的点进行最小二乘法回归拟合来估算。若τ(q)与q不呈线性关系,而呈现凸函数关系,则研究的数据集具有多重分形特征。
通过统计物理中的勒让德变换,我们可以从τ(q)中计算多重分形谱f(α)。其计算公式如下:
(3-16)
f(α)=qα(q)-τ(q) (3-17)
式中 α(q)——q阶矩的奇异性指数;
f(α)——多重分形谱函数。
多重分形谱中α~f(α)曲线通常是一个单峰函数;对于单一分形,它变成二维空间中的一个点。
为了说明多重分形的物理意义,研究中采用了多重分形谱f(α)中的三个重要参数(B,Δα和Δf)。它们可以总体上反映出f(α)曲线的总体特征,并具有明确的物理意义[36~40]。这为我们理解所研究的数据集的多重分形特征提供了重要的定量信息,依次阐述如下。
(1)Δα
Δα反映了在标度不变的情况下,整个分形结构上概率测度分布不均匀性的程度和过程的复杂性,刻画了数据集的波动程度。Δα越大,归一化指数概率测度分布越不均匀,数据波动越剧烈。Δα=0则对应完全均匀分布。
(3-18)
式中 αmax——某一时间分辨率ε下奇异指数的最大值;
αmin——某一时间分辨率ε下奇异指数的最小值;
Pmax——浓度波动的最大概率子集;
Pmin——浓度波动的最小概率子集。
(2)Δf
Δf主要体现了在标度不变的情况下,归一化指数处于波峰(最高点)、波谷(最低点)位置数目的比例。若Δf<0,表示指数更多地处于波谷;反之亦然。Nαmax和Nαmin分别代表了奇异指数最大值和最小值的数量。
(3-19)
式中 Nαmax——奇异指数最大值的数量;
Nαmin——奇异指数最小值的数量;
f(αmin)——最大概率事件的数量;
f(αmax)——最小概率事件的数量。
(3)B
参数B可由以下方程来拟合多重分形谱的α~f(α)曲线而得到,
(3-20)
式中 α0——函数f(α)取得最大值处的α的取值;
A,B,C——代表不同的拟合参数。
参数B代表了曲线的不对称性程度。若B<0,则曲线形状右倾,此时相对较高的分形指数占主导地位,归一化指数较大的事件占优,其对应的数据集结构更“粗糙”;反之亦然。