2.3 时间序列分析
系统中某一变量的观测值按时间顺序(时间间隔相同)排列成一个数值序列,展示研究对象在一定时期内的变动过程,从中寻找和分析事物的变化特征、发展趋势和规律。它是系统中某一变量受其他各种因素影响的总结果。通过处理预测目标本身的时间序列数据,获得事物随时间过程的演变特性与规律,进而预测事物的未来发展。它不研究事物之间相互依存的因果关系。许多经济、金融、商业等方面的数据都是时间序列数据,时间序列的预测和评估技术相对完善,其预测情景相对明确,尤其关注预测目标可用数据的数量和质量,即时间序列的长度和预测的频率。
2.3.1 时间序列分析简介
时间序列具有以下特征。
(1) 趋势性:某个变量随着时间进展或自变量变化,呈现一种比较缓慢而长期的持续上升、下降、停留的同性质变动趋向,但变动幅度可能不等。
(2) 周期性:某因素由于外部影响随着自然季节的交替出现高峰与低谷的规律。
(3) 随机性:个别为随机变动,整体呈统计规律。
(4) 综合性:实际变化情况一般是几种变动的叠加或组合。预测时一般设法过滤除去不规则变动,突出反映趋势性和周期性变动。
(5) 随机性:均匀分布、无规则分布,可能符合某统计分布。(用因变量的散点图和直方图及其包含的正态分布检验随机性,大多数服从正态分布。)
(6) 平稳性:样本序列的自相关函数在某一固定水平线附近摆动,即方差和数学期望稳定为常数。
认识时间序列所具有的变动特征,以便在系统预测时选择采用不同的方法。样本序列的自相关函数只是时间间隔的函数,与时间起点无关。其具有对称性,能反映平稳序列的周期性变化。特征识别利用自相关函数ACF:ρk=γk/γ0,其中γk是y t的k阶自协方差,且ρ0=1、-1<ρk<1。平稳过程的自相关系数和偏自相关系数都会以某种方式衰减趋近于0,前者测度当前序列与先前序列之间简单和常规的相关程度,后者是在控制其他先前序列的影响后,测度当前序列与某一先前序列之间的相关程度。
实际上,预测模型大都难以满足这些条件,现实的经济、金融、商业等序列都是非稳定的,但通过数据处理可以变换为平稳的。
时间序列可预测的类型如下。
(1) 点预测:确定唯一的最好预测数值,其给出了时间序列未来发展趋势的一个简单、直接的结果。但常产生一个非零的预测误差,其不确定程度为点预测值的置信区间。
(2) 区间预测:未来预测值的一个区间,即期望序列的实际值以某一概率落入该区间范围内。区间的长度传递了预测不确定性的程度,区间的中点为点预测值。
(3) 密度预测:序列未来预测值的一个完整的概率分布。根据密度预测,可建立任意置信水平的区间预测,但需要额外的假设和涉及复杂的计算方法。
无论是哪种模型形式,时间序列总是受自身历史数据序列变化的影响,因此需将历史数据序列作为一个新的时间序列变量。
2.3.2 时间序列分析操作
在主菜单栏中,单击Transform菜单,然后选择Create Time Series子菜单,即可得到如图2-18所示的Create Time Series对话框。
图2-18 Create Time Series对话框
在Function下拉列表框中选择变量转换的函数。
Difference(非季节差分)选项:计算时间序列连续值之间的非季节性差异。
Seasonal Differences(季节性差分)选项:计算时间序列跨距间隔恒定值之间的季节性差异,跨距根据定义的周期确定。
Prior moving average(领先移动平均)选项:计算先前的时间序列数值的平均值。
Centered moving average(中心移动平均)选项:计算围绕和包括当前值的时间序列数值的平均值。
Running medians(中位数)选项:计算围绕和包括当前值的时间序列的中位数。
Cumulative sum(累积和)选项:计算直到包括当前值的时间序列数值的累计总数。
Lag(滞后顺序)选项:根据指定的滞后顺序,计算在前观测量的值。
Lead(领先顺序)选项:根据指定的领先顺序,计算连续观测量的值。
Smoothing(平滑)选项:以混合数据平滑为基础,计算连续观测量的值。
以上各项主要用在生成差分变量、滞后变量、平移变量,并且还要关注差分、滞后、平移的次数,以便在建立模型、进行参数估计时,使方程达到一致。
在Order文本框中输入在前或在后的时间序列数值间隔的数目。在新变量New Variable(s)框中接受左边框移来的源变量。在 Name 文本框中定义新变量的名称,但必单击 Change 按钮方能成立。单击OK按钮运行系统,在原数据库中出现新变量列。
另外,若需产生周期性时间序列的日期型变量,则在主菜单栏中单击Data 菜单,然后选择Define Dates子菜单,打开如图2-19所示的Define Dates对话框。
图2-19 Define Dates对话框
在Cases Are列表框中选择定义日期变量的时间间隔,在First Case Is框中设定日期变量第一个观测量的值,单击OK按钮完成定义。采用最大似然估计或最小二乘估计等方法估计Φ、θ参数值,并进行显著性检验。