MATLAB时间序列方法与实践
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.2 时间序列的基本概念

1.2.1 时间序列的定义

所谓时间序列就是一组按照一定的时间间隔排列的一组数据,其时间间隔可以是任意的时间单位,如小时、日、周、月等。这一组数据可以表示各种各样的含义,如经济领域中每年的产值、国民收入、商品在市场上的销量、股票数据的变化情况等;社会领域中某一地区的人口数、医院患者人数、铁路客流量等;自然领域的太阳黑子数、月降水量、河流流量等,这些数据都形成了一个时间序列。人们希望通过对这些时间序列的分析,从中发现和揭示现象的发展和变化规律,或从动态的角度描述某一现象和其他现象之间的内在数量关系及其变化规律,从而尽可能多地从中提取出所需要的准确信息,并将这些知识和信息用于预测,以掌握和控制未来行为。人们研究时间序列,通常也是希望根据历史数据预测未来的数据。对于时间序列的预测,由于很难确定它与其他因变量的关系,或收集因变量的数据非常困难,这时就不能采用回归分析方法进行预测,而是需要使用时间序列分析方法来进行预测。

采用时间序列分析进行预测时需要用到一系列的模型,这种模型统称为时间序列模型。在使用这种时间序列模型时,总是假定某一种数据变化模式或某一种组合模式会重复发生。因此首先需要识别出这种模式,然后采用外推的方式进行预测。采用时间序列模型进行分析时,显然其关键在于辨识数据的变化模式(样式);同时,决策者所采取的行动对这个时间序列的影响很小,因此这种方法主要用来对一些环境因素,或不受决策者控制的因素进行预测,如宏观经济情况、就业水平、某些产品的需求量等数据。

这种方法的主要优点是数据很容易得到,而且容易被决策者理解,计算相对简单。当然对于高级时间序列分析法,其计算也是非常复杂的。此外,时间序列分析法常常用于中短期预测,因为在相对短的时间内,数据变化的模式不会特别显著。

时间序列分析的主要用途有:①系统描述。根据对系统进行观测,得到时间序列数据,用曲线拟合方法对系统进行客观的描述。②系统分析。当观测值取自两个以上变量时,可用一个时间序列中的变化去说明另一个时间序列中的变化,从而深入了解给定时间序列产生的机理。③预测未来。一般用ARMA模型拟合时间序列,预测该时间序列的未来值。④决策和控制。根据时间序列模型可调整输入变量,使系统发展过程保持在目标值上,即预测到要偏离目标时,便可进行必要的控制。

1.2.2 时间序列的组成因素

时间序列的变化受许多因素的影响,有些起着长期的、决定性的作用,使其呈现出某种趋势和一定的规律性;有些则起着短期的、非决定性的作用,使其呈现出某种不规则性。在分析时间序列的变动规律时,事实上不可能将每个影响因素都一一划分开来,分别去作精确分析,但可以将众多影响因素,按照对现象变化影响的类型,划分成若干时间序列的构成因素,然后对这几类构成要素分别进行分析,以揭示时间序列的变动规律性。影响时间序列的构成因素可归纳为以下4种。

(1)趋势性(Trend),指现象随时间推移朝着一定方向呈现出持续渐进的上升、下降,平稳的变化或移动。这一变化通常是许多长期因素的结果。

(2)周期性(Cyclic),指时间序列表现为循环于趋势线上方和下方的点序列,并持续一段时间以上的有规则变动。这种因素具有周期性的变动,比如高速通货膨胀时期后面紧接的温和通货膨胀时期,将会使许多时间序列表现为交替地出现于一条总体递增趋势线的上下方。

(3)季节性变化(Seasonal Variation),指现象受季节性影响,按一固定周期呈现出的周期波动变化。尽管通常将一个时间序列中的季节变化认为是以1年为期的,但是季节因素还可以被用于表示时间长度小于1年的有规则重复形态。比如,每日交通量数据表现出为期1天的“季节性”变化,即高峰期到达高峰水平,而一天的其他时期车流量较小,从午夜到次日清晨最小。

(4)不规则变化(Irregular Movement),指现象受偶然因素的影响而呈现出的不规则波动。这种因素包括实际时间序列值与考虑了趋势性、周期性、季节性变动的估计值之间的偏差,它用于解释时间序列的随机变动。不规则因素是由短期的未被预测到的,以及不被重复发现的那些影响时间序列的因素引起的。

时间序列一般是上述几种变化形式的叠加或组合,如图1-1所示。

图1-1 一种时间序列的叠加形式

1.2.3 时间序列的分类

根据不同的标准,时间序列有不同的分类方法,常用的标准及分类方法如下。

(1)按所研究的对象的多少来分,有一元时间序列和多元时间序列,如某种商品的销售量数列,即为一元时间序列;如果所研究对象不仅仅是一个数列,而是多个变量,如按年、月顺序排序的气温、气压、雨量数据等,每个时刻对应着多个变量,则这种序列为多元时间序列。

(2)按时间的连续性,可将时间序列分为离散时间序列和连续时间序列两种。如果某一序列中的每一个序列值所对应的时间参数为间断点,则该序列就是一个离散时间序列;如果某一序列中的每个序列值所对应的时间参数为连续函数,则该序列就是一个连续时间序列。

(3)按序列的统计特性,分为平稳时间序列和非平稳时间序列两类。所谓时间序列的平稳性,是指时间序列的统计规律不会随着时间的推移而发生变化。平稳序列的时序图直观上应该显示出该序列始终在一个常数值附近随机波动,而且波动的范围有界、无明显趋势及无周期特征。相对的,时间序列的非平稳性,是指时间序列的统计规律随着时间的推移而发生变化。

(4)按序列的分布规律来分,有高斯型(Guassian)和非高斯型(Non-Guassian)时间序列两类。

1.2.4 时间序列分析方法

时间序列分析是一种被广泛应用的数据分析方法,它研究的是代表某一现象的一串随时间变化而又相互关联的数字系列(动态数据),从而描述和探索该现象随时间发展、变化的规律性。时间序列分析利用的手段可以通过直观简便的数据图法、指标法、模型法等来分析。而模型法相对来说更具体也更深入,能更本质地了解数据的内在结构和复杂特征,以达到控制与预测的目的。总的来说,时间序列分析方法包括如下两类。

(1)确定性时序分析:指暂时过滤掉随机性因素(如季节因素、趋势变动)进行确定性分析的方法,其基本思想是用一个确定的时间函数y=f(t)来拟合时间序列,不同的变化采取不同的函数形式来描述,不同变化的叠加采用不同的函数叠加来描述。具体可分为趋势预测法(最小二乘法)、平滑预测法、分解分析法等。

(2)随机性时序分析:其基本思想是通过分析不同时刻变量之间的相关关系,揭示其相关结构,利用这种相关结构建立自回归、滑动平均、自回归滑动平均混合模型来对时间序列进行预测。

无论采用哪种方法,时间序列的一般的分析流程基本固定,如图1-2所示。

图1-2 时间序列分析流程