实验3-2 回归方程的视图和过程
素材文件:sample/Example/table 3-1.wfl
多媒体教学文件:视频/实验3-2.mp4
实验基本原理
本实验在方程估计结果的基础上,对回归方程进行视图操作和过程操作,包括显示回归方程,显示因变量的实际值、拟合值、残差值,以及对模型进行预测。其中,模型的拟合值和预测值(在线性回归模型中只能是静态预测)是根据下面的公式得到的:
其中,表示模型的拟合值和静态预测值,是模型的估计系数。模型的残差等于因变量的实际值与拟合值之差,即。
实验目的与要求
1.实验目的
(1)通过本次实验,掌握方程窗口工具栏中的视图操作和过程操作。
(2)熟悉回归模型的预测操作,理解预测的用途。
(3)掌握评价模型预测精度的方法和评价依据。
2.实验要求
(1)使用方程窗口工具栏中的View | Representations命令显示回归方程的各种形式,熟悉方程的3种显示形式。
(2)使用View | Actual,Fitted,Residual命令以各种形式(表格形式和图形形式)显示因变量的实际值、拟合值以及残差值。
(3)熟练给出回归模型中因变量的预测值,理解动态预测和静态预测之间的区别。
(4)熟悉模型预测精度评价指标,对模型的预测效果进行评价和说明。
实验内容及数据来源
使用方程对象窗口工具栏中的View功能键和Proc功能键对实验3-1得到的方程估计结果进行视图操作和过程操作,包括以3种形式显示了实验3-1所得到的方程估计结果,以数据表格和图形的形式显示因变量的实际值、拟合值和残差值,单独显示标准化残差的折线图以及对模型进行预测。
实验操作指导
1.回归方程显示
回归方程各种形式显示的主要过程如下:
01 单击如图3.5所示的回归方程窗口工具栏中的View功能键,弹出如图3.6所示的菜单。
下面对该菜单中的命令项做简要说明。
- Representations:以3种形式显示回归方程,包括EViews命令(Estimation Command)形式、带系数符号的代数方程(Estimation Equation)形式和有系数估计值的方程(Substituted Coefficients)形式。
- Estimation Output:用于显示方程的估计结果,即图3.5所示的显示形式。
- Actual,Fitted,Residual:该命令也有子菜单,这些菜单项以数据表格和图形的形式显示因变量的实际值、拟合值以及残差。其中,Actual,Fitted,Residual Table以数据表格的形式来显示这些值,并且在右侧显示残差的折线图;Actual,Fitted,Residual Graph显示因变量的实际值、拟合值以及残差的折线图;Residual Graph只绘制残差序列的折线图;Standardized Residual Graph只绘制经过标准化的残差的折线图。
- ARMA Structure:用于对ARMA模型进行结构分析。
- Gradients and Derivatives:用于描述目标函数的梯度和回归函数的导数等计算信息,有兴趣的读者可以参考有关梯度和导数图书。
- Covariance Matrix:以数据表格的形式显示系数估计值的方差-协方差矩阵。
- Coefficient Diagnostics、Residual Diagnostics和Stability Diagnostics:可以分别导出方程设定和诊断检验的下一级菜单,包括回归方程的各种系数检验、残差序列检验和模型稳定性检验等。
图3.6 方程对象View功能键菜单
02 选择窗口工具栏中的View | Representations命令,会得到如图3.7所示的输出结果。
图3.7 回归方程的3种显示形式
图3.7从上至下分为3部分,分别是消费函数估计方程的3种显示形式,即估计方程的命令形式、回归方程的代数形式和带有系数估计值的方程形式。
2.Actual、Fitted和Residual命令项操作
选择图3.5所示的回归方程窗口工具栏中的View|Actual,Fitted,Residual|Actual,Fitted,Residual Table命令,将以表格的形式显示因变量的实际值、拟合值和残差值,如图3.8所示。
在图3.8中,Actual列显示因变量的实际值(cs序列的样本观测值);Fitted列显示模型拟合值,即=-30.2367+0.9263inc;Residual列显示残差,即实际值与拟合值的差。Residual Plot列显示残差序列图,其中虚线表示置信带(正负一个标准误差范围)。
选择图3.5所示的回归方程窗口工具栏中的View|Actual,Fitted,Residual|Actual,Fitted,Residual Graph命令,将显示因变量的实际值、拟合值和残差的折线图,如图3.9所示。
图3.8 实际值、拟合值和残差值的表格显示
图3.9 实际值、拟合值和残差值的折线图
从图3.9中可以看到,从1960Q1至1980Q1时间段模型拟合效果很好,所有的残差都位于置信带区域内,但有3个时间段残差值比较大,位于置信带区域之外:1980Q1至1983Q1、1983Q4至1986Q2以及1992Q4至1995Q3,其中Q指季度。
选择图3.5所示的回归方程窗口工具栏中的View|Actual,Fitted,Residual|Standardized Residual Graph命令,EViews将只绘制经过标准化的残差的折线图,如图3.10所示。标准化残差是指残差除以其标准差,如果回归模型中的随机误差项满足基本假设,则标准化残差应该服从标准正态分布。
图3.10 标准化残差的折线图
3.模型预测
预测是建立模型的目的之一,而且预测的效果可以用于评价模型,对于已经建立的模型,可以直接预测各样本点的拟合值。对实验3-1得到的回归方程进行预测的主要过程如下:
01 在图3.5所示的方程对象窗口工具栏中单击Proc功能键,会弹出如图3.11所示的菜单。
菜单命令项说明如下:
图3.11 方程对象Proc功能键菜单
- Specify/Estimate…:用于调出方程设定对话框以修改模型形式,改变模型估计方法或样本区间,与方程对象窗口工具栏中Estimate功能键的作用相同。
- Forecast…:用于进行方程预测。
- Made Residual Series…:用于在工作文件中以序列形式保存残差序列,根据估计方法的不同,可以选择普通残差(Ordinary)、标准化残差(Standardized)和广义残差(Generalized)3种不同的残差,对于OLS估计只能保存普通残差。
- Make Regressor Group:用于生成包含回归方程中所使用的所有变量的组对象。
- Make Gradient Group和Make Derivative Group:用于生成目标函数的梯度和回归函数的导数。
- Make Model:用于生成与被估计方程有关的模型。
- Update Coefs from Equation:用于把方程的系数估计值置于系数向量中。
- Add-ins:用于调用Eviews加载项。
02 选择Proc | Forecast…选项,屏幕会弹出如图3.12所示的对话框。
图3.12 模型预测对话框
Series names(序列名)选项组有两个编辑框。Forecast name编辑框用于输入所要预测的因变量名,默认的名字是因变量后面加“f”,例如图3.12中的csf。用户也可以更改为其他有效的序列名,但这个序列名不能与回归方程中的因变量名相同,否则预测过程会覆盖已给定的序列值。如果用户需要保存预测误差的标准差,可以在S.E.编辑框中输入预测误差标准差序列名。
Method选项组用于选择模型预测的方法,可供选择的方法有动态预测(Dynamic)和静态预测(Static)。动态预测是指从预测样本的第一期开始计算多步预测;而静态预测是利用滞后因变量的实际值而不是预测值计算预测结果。对于OLS只能使用静态预测,动态预测常用于时间序列模型中。这里的Structural选项用于选择预测结构。如果回归方程中有ARMA项,若用户选择了Structural项,无论是使用动态预测还是使用静态预测方法,EViews都会对残差进行预测;否则,所有预测方法都将忽略残差项而只对模型的结构部分(因变量)进行预测。
Forecast sample选项用于指定模型预测的样本,默认情况下,EViews将预测样本设定为工作文件的样本区间。如果指定的样本超出了估计方程所使用的样本区间,则EViews将进行样本外预测。需要注意的是,进行样本外预测时需要提供样本外预测期间的解释变量值。
Output选项组用于选择预测的输出结果,可供选择的预测结果包括Forecast graph(预测图)和Forecast evaluation(预测评价指标)。
03 本实验中,对图3.12所示对话框中的各项不做任何更改,即使用EViews的默认设置,单击OK按钮。
图3.13 消费函数模型预测结果
执行模型预测操作后,EViews生成一个新的序列csf,并得到如图3.13所示的预测图。图3.13中的实线表示因变量的预测值,实线周围上下两条虚线给出的是置信水平为95%的置信带区域。图3.13右边的方框中显示一系列对模型预测的评价指标。从上至下,这些评价指标依次为:Root Mean Squared Error(均方根误差,简记为RMSE)、Mean Absolute Error(平均绝对误差,简记为MAE)、Mean Abs.Percent Error(平均绝对百分比误差,简记为MAPE)、Theil Inequality Coefficient(希尔不等系数,简记为Theil IC)、Bias Proportion(偏差率,简记为BP)、Variance Proportion(方差率,简记为VP)、Covariance Proportion(协变率,简记为CP)。对于这些统计指标的定义和计算公式,有兴趣的读者可以参考有关的计量经济学和统计学图书。
RMSE和MAE两个评价指标取决于因变量的绝对数值,通常更直接地考察相对指标MAPE,一般认为如果MAPE值小于10,则说明模型预测精度较高。Theil IC总是介于0和1之间,其数值越小,说明拟合值和真实值之间的差异越小,模型预测精度越高。BP、VP和CP是3个相互联系的评价指标,它们的取值范围都在0和1之间,并且BP+VP+CP=1。BP反映了预测值均值和实际值之间的差异,VP反映了预测值标准差和实际值标准差之间的差异,CP则用于衡量剩余的误差。当CP值较大,而BP和VP值较小时,说明模型的预测比较理想。
图3.13的预测结果显示,MAPE=2.2914,Theil IC=0.007200,CP=0.9999,这些预测评价指标说明实验3-1得到的消费函数回归模型的预测精度非常高,预测值非常接近真实值。