基本的回归模型建立 一、多重共线性检验 1.建立普通的回归模型。 记该地区第年的投资额为, 国民生产总值为,物价指数为(以第十六年的物价指数为基准,基准值为1),=1,2,…,n(=32)。 从表1中可以看出,随着国民生产总值的增加,投资额增大,而且两者有很强的线性关系,物价指数与投资额的关系也类似,因此可建立多元线性回归模型: (1) 模型(1)中除了国民生产总值和物价指数外,影响的其他因素的作用都包含在随机误差项内,这里的假设(对)相互 ___,且服从均值为零的正态分布=1,2,…,n(=32)。 (表2 ) 利用Eviews 对参数作OLS估计,输出回归结果: Dependent Variable: Y Method: Least Squares Date: 06/07/04 Time: 22:32 Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-Statistic Prob. C 134.7327 44.65210 3.017387 0.0053 X1 0.3335 0.059365 5.618509 0.0000 X2 -339.0047 113.1687 -2.995569 0.0056 R-squared 0.978445 Mean dependent var 232.7875 Adjusted R-squared 0.976958 S.D. dependent var 123.2718 S.E. of regression 18.71213 Akaike info criterion 8.785281 Sum squared resid 101.17 Schwarz criterion 8.922694 Log likelihood -137.55 F-statistic 658.18 Durbin-Watson stat 1.216500 Prob(F-statistic) 0.000000 将上述回归结果如下: 参数估计值 将参数估计值代入(1)得到 (2) (3.0174)
(5.6185) (-2.9956) 2.分析。 由 (显著性水平=0.05),表明模型从整体上看投资额和解释变量间线性关系显著。
3.检验 (表3) 1.000000 0.997349 0.997349 1.000000 由表3可以看出,解释变量之间存在高度线性相关。
4.修正(逐步回归法) (1)用OLS方法逐一求出对各个解释变量的回归。 A.经分析在两个一元回归模型中投资额对国民生产总值的线性关系强,拟合程度较好,即 (0.3360) (32.1384) B.将解释变量代入上式,得 (3.0174) (5.6185) (-2.9956)
(2)由上式中可知,,截距项对的'影响都比较显著,虽然和 间存在共线性但它们之间的共线性对模型的影响不是很显著,对和的回归模型已为最优,所以保留原模型中的所有变量,得如下模型: 异方差检验: 用OLS估计法估计参数(见表2)。 异方差检验: (1)图示法。 E2为残差的平方,由GNER命令生成。(见图1,图2)
(图1)
(图2)结论:由上图可以看出,X1与E2;X2与E2关系并不十分密切,可以初步判断该模型可能不存在异方差。
(2)Goldfeld-Quandt检验。 将各数据按解释变量的大小顺序排列,然后将排列在中间的8个数据删除掉,余下的数据分为两个部分。 在Sample菜单里,将时间定义为1—12,然后用OLS方法求得下列结果:
(3.0797) (5.2902) (-2. ___77) 由以上回归可以看出为147.2631 再在Sample菜单里将将时间定义为21-32,然后用OLS方法求得下列结果:
异方差修正 模型对数变换 对于变量和,分别用和取代,则有 (3) 并对其使用OLS得到以下结果: (表4) Dependent Variable: LY Method: Least Squares Date: 06/08/04 Time: 15:25 Sample: 1 32 Included observations: 32 Variable Coefficient Std. Error t-Statistic Prob. LX1 1.571511 0.244229 6.434575 0.0000 LX2 -0.888841 0.378298 -2.349579 0.0258 C -5.859048 1.7147 ___ -3.416775 0.0019 R-squared 0.984995 Mean dependent var 5.316077 Adjusted R-squared 0.983960 S.D. dependent var 0.526034 S.E. of regression 0.066621 Akaike info criterion -2.490531 Sum squared resid 0.128713 Schwarz criterion -2.353118 Log likelihood 42.84850 F-statistic
951.84 Durbin-Watson stat 0.934445 Prob(F-statistic) 0.000000
可以知道通过对数变换后,数值之间的异方差大大的变小,又由检验结果的拟合度可以知道,该模型拟合效果很好。
三、自相关检验: 1.用OLS估计方法求模型(3)的参数估计 (3) 从表4可以得到以下估计值
从回归结果看,基本模型(3)的拟合度非常之高,应该是很满意了。但是,这个模型并没有考虑到我们的数据是一个时间序列。实际上,在对时间序列数据作回归分析时,模型的随机误差项有可能存在相关性,违背了模型关于(对时间t)相互 ___的基本假设。如在投资额模型中,国民生产总值和物价指数之外的因素(比如等因素)对投资额的影响包含在随机误差项中,如果它的影响成为的主要部分,则由于等因素的连续性,它们对投资额的影响也有时间上的延续,即随即误差项可能会出现(自)相关性。
2.自相关性的诊断与模型的改进 (1)图示法。 残差可以作为随即误差项的估计值,运用Eviews可以直接得到模型(2)的残差,同时画出了 的散点图,能够从直观上判断的自相关性。(见图3)
图3 的散点图 从图3中可以看出残差呈线性自回归,表明随即误差项存在自相关。
(2)DW检验。 根据表4估计结果,由DW=0.9344,给定显著性水平,查Durbin-Watson表,n=32,k’(解释变量个数)=2,得下限临界值,上限临界值,因为DW统计量为0.9344<。根据判定区域知,这时随机误差项存在正的自相关。
相关的修正。 广义差分法。 由DW=0.9344,根据,计算出 GENR DY=LY-0.5328*LY(-1) GENR DX1=LX1-0.5328*LX1(-1) GENR DX2=LX2-0.5328*LX2(-1) (表5) Dependent Variable: DY Method: Least Squares Date: 06/08/04 Time: 18:57 Sample(adjusted): 2 32 Included observations: 31 after adjusting endpoints Variable Coefficient Std. Error t-Statistic Prob. C -3.602601 1. ___13 -3.199715 0.0034 DX1 1.834636 0.342573 5.3560 0.0000 DX2 -1.299823 0.509904 -2.9152 0.0166 R-squared 0.948592 Mean dependent var 2.522311 Adjusted R-squared 0.944920 S.D. dependent var 0.242080 S.E. of regression 0.056814 Akaike info criterion -2.806297 Sum squared resid 0.090380 Schwarz criterion -2.667524 Log likelihood 46.49760 F-statistic 258.3306 Durbin-Watson stat 1.665688 Prob(F-statistic) 0.000000
然后再用OLS方法估计其参数,结果为: (4) (-3.1997) (5.3555) (-2.92)
这是我们发现经用广义差分法后,DW值有明显的提高,DW=1.6657与上述的相比,已经不存在自相关。
模型的分析 我们进行了一系列检验和修正后的最终结果如下: (4) (-3.1997) (5.3555) (-2.92)
从模型中可看出: DX2不符合经济意义的检验(参数的大小及符号)。因为从经济意义上讲,投资额应随国民生产总值的增加而增加,随物价指数的增加而增加,即DX2的系数应为正值。 由上述分析可知,我们的模型并不成功。
总结: 综上所述,对带有滞后性的经济规律的时间序列数据,我们采用时间序列数据拟合的模型不能成功的反映投资额与各影响因素间的数量关系,是一个失败的模型。我们做了仔细分析,认为可能主要是出于以下几种原因: (1)由于我们引入的时间序列数据带有滞后性,从而带来多重共线性问题。在修正多重共线性当中,我们采用了逐步回归法,也即剔除变量法,但是因为我们的投资模型只有两个解释变量,修正多重共线性会使得我们的解释变量被大部
分剔除,因而导致我们的修正无效。 (2)我们在模型中所做的假定不合理。在投资额模型中,国民生产总值和物价指数之外的因素(比如等因素)对投资额的影响包含在随机误差项中。然而在实体经济中,很多变量对于投资额都有影响,不可能全都包括在随机误差项中,而这些重要变量在我们的模型中被忽略掉了。可能正是由于我们对这些重要因素所不得不作出的忽略,导致了模型的失败。 (3)由于我国的统计数据含有一定的水分,而导致了我们赖以进行参数估计的数字基础不具备可靠性,可能也是重要原因之一。
模板,内容仅供参考
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务