转载请联系
计量经济学相关问题
1
计量经济学是分析啥的?包含些什么内容?
计量经济学的主要⽤途或⽬的主要有两个⽅⾯: 1、理论检验。 2、预测应⽤。研究对象:
计量经济学的两⼤研究对象:横截⾯数据(Cross-sectional Data)和时间序列数据(Time-series Data)。前者旨在归纳不同经济⾏为者是否具有相似的⾏为关联性,以模型参数估计结果显现相关性;后者重点在分析同⼀经济⾏为者不同时间的资料,以展现研究对象的动态⾏为。
新兴计量经济学研究开始切⼊同时具有横截⾯及时间序列的资料,换⾔之,每个横截⾯都同时具有时间序列的观测值,这种资料称为追踪资料 (Panel data,或称⾯板资料分析)。追踪资料研究多个不同经济体动态⾏为之差异,可以获得较单纯横截⾯或时间序列分析更丰富的实证结论。
涉及到的相关学科:
计量经济学是结合经济理论与数理统计,并以实际经济数据作定量分析的⼀门学科。计量经济学以古典回归分析⽅法为出发点。依据数据形态分为:横截⾯数据回归分析、时间序列分析、⾯板数据分析等。依据模型假设的强弱分为:参量计量经济学、⾮参量计量经济学、半参量计量经济学等。常运⽤的软件:EViews、Gretl、MATLAB 、Stata、R、SAS、SPSS等……2
什么叫做伪回归
若是所建⽴的回归模型在经济意义上没有因果关系,那么这个就是伪回归,例如路边⼩树年增长率和国民经济年增长率之间存在很⼤的相关系数,但是建⽴的模型却是伪回归。如果你直接⽤数据回归,那肯定存在正相关,⽽其实这个是没有意义的回归。3
在什么情况下,应将变量取对数再进⾏回归?
为避免伪回归,消除异⽅差,在不改变时间序列的性质及相关性的前提下,为获得平稳数据,通常会对时间序列取⾃然对数。对数据进⾏平稳性检验是研究中不可或缺的步骤,因为时间序列分析法只适⽤于平稳的数据。那么什么情况下会对数据取对数呢?
第⼀,关于对数的问题,若是⾃⼰选取的变量数据,⾥⾯有部分⼩于0,或者负数,需要重新考量下,看是否数据或者其他问题,此时肯定是没法取对数;
第⼆,针对CD 等⽣产函数等类型的数据分析,由于建模需要,⼀般需要取对数,此类情况⼀般会在柯布道格拉斯函数基础上,引⼊新的变量,包括但不局限于资本和劳动等变量;
第三,平时在⼀些数据处理中,经常会把原始数据取对数后进⼀步处理。之所以这样做是基于对数函数在其定义域内是单调增函数,取对数后不会改变数据的相对关系
第四,取对数作⽤主要有:缩⼩数据的绝对数值,⽅便计算。例如,每个数据项的值都很⼤,
许多这样的值进⾏计算可能对超过常⽤数据类型的取值范围,这时取对数,就把数值缩⼩了,例如TF-IDF计算时,由于在⼤规模语料库中,很多词的频率是⾮常⼤的数字。取对数后,可以将乘法计算转换称加法计算。某些情况下,在数据的整个值域中的在不同区间的差异带来的影响不同。也就是说,对数值⼩的部分差异的敏感程度⽐数值⼤的部分的差异敏感程度更⾼。这取对数之后不会改变数据的性质和相关关系,但压缩了变量的尺度,数据更加平稳,也消弱了模型的共线性、异⽅差性等。例如在会计或者⾦融等变量的实证研究中,引⼊变量资产规模等变量,⼀般会取对数,因为不同⾏业或者国有、民营等公司的资产规模差距很⼤,取对数,会缩⼩差距,使得实证研究更具有针对性。
另外,⼭⼤⼤学陈强⽼师在计量经济学及stata应⽤公众号中汇总出如下五种情况:
第⼀,如果理论模型中的变量为对数形式,则应取对数。⽐如,在劳动经济学中研究教育投资回报率的决定因素,通常以⼯资对数为被解释变量,因为这是从Mincer模型推导出来的。第⼆,如果变量有指数增长趋势(exponential growth),⽐如 GDP,则⼀般取对数,使得lnGDP 变为线性增长趋势(linear growth)。
第三,如果取对数可改进回归模型的拟合优度(⽐如 R2 或显著性),可考虑取对数。第四,如果希望将回归系数解释为弹性或半弹性(即百分⽐变化),可将变量取对数。第五,如果⽆法确定是否该取对数,可对两种情形都进⾏估计,作为稳健性检验(robustnesscheck)。若⼆者的回归结果类似,则说明结果是稳健的。
在经济学中,常取⾃然对数再做回归,这时回归⽅程为 lnY=a lnX+b ,两边同对X求导,1/Y*(DY/DX)=a*1/X,b=(DY/DX)*(X/Y)=(DY*X)/(DX*Y)=(DY/Y)/(DX/X) 这正好是弹性的定义。告诉你如何取对数quick\\ generate series\\ 输⼊新变量,⽐如 r=log( ),r就是取完对数后的序列。4
R平⽅很⼩怎么办?
很多同学在做实证⽂章的时候常常问,我的R平⽅只有0.08到0.09,也就是说我的模型只能解释数据的8%到9%。在实证⽂章⾥,特别对于横截⾯数据来说,有时R平⽅只有0.05。R平⽅是什么意思?就是说,我们的模型能解释数据的variance的多少,可能对于绝⼤部分的variance的解释,经济学家是不知道的。
另外,R平⽅表⽰模型拟合优度,也就是模型解释⼒度,此值介于0-1之间,数值越⼤,说明模型解释⼒度越⼤,该值越⼤越好,在实际研究中,辞职表的意义相对较⼩,即使该值⼩于0.4或者更⼩,也关系不是很⼤。
R平⽅与所选取变量多少以及回归有很⼤关系,经常在会计领域多变量进⾏回归,此值会很⼩,所以不必太在乎这个统计量。另外调整R2可以为负数,当调整R2可以为负数时,说明此时R2会很⼩,⼏乎为0,此时模型⼏乎没有意义。5
⾯板数据需要进⾏平稳性的检验吗?有些发表出来的⽂章好象没做平稳性检验。
就Panel Data的处理⽽⾔,建议先进⾏平稳性校验。⼀般完整的实证经济学论⽂,针对⾯板数据,会前期进⾏数据处理,包括描述性分析和平稳性检验的,这个根据期刊的要求或版⾯要求⽽定,另外,根据相关要求,⼀般情况下,由于⾯板数据主要核⼼在于回归,包括固定或者随机效应的回归结果,所以有些⽂章,并没有进⾏平稳性检验,⽽为了将⾯板数据做的⾼⼤上,分析更具有针对性,可以进⾏分类分⾏业分阶段进⾏回归,更能说明问题。
⽽在公司财务领域,研究都是资产负债率等,它们不可能包含单位根,所以我们基本上都不做这个检验。然⽽,在宏观经济领域,单位根过程很普遍,如果前期学者也证实了单位根过程的存在,⼀般也都做。所以具体情况,根据相关要求来定。6
在设计调查问卷时,怎么判断⼀项调查的设计是否合理,不存在硬伤呢?
问卷主要分为两⼤类:即量表问卷和⾮量表问题。量表问卷通常更多使⽤于学术研究,主要针对⼈群态度看法使⽤意愿等⽅⾯的研究,量表题是指类似答项为“⾮常不同意”,“⽐较不同意”,“中⽴”,“⽐较同意”和“⾮常同意”之类的问题,这个在前期stata培训会议中以微信使⽤意愿以及影视旅游动机专题介绍过。主要软件为SPSS,主要分析⽅法⽐如因⼦、信效度、相关、回归模型等。⽽⾮量表类来讲,其最⼤的特点为⼤部分为单选题、多选题或者排序填空题等,但很少有出现量表题(是)。本⽂以stata培训会议中,影视旅游动机为例,为⼤家总结如下思路框架。7stata中有哪些报表输出的命令?如何将stata输出结果与报表word或者excel结合呢?stata结果输出主要外部命令包括outreg2、estoout、tabout、logout、est2tex、mktab、xml_tab、esttab等,之前为⼤家推荐过最重要最实⽤的outreg2、estoout、tabout、logout、esttab等命令。由于这些命令均为第三⽅命令,因此需要下载安装,建议阅读之前推⽂,⼀般下载安装外部命令,可以选择,ssc install +命令名,或者findit +命令名,下载安装完毕,直接help 命令,就可以查看命令相关内容了。8 如何解释交互项?在数学上解释变量与控制变量可以是⼀回事,但是如果控制变量是调节变量,回归⽅程在理论上的解释就不⼀样了,解释变量是解释与被解释变量的因果关系,调节变量则是确定因果关系的边界条件。对于调节变量⽽⾔,其⽬的是强调它的出现对⼀个或⼏个解释变量在某⼀问题中影响,因⽽,需要将调节变量与所要调节的解释变量相乘,将其乘积作为⼀个回归变量。例如,在单因素⽅差分析中,有如下命令,anova wage edu married children married*children 来看⼆者对⼯资是否有影响,这类交叉项也进场在回归分析中遇见,包括但不限于常见的回归,在引⼒模型中也经常遇见。在模型中引⼊交互项,通常这两个变量,从经济理论和经济现象上⼆者之间本⾝就存在相互影响,X1是X2对于因变量产⽣影响的必备条件,就是说X2要想对因变量产⽣影响,必须是在X1起作⽤的情况下进⾏。另外,对于交互项的理解,主要可从边际效应(偏导数)来看。如果X与Y的系数为正,则X对Y的边际效应将上升;反之,如果系数为负,则X对Y的边际效应将下降。什么时候需要交互项呢?⼀般情况下,若是变量X1对被解释变量可能受到X2影响的时候,这时候可以考虑⽤交互项来进⾏回归。有关交互项需要注意:应该包含所有项⽬,例如交互项X1X2,则回归⽅程中应该包含所有变量,X1和X2,除⾮有经济理论可以不包括在内。若是交互项三个,例如X1*X2*X3,则变量回归中,还应该包含X1,X2,X3和这三个变量两两交互项。9、如何确定论⽂⽅法和数据?有时候千⾟万苦想⽤⼀个⽅法来研究某个课题,这时候建议根据前期中⼼给出的建议,⼀般情况下,需要结合研究发⽅法+软件+数据来考量,有时候你想⽤的⾯板数据,若是由于数据缺失等原因,可能就徒劳⽆功,所以⼀般情况下,建⽴同时考量⽅法,然后在数据可得性以及合理性的基础上,对数据进⾏⼀定的预处理,然后在进⾏数据分析,这时候,可能效果会更好了。10、如何理解格兰杰因果检验?
格兰杰因果检验是检验统计上的时间先后顺序,并不表⽰⽽这真正存在因果关系,是否呈因果关系需要根据理论、经验和模型来判定。
关于格兰杰因果检验若X都不是Y的格兰杰原因,这并不是说X与Y之间毫⽆关系。格兰杰因果检验本⾝也不是真实意义上检验变量的因果关系,⽽只是检验变量在统计上的时间先后顺序。格兰杰检验只能⽤于平稳序列!这是格兰杰检验的前提,⽽其因果关系并⾮我们通常理解的因与果的关系,⽽是说x的前期变化能有效地解释y的变化,所以称其为“格兰杰原因”。11、平稳性检验与协整检验?
单位根检验是序列的平稳性检验,如果不检验序列的平稳性直接OLS容易导致伪回归。当检验的数据是平稳的(即不存在单位根),即意思是单位根检验的原假设是存在单位根,存在单位根,则不平稳,等价关系!要想进⼀步考察变量的因果联系,可以采⽤格兰杰因果检验。
平稳性检验有3个作⽤:1)检验平稳性,若平稳,做格兰杰检验,⾮平稳,作协正检验。2)协整检验中要⽤到每个序列的单整阶数。
当检验的数据是⾮平稳(即存在单位根),并且各个序列是同阶单整(协整检验的前提),想进⼀步确定变量之间是否存在协整关系,可以进⾏协整检验,协整检验主要有EG两步法和JJ检验 (1)、EG两步法是基于回归残差的检验,可以通过建⽴OLS模型检验其残差平稳性(2)、JJ检验是基于回归系数的检验。单位根检验⽅法步骤
在eviews中,ADF检验的⽅法:1 view---unit roottest,出现对话框,默认的选项为变量的原阶序列检验平稳性,确认后,若ADF检验的P值⼩于0.5,拒绝原假设,说明序列是平稳的,若P值⼤于0.5,接受原假设,说明序列是⾮平稳的;2 重复刚才的步骤,view---unit root test,出现对话框,选择1stdifference,即对变量的⼀阶差分序列做平稳性检验,和第⼀步中的检验标准相同,若P值⼩于0.5,说明是⼀阶平稳,若P值⼤于0.5,则继续进⾏⼆阶差分序列的平稳性检验。
虽然定义经过d阶差分后是平稳的,但是软件只提供到2阶差分,若是原始数据没有经过差分就平稳,则说明那是零阶单整,记为I(0)的过程。
在stata中,单位根检验命令为:dfuller lnagdp,建议help dfuller等。
先做单位根检验,看变量序列是否平稳序列,若平稳,可构造回归模型等经典计量经济学模型;若⾮平稳,进⾏差分,当进⾏到第d次差分时序列平稳,则服从i阶单整(注意趋势、截距不同情况选择,根据P值和原假设判定)。若所有检验序列均服从同阶单整,可构造VAR模型,做协整检验(注意滞后期的选择),判断模型内部变量间是否存在协整关系,即是否存在长期均衡关系。如果有,则可以构造VEC模型或者进⾏Granger因果检验,检验变量之间“谁引起谁变化”,即因果关系。
关于截距、趋势选择问题,请⼤家看图,view,graph,若是有时间趋势,则选择截距和趋势;若是围绕0波动,则选择具有截距;若是没有上述情况,选择none。单位根检验是检验数据的平稳性,或是说单整阶数。
协整是说两个或多个变量之间具有长期的稳定关系。但变量间协整的必要条件是它们之间是同阶单整,也就是说在进⾏协整检验之前必须进⾏单位根检验。
协整说的是变量之间存在长期的稳定关系,这只是从数量上得到的结论,但不能确定谁是因,谁是果。⽽因果关系检验解决的就是这个问题。
单位根检验是检验时间序列是否平稳,协整是在时间序列平稳性的基础上做长期趋势的分析,⽽格兰杰检验⼀般是在建⽴误差修正模型后,所建⽴的短期的因果关系。故顺序⾃然是先做单位根检验,再过协整检验,最后是格兰杰因果检验。
单位根检验是对时间序列平稳性的检验,只有平稳的时间序列,才能进⾏计量分析,否则会出现伪回归现象;协整是考察两个或者多个变量之间的长期平稳关系;格兰杰因果检验是考察变量之间的因果关系,协整说明长期稳定关系不⼀定是因果关系,所以需要在通过格兰杰因果检
验确定两者的因果关系。顺序⼀般是单位根检验,通过后如果同阶单整,在进⾏协整,然后在进⾏因果检验。要特别注意的是:只有同阶单整才能进⾏协整。12、VAR模型
VAR建模时lag intervals for endogenous要填滞后期,但是此时你并不能判断哪个滞后时最优的,因此要试,选择不同的滞后期,⾄AIC或SC最⼩时,所对应着的滞后为最优滞后,此时做出来的VAR模型才较为可靠。
选择⽅法为:这个问题,中⼼QQ群⾥,已经解答过,⼩编想说的是,⼀定要注意eviews操作界⾯有两个,⽬前所说的界⾯view,都是前⾯这个界⾯,不是后⾯那个有file,quick这个界⾯,请不要点错!
做协整检验前作VAR的原因是,协整检验是对滞后期和检验形式⾮常敏感的检验,⾸先需要确定最优滞后。由于VAR是⽆约束的,⽽协整是有约束的,因此协整检验的最优滞后⼀般为VAR的最优滞后减去1,确定了最优滞后后,再去诊断检验形式,最终才能做协整。
当确定了协整的个数后,往下看,有个标准化的结果,这个结果就是协整⽅程,由于在结果中各变量均在⽅程⼀侧,因此如果系数为正,则说明是负向关系,反之亦然。协整表⽰变量间的长期均衡关系,貌似与你的OLS不⽭盾。
(1)如检验不协整,说明没长期稳定关系,可以做VAR模型,但是模型建⽴后要做稳定性分析:做AR根的图表分析,如所有单位根⼩于1,说明VAR模型定,满⾜脉冲分析及⽅差分解所需条件之⼀
(2)VAR与VEC关系是:VEC是有协整约束(即有长期稳定关系)的VAR模型,多⽤于具有协整关系的⾮平稳时间序列建模 简单说VAR模型建⽴时
第⼀步:不问序列如何均可建⽴初步的VAR模型(建⽴过程中数据可能前平稳序列,也可能是部分平稳,还可能是没协整关系的同阶不平稳序列,也可能是不同阶的不平稳序列,滞后阶数任意指定。所有序列⼀般视为内⽣向量), 1 滞后阶数检验,以确定最终模型的滞后阶数;2 在滞后阶数确定后进⾏因果关系检验,以确定哪些序列为外⽣变量进⾏AR根图表分析,如单位根均⼩于1,VAR构建完成可进⾏脉冲及⽅差分解。更多内容,敬请期待!
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务