您的当前位置:首页计量经济学第二版(庞皓)课后思考题答案

计量经济学第二版(庞皓)课后思考题答案

2020-07-05 来源:小侦探旅游网
计量经济学(庞皓)第二版 课后思考题答案

第一章 绪论

思考题

1.1怎样理解产生于西方国家的计量经济学能够在中国的经济理论研究和现代化建设中发挥重要作用?

答:计量经济学的产生源于对经济问题的定量研究,这是社会经济发展到一定阶段的客观需要。计量经济学的发展是与现代科学技术成就结合在一起的,它反映了社会化大生产对各种经济因素和经济活动进行数量分析的客观要求。经济学从定性研究向定量分析的发展,是经济学逐步向更加精密、更加科学发展的表现。我们只要坚持以科学的经济理论为指导,紧密结合中国经济的实际,就能够使计量经济学的理论与方法在中国的经济理论研究和现代化建设中发挥重要作用。

1.2理论计量经济学和应用计量经济学的区别和联系是什么?

答:计量经济学不仅要寻求经济计量分析的方法,而且要对实际经济问题加以研究,分为理论计量经济学和应用计量经济学两个方面。

理论计量经济学是以计量经济学理论与方法技术为研究内容,目的在于为应用计量经济学提供方法论。所谓计量经济学理论与方法技术的研究,实质上是指研究如何运用、改造和发展数理统计方法,使之成为适合测定随机经济关系的特殊方法。

应用计量经济学是在一定的经济理论的指导下,以反映经济事实的统计数据为依据,用计量经济方法技术研究计量经济模型的实用化或探索实证经济规律、分析经济现象和预测经济行为以及对经济政策作定量评价。

1.3怎样理解计量经济学与理论经济学、经济统计学的关系?

答:1、计量经济学与经济学的关系。联系:计量经济学研究的主体—经济现象和经济关系的数量规律;计量经济学必须以经济学提供的理论原则和经济运行规律为依据;经济计量分析的结果:对经济理论确定的原则加以验证、充实、完善。区别:经济理论重在定性分析,并不对经济关系提供数量上的具体度量;计量经济学对经济关系要作出定量的估计,对经济理论提出经验的内容。

2、计量经济学与经济统计学的关系。联系:经济统计侧重于对社会经济现象的描述性计量;经济统计提供的数据是计量经济学据以估计参数、验证经济理论的基本依据;经济现象不能作实验,只能被动地观测客观经济现象变动的既成事实,只能依赖于经济统计数据。区别:经济统计学主要用统计指标和统计分析方法对经济现象进行描述和计量;计量经济学主要利用数理统计方法对经济变量间的关系进行计量。 1.4在计量经济模型中被解释变量和解释变量的作用有什么不同?

答:在计量经济模型中,解释变量是变动的原因,被解释变量是变动的结果。被解释变量是模型要分析研究的对象。解释变量是说明被解释变量变动主要原因的变量。 1.5一个完整的计量经济模型应包括哪些基本要素?你能举一个例子吗?

答:一个完整的计量经济模型应包括三个基本要素:经济变量、参数和随机误差项。

例如研究消费函数的计量经济模型:YαβXu

其中,Y为居民消费支出,X为居民家庭收入,二者是经济变量;α和β为参数;

u是随机误差项。

1.6假如你是中央银行货币政策的研究者,需要你对增加货币供应量促进经济增长提出

1

建议,你将考虑哪些因素?你认为可以怎样运用计量经济学的研究方法?

答:货币政策工具或者说影响货币供应量的因素有再贴现率、公开市场业务操作以及法定准备金率。所以会考虑再贴现率、公开市场业务操作以及法定准备金率。选择这三种因素作为解释变量。货币供应量作为被解释变量。从而建立简单线性回归模型。 1.7计量经济学模型的主要应用领域有哪些?

答:计量经济模型主要可以用于经济结构分析、经济预测、政策评价和检验与发展经济理论。

1.8如果要根据历史经验预测明年中国的粮食产量,你认为应当考虑哪些因素?应当怎样设定计量经济模型?

答:影响中国的粮食产量的因素可以有农业资金投入、农业劳动力、粮食播种面积、受灾面积等。可建立如下多元模型:

Y1β2X2β3X3β4X4β5X5u

其中,Y为中国的粮食产量,X2为农业资金投入,X3为农业劳动力,X4为粮食播种面积,X5为受灾面积。

1.9参数和变量的区别是什么?为什么对计量经济模型中的参数通常只能用样本观测值去估计?

答:经济变量反映不同时间、不同空间的表现不同,取值不同,是可以观测的因素。是模型的研究对象或影响因素。经济参数是表现经济变量相互依存程度的、决定经济结构和特征的、相对稳定的因素,通常不能直接观测。

一般来说参数是未知的,又是不可直接观测的。由于随机误差项的存在,参数也不能通过变量值去精确计算。只能通过变量样本观测值选择适当方法去估计。 1.10你能分别举出三个时间序列数据、截面数据、面板数据、虚拟变量数据的实际例子,并分别说明这些数据的来源吗? 答:时间序列数据:中国1981年至2010年国内生产总值,可从中国统计年鉴查得数据。

截面数据:中国2010年各省、区、直辖市的国内生产总值,中国统计年鉴查得数据。

面板数据:中国1981年至2010年各省、区、直辖市的国内生产总值,中国统计年鉴查得数据。

虚拟变量数据:自然灾害状态,1表示该状态发生,0表示该状态不发生。

1.11为什么对已经估计出参数的模型还要进行检验?你能举一个例子说明各种检验的必要性吗?

答:模型中的参数被估计以后,一般说来这样的模型还不能直接加以应用,还需要对其进行检验。首先,在设定模型时,对所研究经济现象规律性的认识可能并不充分,所依据的经济理论对所研究对象也许还不能作出正确的解释和说明。或者经济理论是正确的,但可能我们对问题的认识只是从某些局部出发,或者只是考察了某些特殊的样本,以局部去说明全局的变化规律,可能导致偏差。其次,我们用以估计参数的统计数据或其它信息可能并不十分可靠,或者较多地采用了经济突变时期的数据,不能真实代表所研究的经济关系,或者由于样本太小,所估计参数只是抽样的某种偶然结果。此外,我们所建立的模型、采用的方法、所用的统计数据,都有可能违反计量经济的基本假定,这也可能导出错误的结论。

1.12为什么计量经济模型可以用于政策评价?其前提条件是什么?

2

答:所谓政策评价,是利用计量经济模型对各种可供选择的政策方案的实施后果进行模拟运算,从而对各种政策方案作出评价。前提是,我们是把计量经济模型当作经济运行的实验室,去模拟所研究的经济体计量经济模型体系,分析整个经济体系对各种假设的政策条件的反映。在实际的政策评价时,经常把模型中的某些变量或参数视为可用政策调整的政策变量,然后分析政策变量的变动对被解释变量的影响。

1.13为什么定义方程式可以用于联立方程组模型,而不宜用于建立单一方程模型? 答:定义关系是指根据定义而表达的恒等式,是由经济理论或客观存在的经济关系决定的恒等关系。国民经济中许多平衡关系都可以建立恒等关系,这样的模型称为定义方程式。在联立方程组模型中经常利用定义方程式。但是,定义方程式的恒等关系中没有随机误差项和需要估计的参数,所以一般不宜用于建立单一方程模型。

第二章 简单线性回归模型

2.1相关分析与回归分析的关系是什么?

答:相关分析与回归分析有密切的关系,它们都是对变量间相关关系的研究,二者可以相互补充。相关分析可以表明变量间相关关系的性质和程度,只有当变量间存在一定程度的相关关系时,进行回归分析才有实际的意义。同时,在进行相关分析时如果要具体确定变量间相关的具体数学形式,又要依赖于回归分析,而且相关分析中相关系数的确定也是建立在回归分析基础上的。

相关分析与回归分析的区别。从研究目的上看,相关分析是用一定的数量指标(相关系数)度量变量间相互联系的方向和程度;回归分析却是要寻求变量间联系的具体数学形式,是要根据解释变量的固定值去估计和预测被解释变量的平均值。从对变量的处理看,相关分析对称地对待相互联系的变量,不考虑二者的因果关系,也就是不区分解释变量和被解释变量,相关的变量不一定具有因果关系,均视为随机变量;回归分析是建立在变量因果关系分析的基础上,研究其中解释变量的变动对被解释变量的具体影响,回归分析中必须明确划分解释变量和被解释变量,对变量的处理是不对称的。 2.2什么是总体回归函数和样本回归函数?它们之间的区别是什么?

答:总体回归函数是将总体被解释变量的条件期望表现为解释变量的函数。样本回归函数是将被解释变量的样本条件均值表示为解释变量的函数。

总体回归函数和样本回归函数之间的区别。首先,总体回归函数虽然未知,但它是确定的;而由于从总体中每次抽样都能获得一个样本,就都可以拟合一条样本回归线,样本回归线是随抽样波动而变化的,可以有很多条。所以样本回归函数还不是总体回归函数,至多只是未知的总体回归函数的近似反映。其次,总体回归函数的参数是确定的常数;而样本回归函数的参数是随抽样而变化的随机变量。

2.3什么是随机扰动项和剩余项(残差)?它们之间的区别是什么?

答:总体回归函数中,被解释变量个别值Yi与条件期望E(YXi)的偏差是随机扰动项ui。

ˆ的偏差是残差项ei。残差项ei样本回归函数中,被解释变量个别值Yi与样本条件均值Yi在概念上类似总体回归函数中的随机扰动项ui,可视为对随机扰动项ui的估计。 总体回归函数中的随机误差项是不可以直接观测的;而样本回归函数中的残差项是只要估计出样本回归的参数就可以计算的数值。

2.4为什么在对参数作最小二乘估计之前,要对模型提出古典假设?

3

答:在对参数作最小二乘估计之前,要对模型提出古典假设。因为模型中有随机扰动,估计的参数是随机变量,只有对随机扰动的分布作出假定,才能确定所估计参数的分布性质,也才可能进行假设检验和区间估计。只有具备一定的假定条件,所作出的估计才具有较好的统计性质。

2.5总体方差和参数估计方差的区别是什么?

答:总体方差是未知的,但是确定存在的。参数估计方差可以由样本数据计算出来,但只是总体的近似反映,未必等于真实值。

2.6为什么可决系数可以度量模型的拟合优度?在简单线性回归中它与对参数的t检验的关系是什么?

答:可决系数是回归平方和占总离差平方和的比重,即由样本回归作出解释的离差平方和在总离差平方和中占的比重,如果样本回归线对样本观测值拟合程度好,各样本观测点与回归线靠得越近,由样本回归作出解释的离差平方和在总离差平方和中占的比重也将越大,反之拟合程度越差,这部分所占比重就越小。所以可决系数可以作为综合度量回归模型对样本观测值拟合优度的指标。

在简单线性回归中,可决系数越大,说明在总变差中由模型作出了解释的部分占的比重越大,X对Y的解释能力越强,模型拟合优度越好。对参数的t检验是判断解释变量X是否是被解释变量Y的显著影响因素。二者的目的作用是一致的。 2.7有人说:“得到参数区间估计的上下限后,说明参数的真实值落入这个区间的概率为1。”如何评论这种说法?

答:这种说法是错误的。区间是随机的,只是说明在重复抽样中,像这样的区间可构造许多次,从长远看平均地说,这些区间中将有1的概率包含着参数的真实值。参数的真实值虽然未知,却是一个固定的值,不是随机变量。所以应理解为区间包含参数真实值的概率是1,而不能认为参数的真实值落入这个区间的概率为1。 2.8对参数假设检验的基本思想是什么?

答:对参数假设检验的基本思想,是在所估计样本回归系数概率分布性质已确定的基础上,在对总体回归系数某种原假设成立的条件下,利用适当的有明确概率分布的统计量和给定的显著性水平,构造一个小概率事件,判断原假设结果合理与否,是基于“小概率事件不易发生”的原理,可以认为小概率事件在一次观察中基本不会发生,如果小概率事件竟然发生了,就认为原假设不成立,从而拒绝原假设,不拒绝备择假设。 2.9为什么对被解释变量个别值的预测区间会比对被解释变量平均值的预测区间更宽? 答:预测被解释变量平均值仅存在抽样误差,而对被解释变量个别值的预测,不仅存在抽样误差,而且要受随机扰动项的影响。所以对个别值的预测区间比对平均值的预测区间更宽。

2.10如果有人利用中国1978~2000年的样本估计的计量经济模型直接预测“中国综合经济水平将在2050年达到美国2002年的水平”,你如何评论这种预测?

答:用回归模型作预测时,预测期解释变量取值不宜偏离样本期过远,否则预测的精度会大大降低。利用中国1978~2000年的样本估计50年之后的经济水平,其预测不会太准确。

2.11对本章开始提出的“中国旅游业总收入将超过3000亿美元”,你认为可以建立什么样的简单线性回归模型去分析?

答:对本章开始提出的问题,我们会考虑:是什么决定性的因素能使中国旅游业总收入到2020年达到3000亿美元?旅游业的发展与这种决定性因素的数量关系究竟是什么?怎样具体测定旅游业发展与这种决定性因素的数量关系?综合考虑各种因素,我们认为影响中国旅游业总收入的决定性因素是中国居民收入的增长。于是建立如下模型:

4

YαβXu

其中,Y为中国旅游业总收入,X为中国居民收入。

第三章 多元线性回归模型

3.1若要将一个被解释变量对两个解释变量作线性回归分析: 1)写出总体回归函数和样本回归函数; 2)写出回归模型的矩阵表示; 3)说明对此模型的古典假定;

4)写出回归系数及随机扰动项方差的最小二乘估计式,并说明参数估计式的性质。 答:1)总体回归函数:Y1β2X2β3X3u

ˆXβˆX ˆβˆ样本回归函数:Y122332)写出回归模型的矩阵表示

Y11X21Y1X222Yn1X2nX31X32X3nXk1β1u1βuXk222 Xknβkun3)此模型的古典假定:零均值假定;同方差和无自相关假定;随机扰动项与解释变量不相关;无多重共线性假定;随机误差项服从正态分布。 4)回归系数最小二乘估计式:

ˆ2ˆ3yxxyxxxxxxyxxyxxxxxxi2i23ii3i22i23i2i3ii3i22ii2i22i23i2i3i2i3i2xx2i3i2

ˆYˆXˆX12233ˆ随机扰动项方差的最小二乘估计式:σ2e2ink

参数估计式的性质:具有线性性、无偏性和最小方差性。

3.2什么是偏回归系数?它与简单线性回归的回归系数有什么不同?

答:多元线性回归模型中,回归系数j(j=1,2,„,k)表示的是当控制其它解释变量不变的条件下,第j个解释变量的单位变动对被解释变量平均值的影响,这样的回归系数称为偏回归系数。

简单线性回归模型只有一个解释变量,回归系数表示解释变量的单位变动对被解释变量平均值的影响。多元线性回归模型中的回归系数是偏回归系数,是当控制其它解释变量不变的条件下,某个解释变量的单位变动对被解释变量平均值的影响,从而可以实现保持某些控制变量不变的情况下,分析所关注的变量对被解释变量的真实影响。

5

3.3多元线性回归中的古典假定与简单线性回归时有什么不同?

答:多元线性回归中的古典假定比简单线性回归时多出一个无多重共线性假定。假定各解释变量之间不存在线性关系,或各个解释变量观测值之间线性无关。解释变量观测值矩阵X列满秩(k列)。这是保证多元线性回归模型参数估计值有解的重要条件。 3.4多元线性回归分析中,为什么要对可决系数加以修正?修正可决系数与F检验之间有何区别与联系?

答:多元线性回归分析中,多重可决系数是模型中解释变量个数的增函数,这给对比不同模型的多重可决系数带来缺陷,所以需要修正。可决系数只涉及变差,没有考虑自由度。如果用自由度去校正所计算的变差,可纠正解释变量个数不同引起的对比困难。

联系:由方差分析可以看出,F检验与可决系数有密切联系,二者都建立在对应变量变差分解的基础上。F统计量也可通过可决系数计算。对方程联合显著性检验的F检验,实际上也是对可决系数的显著性检验。区别:F检验有精确的分布,它可以在给定显著性水平下,给出统计意义上严格的结论。可决系数只能提供一个模糊的推测,可决系数越大,模型对数据的拟合程度就越好。但要大到什么程度才算模型拟合得好,并没有一个绝对的数量标准。

3.5什么是方差分析?对被解释变量的方差分析与对模型拟合优度的度量有什么联系和区别?

答:被解释变量Y观测值的总变差分解式为:TSSESSRSS。将自由度考虑进去进行方差分析,即得如下方差分析表: 变差来源 平方和 自由度 方差 k1 源于回归 2ˆESSk1 ESS(YiY) 源于残差 总变差 ˆ)2 RSS(YiYiTSS(YiY) 2nk n1 RSSnk 方差分析和对模型拟合优度的度量(可决系数)都是在把总变差分解为回归平方和

与残差平方和的基础上进行分析。区别是前者考虑了自由度,后者未考虑自由度。 3.6多元线性回归分析中,F检验与t检验的关系是什么?为什么在作了F检验以后还要作t检验?

答:在多元回归中,t检验是分别检验当其他解释变量保持不变时,各个解释变量X对应变量Y是否有显著影响。F检验是在多元回归中有多个解释变量,需要说明所有解释变量联合起来对应变量影响的总显著性,或整个方程总的联合显著性。

F检验是对多元回归模型方程整体可靠性的检验,而多元线性回归分析的目的,不仅是要寻求方程整体的显著性,也要对各个参数作出有意义的估计。方程整体线性关系显著并不一定表示每个解释变量对被解释变量的影响是显著的,因此,还必须分别对每个回归系数逐个地进行t检验。

3.7试证明:在二元线性回归模型Y1β2X2β3X3u中,当X2和X3相互独立时,对斜率系数2和3的OLS估计值。等于Y分对X2和X3作简单线性回归时斜率系数的OLS估计值。

答:二元线性回归模型的回归系数2和3最小二乘估计式:

6

ˆ2ˆ3yxxyxxxxxxyxxyxxxxxxi2i23ii3i22i23i2i3ii3i22ii2i22i23i2i3i2i3i2xx

2i3i2而当X2和X3相互独立时,X2和X3的斜方差等于零,即:

Cov(X2,X3)EX2EX2X3EX3Ex2x3x2x30将

xx023n

(xx)0代入ˆ232ˆ式中,可得: 和3ˆyxxxxyxxxxi2i22ii3i22i23i223iˆ322i23iyxxyxxi2i22i

i3i23i所以,当X2和X3相互独立时,对斜率系数2和3的OLS估计值。等于Y分对X2和

X3作简单线性回归时斜率系数的OLS估计值。

3.8对于本章开始提出的“中国已成为世界汽车产销第一国”,为分析中国汽车产销量的发展,你认为可建立什么样的计量经济模型?

答:分析中汽车市场状况如何,我们可以用销售量观测。其次考虑影响汽车销量的主要因素都有哪些?比如收入、价格、费用、道路状况、能源、政策环境等。可以建立如下模型:

Y1β2X2β3X3β4X4u

其中,Y为汽车销售量,X2为居民收入,X3为汽车价格,X4为汽油价格,像其他费用、道路状况、政策环境等次要因素包含在随机误差项u中。 3.9说明用Eviews完成多元线性回归分析的具体操作步骤。 答:1、建立工作文件,建立一个Group对象,输入数据。

2、点击Quick下拉菜单中的Estimate Equation。

3、在对话框Equation Specification栏中键入Y C X2 X3 X4,点击OK,即出现回归结果。

第四章 多重共线性

思考题

7

4.1 多重共线性的实质是什么?为什么会出现多重共线性?

答:多重共线性包括完全的多重共线性和不完全的多重共线性。多重共线性实质上是样本数据问题,出现了解释变量系数矩阵的线性相关问题。 产生多重共线性的经济背景主要有以下几种情形:

第一,经济变量之间具有共同变化趋势。第二,模型中包含滞后变量。第三,利用截面数据建立模型也可能出现多重共线性。第四,样本数据自身的原因。 4.2 多重共线性对回归参数的估计有何影响?

答:在完全多重共线性情况下,参数的估计值不确定,估计量的方差无限大。在不完全共线性情况下,参数估计量的方差随共线性程度的增加而增大;对参数区间估计时,置信区间趋于变大;严重多重共线性时,假设检验容易做出错误的判断;当多重共线性严重时,可能造成可决系数R2较高,经F检验的参数联合显著性也很高,但单个参数t检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。 4.3 多重共线性的典型表现是什么?判断是否存在多重共线性的方法有哪些?

答:多重共线性的典型表现是模型拟和较好,但偏回归系数几乎都无统计学意义;偏回归系数估计值不稳定,方差很大;偏回归系数估计值的符号可能与预期不符或与经验相悖,结果难以解释。

具体判断方法有:解释变量之间简单相关系数矩阵法;方差扩大因子法以及一些直观判断法和逐步回归的方法。

4.4 针对出现多重共线性的不同情形,能采取的补救措施有哪些?

答:根据经验,可以选择剔除变量,增大样本容量,变换模型形式,利用非样本先验信息,截面数据和时间序列数据并用以及变量变换等不同方法。也可以采取逐步回归方法由由一元模型开始逐步增加解释变量个数,增加的原则是显著提高可决系数,自身显著而与其他变量之间又不产生共线性。最后,还可以采取岭回归方法来降低多重共线性的程度。

4.5 在涉及相关的宏观经济总量指标如GDP、货币供应量、物价水平、国民总收入、就业人数等时间序列的数据中一般都会怀疑有多重共线性,为什么? 答:原因是这些变量之间通常具有共同变化的趋势。

4.6 多重共线性的产生与样本容量的个数n、解释变量的个数k有无关系?

答:由于多重共线性是一个样本特征,所以可能同样变量的另一组样本共线性程度又没

ˆ)那么严重。根据方差公式Var(22x22iVIF,样本容量越大

x22i也会增加,从而会

减小回归参数的方差,标准误差也同样会减小。多重共线性与解释变量的个数也有关系,解释变量个数越多,变量之间产生多重共线性的可能性越大。 4.7 具有严重多重共线性的回归方程能否用来进行预测?

答:如果研究的目的仅在于预测Y,而各个解释变量X之间的多重共线性关系的性质在未来将继续保持,这时虽然无法精确估计个别的回归系数,但可以估计这些系数的某些线性组合,因此,多重共线性可能并不是严重问题。

4.8 岭回归法的基本思想是什么,它对降低共线性有何作用?

ˆ)(ˆ)'2(X'X)1会增大,答:当解释变量之间存在多重共线性时,X'X0,则E(原因是X'X接近于奇异。如果将X'X加上一个正常数对角矩阵kI(k>0,I为单位矩阵),即X'XkI,使得X'XkI0的可能性比X'X0的可能性更小,那么X'XkI接近奇异

8

的程度就会比X'X小得多。如此可以得到参数的岭回归估计:(k)(X'XkI)1X'Y,K是岭回归参数。当解释变量之间存在多重共线性时,岭回归估计比最小二乘估计稳定,当k较小时,回归系数很不稳定,而当k逐渐增大时,回归系数可能呈现稳定状态。因此,选择合适的k值,岭回归参数会优于普通最小二乘估计参数。当k=0时,岭回归估计等于普通最小二乘估计。

4.9 以下陈述是否正确?请判断并说明理由。

1)在高度多重共线性的情形中,要评价一个或多个偏回归系数的单个显著性是不可能的。

答:正确。

理由:在高度多重共线性的情形中,没有任何方法能从所给的样本中把存在高度共线性的解释变量的各自影响分解开来,从而也就无法得到单个参数显著性检验的t统计量,因此无法判断单个或多个偏回归系数的单个显著性。

2)尽管有完全的多重共线性,OLS估计量仍然是BLUE。 答:错误。

理由:在完全多重共线性情况下,参数估计值的方差无穷大,因此不再是有效估计量,从而BLUE不再成立。

3)如果有某一辅助回归显示出高的R2j值,则高度共线性的存在肯定是无疑的。 答:正确。

理由:方差扩大因子VIFj1(1R2j)~,当R2j时,方差扩大因子也会很大,说明变量之间

多重共线性也会越严重。

4)变量的两两高度相关并不表示高度多重共线性。 答:正确。

理由:较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性,这时就需要检查偏相关系数。因此,并不能简单地依据相关系数进行多重共线性的准确判断。

5)如果其他条件不变,VIF越高,OLS估计量的方差越大。 答:正确。

ˆ)理由:以二元模型为例,Var(22x22iˆ)VIFVar(322x3iVIF,从而方差扩大因子

VIF越大,参数估计量的方法越大。

6)如果在多元回归中,根据通常的t检验,全部偏回归系数分别都是统计上不显著的,你就不会得到一个高的R2值。 答:错误。

理由:在多元回归模型中,可能会由于多重共线性的存在导致R2很高的情况下,各个参数单独的t检验却不显著。

ˆ)增大,在极端7)在Y对X2和X3的回归中,假如X3的值很少变化,这就会使Var(3ˆ)将是无穷大。 的情况下,如果全部X3值都相同,Var(39

答:正确。

ˆ)理由:根据公式,Var(3222x3i(1r23),在两个解释变量线性相关程度一定的情况下,

X3的值很少变化,从而会使得

x23iˆ)增大,如果全部X值都相同,很小,从而Var(33x

23iˆ)将是无穷大。 趋于零,Var(3第五章 异方差性

思考题

5.1 简述什么是异方差?为什么异方差的出现总是与模型中某个解释变量的变化有关?

答 :设模型为Yi12X2i....3X3ii(i1,2,....,n),如果其他假定均不变,但模型中随机误差项的方差为Var(i)i2(i1,2,...,n),则称i具有异方差性。由于异方差性指的是被解释变量观测值的分散程度是随解释变量的变化而变化的,所以异方差的出现总是与模型中某个解释变量的变化有关。

5.2 试归纳检验异方差方法的基本思想,并指出这些方法的异同。

答:各种异方差检验的共同思想是,基于不同的假定,分析随机误差项的方差与解释变量之间的相关性,以判断随机误差项的方差是否随解释变量变化而变化。其中,戈德菲尔德-跨特检验、怀特检验、ARCH检验和Glejser检验都要求大样本,其中戈德菲尔德-跨特检验、怀特检验和Glejser检验对时间序列和截面数据模型都可以检验,ARCH检验只适用于时间序列数据模型中。戈德菲尔德-跨特检验和ARCH检验只能判断是否存在异方差,怀特检验在判断基础上还可以判断出是哪一个变量引起的异方差。Glejser检验不仅能对异方差的存在进行判断,而且还能对异方差随某个解释变量变化的函数形式进行诊断。

5.3 什么是加权最小二乘法?它的基本思想是什么?

Y12Xiui答:以一元线性回归模型为例:i经检验i存在异方差,公式可以

表示为

var(ui)i22f(Xi)。选取权数 wi ,当i2 越小 时,权数wi越

10

大。当 i2越大时,权数wi越小。将权数与 残差平方相乘以后再求和,得到加权的残差平方和:

wew(Y2iii*12*2Xi),求使加权残差平方和最小的参数估

ˆ*和ˆ*。这种求解参数估计式的方法为加权最小二乘法。 计值12加权最小二乘的基本思想是通过权数Wi使异方差经受了“压缩”和“扩张”变为同方差。区别对待不同的 i2 。对较小的ei2,给予较大的权数,对较大的ei2给予较小的权数,从而使

e2i 更 好地反映i2 对残差平方和的影响。

5.4 产生异方差的原因是什么?试举例说明经济现象中的异方差性。

答:原因包括模型设定误差,模型中略去重要解释变量或者模型数学形式不正确都可能导致异方差。样本数据的观测误差以及截面数据中总体各单位的差异等也会导致异方差的存在。

5.5 如果模型中存在异方差性,对模型又什么影响?这时候模型还能进行应用分析吗?

答:当模型中的误差项存在异方差时,参数估计仍然是无偏的但方差不再是最小的;在异方差存在的情况下,参数估计的方差可能会高估或者低估真实的方差,从而会低估或者高估t统计量,从而可能导致错误的结论。

由于参数估计量不再是有效的,从而对Y的预测也将不是有效的。

5.6 对数变化的作用是什么?进行对数变化应注意什么?对数变换后模型的经济意义有什么变化?

答:通过对数变换可以实现:一能使测定变量值的尺度缩小;二经过对数变换后的线性模型,其残差e表示相对误差,而相对误差往往比绝对误差有较小的差异。

进行对数变化应注意的是,对变量取对数虽然能够减少异方差对模型的影响,但应注意取对数后变量的经济意义。如果变量之间在经济意义上并非呈对数线性关系,则不能简单地对变量取对数,这时只能用其他方法对异方差进行修正。 5.7 怎样确定加权最小二乘法中的权数?

答:在样本容量足够的情况下,可以先尝试用怀特检验找出引起异方差的解释变量,然后通过Glejser检验找出残差e随该解释变量变化而变化的函数形式,进而以该函数开方的倒数作为权数进行加权最小二乘估计。

11

第六章 思考题

6.1 如何使用DW统计量来进行自相关检验?该检验方法的前提条件和局限性有哪些?

答:DW 检验是J.Durbin(杜宾)和G.S.Watson(沃特森)于1951年提出的一种适用于小样本的检验方法,一般的计算机软件都可以计算出DW 值。

给定显著水平α,依据样本容量n和解释变量个数k’,查D.W.表得d统计量的上界du和下界dL,当0DW检验的前提条件:

(1)回归模型中含有截距项;

(2)解释变量是非随机的(因此与随机扰动项不相关) (3)随机扰动项是一阶线性自相关。 ;

(4)回归模型中不把滞后内生变量(前定内生变量)做为解释变量。 (5)没有缺失数据,样本比较大。 DW检验的局限性:

(1)DW检验有两个不能确定的区域,一旦DW值落在这两个区域,就无法判断。这时,只有增大样本容量或选取其他方法

(2)DW统计量的上、下界表要求n15, 这是因为样本如果再小,利用残差就很难对自相关的存在性做出比较正确的诊断

(3) DW检验不适应随机误差项具有高阶序列相关的检验.

(4) 只适用于有常数项的回归模型并且解释变量中不能含滞后的被解释变量

ˆ6.2 当回归模型中的随机误差项为AR(1)自相关时,为什么仍用OLS法会低估j 的标准误差?

ˆ以 为例:记 βˆ*为存在自相β2关仍然考虑一元线性回归模型,β22的估计值,则

(XtX)ut**22ˆˆVar()E()E() 22222(XtX)2

(XtX)(XtX)22 E(u)E(Ku)(令K)ttt2t2(XtX)(XtX)

E(Ki2i22KiKjij)ij

Kt2E(ut2)2KtKsE(utus)

st

2

(XtX)22KtKsE(utus)stˆ)2KKE(uu)Var(tsts2stˆ满足古典假定)(2E(usut)0ˆ*)Var(βˆ)Var(β22时,说明随机误差项存在自相关,此时,所以这个时候参数估计值的

12

方差不是最小。如果存在自相关时仍然用最小二乘方法估计参数,就极有可能低估参数估计值的真实方差。

6.3 判断以下陈述的真伪,并给出合理的解释。

(1)当回归模型随机误差项有自相关时,普通最小二乘估计量是有偏误的和非有效的。 判断:错误。当回归模型随机误差项有自相关时,普通最小二乘估计量是无偏误的和非有效的。

(2)DW检验假定随机误差项ui的方差是同方差。

判断:错误。DW统计量的构造中并没有要求误差项的方差是同方差 。 (3)用一阶差分法消除自相关是假定自相关系数为-1。

判断:错误。用一阶差分法消除自相关是假定自相关系数为1,即原原模型存在完全一阶正自相关。

(4)当回归模型随机误差项有自相关时,普通最小二乘估计的预测值的方差和标准误差不再是有效的。 判断:正确。

6.4 对于四个解释变量的回归模型

    X   X   X   X  u Y

t t t t t 0 1 1t 2 2 3 3 4 4

如果样本量n=50, 当DW统计量为如下数值时,请判断模型中的自相关状况。

(1)DW=1.05 (2) DW=1.40 (3)DW=2.50 (4) DW=3.97

答:给定显著水平α=0.05,依据样本容量n=50和解释变量个数k’=4,查D.W.表得d统计量的上界du=1.721,下界dL=1.378,4 du=2.279,4dL=2.622。 (1)DW=1.05dL,所以模型存在正自相关。

(2) dLDW=1.40du, 所以模型不能确定是否存在自相关。 (3)4 du DW=2.50 4dL,所以模型不能确定是否存在自相关。 (4)DW=3.974dL,所以模型存在负自相关。

第七章 分布滞后模型与自回归模型

7.1 什么是滞后现象?产生滞后现象的原因主要有哪些?

答:解释变量与被解释变量的因果联系不可能在短时间内完成,在这一过程中

13

通常都存在时间滞后,也就是说解释变量需要通过一段时间才能完全作用于被解释变量。 此外,由于经济活动的惯性,一个经济指标以前的变化态势往往会延续到本期,从而形成被解释变量的当期变化同自身过去取值水平相关的情形。 这种被解释变量受自身或其它经济变量过去值影响的现象称为滞后效应。 心理预期因素、技术因素、制度因素等都是产生滞后现象的原因

7.2 对分布滞后模型进行估计存在哪些困难?实际应用中如何处理这些困难? 答:分布滞后模型进行估计存在的困难

自由度问题:如果样本观测值个数n较小,随着滞后长度s的增大,有效样本容量n-s变小,会出现自由度不足的问题。

多重共线性问题:由于经济活动的前后继起性,经济变量的滞后值之间通常存在较强的联系,因此,分布滞后模型中滞后解释变量观测值之间往往会存在严重多重共线性问题。

滞后长度难于确定的问题:在实际经济分析中用分布滞后模型来处理滞后现象时,模型中滞后长度的确定较为困难,没有充分的先验信息可供使用。

实际应用中处理这些困难的方法:对于有限分布滞后模型,其基本思想是设法有目的地减少需要直接估计的模型参数个数,以缓解多重共线性,保证自由度。 对于无限分布滞后模型,主要是通过适当的模型变换,使其转化为只需估计有限个参数的自回归模型。

7.3 库伊克模型 、自适应预期模型与局部调整模型有哪些共性和不同之处?模型估计会存在哪些困难?如何解决?

答:(1)相同之处:库伊克模型、自适应预期模型、局部调整模型三个模型的最终形式都是一阶自回归模型。

(2)不同之处:

1)导出模型的经济背景和思想不同。

库伊克模型是在无限分布滞后模型的基础上,根据库伊克几何分布滞后假定导出的;自适应预期模型是由解释变量自适应过程得到的;局部调整模型是由应变量的局部调整得到的。

2)模型存在的问题不同。

三个模型的形成机理不同,所以随机误差项的结构不同,库伊克模型和自适应预期模型都存在自相关、解释变量与随机误差项相关的问题;而局部调整模型则不存在。库伊克模型和自适应预期模型不能够直接使用最小二乘法直接估计,而局部调整模型则可以。

(3)模型估计存在的困难及解决的方法 (a)出现了随机解释变量

yt1 ,而

yt1可能与

ut相关;

(b)随机扰动项可能自相关,库伊克模型和自适应预 期模型的随机扰动项都会导致自相关,只有局部调整模型的随机扰动无自相关.如果用最小二乘法直接估计自回归模型,则估计可能是有偏的,而且不是一致估计。

估计自回归模型需要解决两个问题:设法消除

14

yt1与

ut的相关性;检验

ut是

否存在自相关。所以应用工具变量法进行估计一阶自回归模型,就是在进行参数估计的过程中选择适当的工具变量,代替回归模型中同随机扰动项存在相关性的解释变量。

7.4叙述用阿尔蒙多项式法估计外生变量有限分布滞后模型的方法步骤,对多项式的次数m有哪些限制,为什么?

答:阿尔蒙多项式法的目的是消除多重共线性的影响。

其基本原理:在有限分布滞后模型滞后长度s 已知的情况下,滞后项系数有一取值结构,把它看成是相应滞后期i的函数。在以滞后期i为横轴、滞后系数取值为纵轴的坐标系中,如果这些滞后系数落在一条光滑曲线上,或近似落在一条光滑曲线上,则可以由一个关于i的次数较低的m次多项式很好地逼近,即 :

i01i2i2mim,i0,1,2,,s;ms

将阿尔蒙多项式变换代入分布滞后模型并整理,模型变为如下形式:

yt0z0t1z1t2z2tmzmtut,z0txtxt1xt2xtsz1txt12xt23xt3sxtsz2txt12xt23xt3sxtszmtxt12mxt23mxt3smxts对于变换后的模型,在满足古典假定的条件下,可用最小二乘法进行估计。将估计的参数代入阿尔蒙多项式,就可求出原分布滞后模型参数的估计值。

在实际应用中,阿尔蒙多项式的次数m通常取得较低,一般取2或3,很少超过4。

7.5考虑如下模型:

Yt1X1t2X2t3Yt1ut222

假定Yt1和ut相关。为了消除相关,采用如下工具变量法:先求Yt对X1t和X2t的回ˆ归,得到Yt的估计值Yt,然后做如下回归:

ˆuYt1X1t2X2t3Yt1t

ˆˆ其中Yt1是第一步粗估计值Yt的滞后值。分析说明该方法为什么可以消除原模型中

15

ˆ和uYt1t之间的相关性。

ˆ答:由于X1t、X2t和ut不相关,Yt作为对X1t和X2t的回归,也与ut不相关,进而

ˆYt1也与ut不相关,因此对式Yt1X1t2X2t3Yt1ut进行回归,可以

消除原模型中Yt1和ut之间的相关性。

7.6 检验一阶自回归模型随机扰动项是否存在自相关,为什么用德宾h-检验而不用DW检验?

答:因为DW检验法不适合于方程含有滞后被解释变量的场合,在自回归模型中,滞后被解释变量是随机变量,已有研究表明,如果用DW检验法,则d统计量值总是趋近于2。也就是说,在一阶自回归中,当随机扰动项存在自相关时,DW检验却倾向于得出非自相关的结论。

德宾提出了检验一阶自相关的h统计量检验法。

ˆhn1nVar()*1d(1)2n1nVar()*1 其中,为随机扰动项一阶自相关系数 的估计量, d为DW统计量,n 为样本容量,Var()为滞后被解释变量Yt1的回归系数的估计方差。

在=0的假定下,h统计量的极限分布为标准正态分布。因此,在大样本情况下,可以用h统计量值判断随机扰动项是否存在一阶自相关。

给定显著性水平,查标准正态分布表得临界值 h。若h> h,则拒绝原假设 ,说明自回归模型存在一阶自相关;若h< h ,则接受原假设=0,说明自回归模型不存在一阶自相关。

*1第八章 虚拟变量回归

8.1什么是虚拟变量?它在模型中有什么作用?

答:虚拟变量是人工构造的取值为0或1的作为属性变量代表的变量。虚拟变量的作用主要有:(1)可以作为属性因素的代表,如性别、所有制等;(2)作为某些非精确计量的数量因素的代表,如受教育程度、管理者素质等;(3)作为某些偶然因素或政策

16

因素的代表,如战争、灾害、改革前后等;(4)可以作为时间序列分析中季节的代表;(5)可以实现分段回归,研究斜率、截距的变动,或比较两个回归模型的结构差异。

8.2虚拟变量为何只选0、1,选2、3、4行吗?为什么?

答:虚拟变量是非此即彼的问题,一般情形下,虚拟变量的取值为0和1。当虚拟变量取值为0时,表示某种属性或状态的类型或水平不出现或不存在;当虚拟变量取值为1时,表示某种属性或状态的类型或水平出现或存在。取值一般不选2、3、4,否则对回归系数的分析带来不便。

8.3对式(8.10)的模型,如果选择一个虚拟变量

1,大专及大专以上 D0,高中1,高中以下这样的设置方式隐含了什么假定?这一假定合理吗?

答:隐含的假定是大专及大专以上的人数和高中以下的人数是相等的,显然这是不合理的。

8.4引入虚拟解释变量的两种基本方式是什么?它们各适用于什么情况?

答:加入虚拟变量的途径有两种基本类型:一是加法类型;二是乘法类型。加法类型适用于截距效应的分析,乘法类型适用于斜率效应的分析。

8.5四种加法方式引入虚拟变量会产生什么效应?

答:四种加法方式引入虚拟变量均改变了截距,可以用于分析虚拟变量不同类之间的水平差异。

8.6引入虚拟被解释变量的背景是什么?含有虚拟被解释变量模型的估计方法有哪些?

答:某经济现象或活动受到多种因素的影响,需要对这一经济现象或活动进行是或否的判断或决策时,需要引入被解释变量。虚拟被解释变量模型的估计方法主要有线性概率模型估计和对数单位模型估计。

8.7设服装消费模型为:Yi12D23D3Xiui,其中,Xi为收入水平;

1,大专及大专以上1,女性Yi为年服装消费支出;D3,D2,试写出不同收入

0,其他0,男性人群组的服装消费函数模型。

17

答:大专以下男性(D20,D30)服装消费模型:Yi1Xiui 大专以下女性(D21,D30)服装消费模型:Yi12Xiui 大专及大专以上男性(D20,D31)服装消费模型:Yi13Xiui 大专及大专以上女性(D21,D31)服装消费模型:Yi123Xiui 8.8利用月度数据资料,为了检验下面的假设,应引入多少个虚拟解释变量? (1)一年里的12个月全部表示出季节模式。

(2)只有2月、6月、8月、10月和12月表现出季节模式。 答:(1)引入11个虚拟变量;(2)引入4个虚拟变量。

18

因篇幅问题不能全部显示,请点此查看更多更全内容