中国国内旅游总花费影响因素分析
精选文档
一、问题提出
1、研究问题
旅游可以促进人力、物力、资源的优化利用,促进当地的相关产业的发展,解决就业问题,提高经济收益等都是大有裨益的。更重要是随着旅游业的发展,当地人的观念将会发生根本改变,即按照市场需求,组织生产,搞活流通,以信息化取代封闭的传统的生产模式。旅游可以使单一资源产生规模效应,扩大单一资源的产品转化和升级,将市场建在家门口,对外提高当地的影响力。旅游业是现代服务业的重要组成部分,带动作用大。加快旅游业改革发展,是适应人民群众消费升级和产业结构调整的必然要求,对于扩就业、增收入,推动中西部发展和贫困地区脱贫致富,促进经济平稳增长和生态环境改善意义重大,对于提高人民生活质量、培育和践行社会主义核心价值观也具有重要作用。
中国旅游业的发展是与改革开放同步进行的。改革开放之前,由于受传统计划体制观念的影响,注重生产轻视消费,旅游被当做一种奢侈品而遭到排斥,同时,国内生活水平普遍较低,对外又采取闭关锁国政策,因此,旅游产业的发展缺乏必要的物质基础和政治条件。改革开放以后,随着中国经济的发展,一方面,国民经济建设需要大量的资金;另一方面,由于对外开放的大门打开,境外游客和资本急于进入中国,从而为中国的旅游业形成创造了良好的内外条件和环境。本文通过对国内旅游总花费的影响因素展开研究,运用建立多元线性回归模型的方法,探讨影响国内旅游总花费的主要因素,并对这些因素进行分析。
2、数据来源(1994-2013,国家统计局)
Y国内旅游总花费(亿元) X1国内生产总值(亿元) X2平均工资(元) X3客运量(万人)x4国内游客(百万人次) x5居民消费价格指数(上年=100)
— 2
精选文档
国内旅游年 份 总花费(亿元) 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 1023.5 1375.7 1638.4 2112.7 2391.2 2831.9 3175.5 3522.4 3878.4 3442.3 4710.7 5285.9 6229.7 7770.6 8749.3 10183.7 12579.8 19305.4 22706.2 26276.1 国内生产总平均工客运量(万人) 1092882 1172596 1245357 1326094 1378717 1394413 1478573 1534122 1608150 1587497 1767453 1847018 2024158 2227761 2867892 2976898 3269508 3526319 3804035 2122992 国内游客(百万人次) 524 629 640 644 695 719 744 784 878 870 1102 1212 1394 1610 1712 1902 2103 2641 2957 3262 居民消费价格指数(1987年=100) 270.4 396.9 429.9 441.9 438.4 432.2 434.0 437.0 433.5 438.7 455.8 464.0 471.0 493.6 522.7 519.0 536.1 565.0 579.7 594.8 值(亿元) 资(元) 48197.9 60793.7 71176.6 78973.0 84402.3 89677.1 99214.6 109655.2 120332.7 135822.8 159878.3 184937.4 216314.4 265810.3 314045.4 340902.8 401512.8 473104.0 519470.1 568845.2 5120 5348 5980 6444 7446 8319 9333 10834 12373 13969 15920 18200 20856 24721 28898 32244 36539 41799 46769 51483 3、定性分析
为了研究国内旅游总花费的影响因素,把国内旅游总花费(亿元)作为被解释变量y,将国内生产总值(亿元)、平均工资(元)、客运量(万人)、国内游客(百万人次)、居民消费价格指数(上年=100)作为解释变量,分别设为x1,x2、x3、x4、x5,假定其多元线性回归模型表示为:
y = β0 +β1x1 + β2x2 + β3x3 +β4x4 +β5x5
—
3
精选文档
二、相关分析
1、 数据基本描述
Descriptive Statistics 国内旅游总花费(亿元) 国内生产总值(亿元) 平均工资(元) 客运量(万人) 国内游客(百万人次) 居民消费价格指数(上年=100) 2、 相关分析
利用散点图、简单相关系数检验被解释变量y和解释变量x1, x2, x3, x4, x5之间的关系。
根据散点图可以看出,国内旅游总花费y与国内生产总值x1、平均工资x2、客运量x3、国内游客x4、居民消费价格指数x5成正相关。
Mean 7.4595E3 2.1715E5 2.01E4 2.0126E6 1.3511E3 4.6773E2 Std. Deviation 7351.58315 1.64588E5 14745.147 8.31668E5 834.46503 73.11847 N 20 20 20 20 20 20
—
4
精选文档
Correlations
国内旅居民消游总花国内生客运量国内游客费价格费(亿产总值平均工(万(百万人指数(上元) (亿元) 资(元) 人) 次) 年=100) 1.000 .974 .968 .785 .986 .855 . .000 .000 .000 .000 .000 20 20 20 20 20 20 .974 1.000 .999 .875 .996 .895 .000 . .000 .000 .000 .000 20 20 20 20 20 20 .968 .999 1.000 .994 .891 .000 .000 . .000 .000 .000 20 20 20 20 20 20 .785 .875 .875 .847 .814 .000 .000 .000 . .000 .000 20 20 20 20 20 20 .986 .996 .994 .847 1.000 .886 .000 .000 .000 .000 . .000 20 20 20 20 20 20 .855 .895 .891 .814 .886 1.000 .000 .000 .000 .000 .000 . 20 20 20 20 20 20 Pearson 国内旅游总花费y
Correlat国内生产总值x1 ion
平均工资x2
客运量x3 国内游客x4 居民消费价格指数(上年=100)x5
Sig. 国内旅游总花费y (1-taile国内生产总值x1 d)
平均工资x2
客运量x3 国内游客x4 居民消费价格指数(上年=100)x5
N
国内旅游总花费y 国内生产总值x1 平均工资x2 客运量x3 国内游客x4 居民消费价格指数(上年=100)x5
.875 1.000 从相关系数表中可以看出国内旅游总花费y与国内生产总值x1、平均工资x2、国内游客x4的相关系数都在0.9以上,高度相关;国内旅游总花费y与居民消费价格指数x5的相关系数在0.8以上,相关性也很强,国内旅游总花费y与客运量x3的相关系数在0.7以上,具有一定的相关性。所以,国内旅游总花费y与这五个自变量做回归分析是合适的。
—
5
精选文档
三、模型建立
根据之前建立的模型y = β0 +β1x1 + β2x2 + β3x3 +β4x4 +β5x5 ,利用SPSS,采用强行进入的方法进行多元线性回归,得到结果如下: 1、拟合优度检验
Model Summaryb Change Statistics Sig. AdjustStd. Error F R ed R of the R Square ChangDurbin-R Square Square Estimate Change F Change df1 df2 e Watson .993aModel 1 .987 .982 987.66685 .987 207.735 5 14 .000 .584 a. Predictors: (Constant), 居民消费价格指数(上年=100), 客运量(万人), 国内游客(百万人次) , 平均工资(元), 国内生产总值(亿元) b. Dependent Variable: 国内旅游总花费(亿元)
从上表可以看出,方程的复相关系数R=0.993,样本决定系数R2=0.987,调整后的样本决定系数为0.982,说明方程拟合优度很好。
ANOVAb
Model 1
Regression Residual Total
Sum of Squares 1.013E9 1.366E7 1.027E9 df
Mean Square 5 F
Sig. .000a 2.026E8 207.735
14 975485.806 19
a. Predictors: (Constant), 居民消费价格指数(上年=100), 客运量(万
人), 国内游客(百万人次) , 平均工资(元), 国内生产总值(亿元) b. Dependent Variable: 国内旅游总花费(亿元)
由ANOVA表可知,在0.05的显著性水平下,F值=207.735,P值为0.000,说明回归方程高度显著,x1, x2, x3, x4, x5整体上对y有高度显著的线性影响。
—
6
精选文档
回归系数的检验
Coefficientsa Standardized Coefficients Beta t Unstandardized Coefficients Model 1 (Constant) 国内生产总值x1 平均工资x2 客运量x3 国内游客x4 居民消费价格指数(上年=100)x5 B Std. Error Correlations Collinearity Statistics VIF Zero-PartiTolerSig. order al Part ance -2265.053 3283.235 .042 -.653 -.001 13.137 -3.988 .038 -.690 .502 .934 1.088 .295 .974 .279 .034 .001 776.155 .293 -1.310 -2.226 .043 .968 -.511 -.069 .003 364.442 .001 -.117 -1.426 .176 .785 -.356 -.044 .142 7.038 4.169 1.491 3.151 .007 .986 .644 .097 .004 235.720 7.094 -.040 -.562 .583 .855 -.149 -.017 .191 5.241 a. Dependent Variable: 国内旅游总花费(亿元)
通过表格,我们看到平均工资x2、国内游客x4的回归检验系数P值小于0.05,通过检验。而常数项、国内生产总值x1、客运量x3、居民消费价格指数x5系数检验P值均大于0.05,未通过检验。
4、残差分析——正态性检验
根据直方图和正态概率分布图可以看到,残差基本上符合正态性假设。
— 7
—
精选文档
8
精选文档
5、残差分析——异方差检验
—
9
Correlations
国内生居民消精选文档 产总值国内游费价格(亿平均工客运量客(百万指数(上
ABSE 元) 资(元) (万人) 人次) 年=100) 1.000 . 20 .158 .506 20 .158 .506 20 .229 .332 20 .967** .000 20 .967** .000 20 1.000 . 20 .968** .000 20 .910** .000 20
.156 .510 20 .998** .000 20 .998** .000 20 .968** .000 20 1.000 . 20 .941** .000 20 -.008 .975 20 .947** .000 20 .947** .000 20 .910** .000 20 .941** .000 20 1.000 . 20 SpearmABSE
an's rho
Correlation Coefficient Sig.
(2-tailed) N
国内生产总Correlation 值x1 Coefficient
Sig.
(2-tailed) N
平均工资x2 Correlation
Coefficient
Sig.
(2-tailed) N
客运量x3
Correlation Coefficient Sig.
(2-tailed) N
国内游客x4 Correlation
Coefficient
Sig.
(2-tailed) N
居民消费价Correlation 格指数(上年Coefficient =100)x5 Sig.
(2-tailed) N
**. Correlation is significant at
the 0.01 level (2-tailed).
.158 1.000 1.000** .506 20 . 20 . 20 .158 1.000** 1.000 .506 20 . 20 . 20 .229 .967** .967** .332 20 .000 20 .000 20 .156 .998** .998** .510 20 .000 20 .000 20 -.008 .947** .947** .975 20 .000 20 .000 20
由残差图可知,残差图上的点的散布是随机的,不太有规律;由Correlations表可知,残差绝对值与x1, x2, x3, x4,x5的相关系数分别为0.158,0.158,
—
10
精选文档
0.229,0.156,-0.08,相应的P值均大于0.05,说明残差绝对值与自变量x1, x2, x3, x4,x5之间显著不相关。故综上所述,不存在异方差。
6、自相关性检验 Model Summaryb Change Statistics Sig. AdjustStd. Error F R ed R of the R Square ChangDurbin-R Square Square Estimate Change F Change df1 df2 e Watson .993aModel 1 .987 .982 987.66685 .987 207.735 5 14 .000 .584 a. Predictors: (Constant), 居民消费价格指数(上年=100), 客运量(万人), 国内游客(百万人次) , 平均工资(元), 国内生产总值(亿元) b. Dependent Variable: 国内旅游总花费(亿元)
— 11
精选文档
从模型汇总表中可知,D.W值为0.584,查D.W表,当n=20,k=5时,dL=0.90,du= 1.83, D.W=0.584<dL,且滞后残差图呈正相关关系,所以模型存在正自相关性。
7、共线性诊断
— 12
Coefficientsa Standardized Coefficients Beta t 精选文档 Unstandardized Coefficients Model 1 (Constant) 国内生产总值x1 平均工资x2 客运量x3 国内游客x4 居民消费价格指数(上年=100)x5 B Std. Error Correlations Collinearity Statistics VIF Zero-PartiTolerSig. order al Part ance -2265.053 3283.235 .042 -.653 -.001 13.137 -3.988 .038 -.690 .502 .934 1.088 .295 .974 .279 .034 .001 776.155 .293 -1.310 -2.226 .043 .968 -.511 -.069 .003 364.442 .001 -.117 -1.426 .176 .785 -.356 -.044 .142 7.038 4.169 1.491 3.151 .007 .986 .644 .097 .004 235.720 7.094 -.040 -.562 .583 .855 -.149 -.017 .191 5.241 a. Dependent Variable: 国内旅游总花费(亿元) Collinearity Diagnosticsa Variance Proportions Dime国内生居民消费价格nsioEigenvaConditio(Constan产总值平均工客运量(万国内游客指数(上年Model n lue n Index t) (亿元) 资(元) 人) (百万人次) =100) 1 1 2 3 4 5 6 5.622 .345 .028 .003 .001 1.000 4.037 14.064 44.309 68.413 .00 .01 .01 .52 .14 .33 .00 .00 .00 .00 .00 1.00 .00 .00 .00 .00 .35 .64 .00 .00 .56 .02 .22 .20 .00 .00 .00 .02 .46 .52 .00 .00 .01 .93 .01 .05 .000 139.200 a. Dependent Variable: 国内旅游总花费 (亿元)
由Coefficients表可以看出x1,x2,x4的VIF值都大于10,所以存在严重的多重共线性。由Collinearity Diagnostics表可知,自变量x2,x3, x4, x5的条件数均大于10,进一步说明自变量之间存在严重的多重共线性。
—
13
精选文档
8、异常值检验
年 份 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
SDR_1 -0.25782 -0.98394 -0.63624 -0.04643 0.038627 0.524824 0.927193 1.451298 1.179306 1.340228 -0.14771 -0.48088 -1.45338 -2.10149 -0.76643 -0.63843 -0.23033 0.398954 2.158468 0.967995 COO_1 0.23288153 0.03811258 0.01869595 1.51E-04 5.15E-05 0.00577236 0.01485042 0.03467744 0.04201566 0.09161782 9.20E-04 0.00775347 0.06653409 0.04287897 0.03293286 0.02077564 0.00978043 0.0171609 0.86018878 7.68762598 LEV_1 0.901502 0.140719 0.159692 0.230634 0.111378 0.056532 0.043058 0.046323 0.107059 0.194394 0.140573 0.109754 0.119438 0.017574 0.196119 0.176539 0.457713 0.328132 0.532865 0.930002 从上表可知,所有数据的删除学生化残差绝对值都小于3,除2013年库克距离都小于0.5,该模型存在异常值。 四、模型修改
1.全模型存在的问题
(1)常数项、国内生产总值x1、旅客运输平均距离x3、居民消费价格指数
x5系数检验P值均大于0.05,未通过检验; (2)存在自相关性;
(3)自变量之间存在严重的多重共线性; (4)2013年存在异常值。 2. 修改
利用SPSS软件采用逐步回归的方式,得到以下结果并加以分析。
— 14
精选文档
(1)拟合优度检验
Variables Entered/Removeda
Model Variables Entered 1
国内游客(百万人次)x4 2
平均工资(元)x2
Variables Removed
Method
Stepwise (Criteria:
Probability-of-F-to-enter <= .050, . Probability-of-F-to-remove >= .100).
Stepwise (Criteria:
Probability-of-F-to-enter <= .050, . Probability-of-F-to-remove >= .100).
a. Dependent Variable: 国内旅游总花费(亿元) Model Summaryc Change Statistics R AdjusSquarted R e DurbiR SquarStd. Error of ChangSig. F n-WatSquare e the Estimate e F Change df1 df2 Change son .972 .970 1269.59516 .972 619.067 .984 .982 974.59357 .013 13.546 1 1 18 17 .000 .002 .711 Model 1 2 R .986a .992b a. Predictors: (Constant), 国内游客(百 万人次) b. Predictors: (Constant), 国内游客(百万人次) , 平均工资(元)
c. Dependent Variable: 国内旅游总花费(亿元) 由Model Summary表可知,方程的复相关系数R=0.986,样本决定系数为R2
为0.972,调整后的样本决定系数为0.970,说明方程拟合程度很好。
—
15
精选文档
(2)回归方程显著性检验 ANOVAc Model 1 Regression Residual Total 2 Regression Residual Total Sum of Squares 9.979E8 2.901E7 1.027E9 1.011E9 1.615E7 1.027E9 df 1 18 19 2 17 19 Mean Square F Sig. .000a 9.979E8 619.067 1611871.858 5.054E8 532.053 949832.628 .000 ba. Predictors: (Constant), 国内游客 x4 c. Dependent Variable: 国内旅游总花费 y
b. Predictors: (Constant), 国内游客 x4, 平均工资 x2 由ANOVA表可知,在0.05的显著性水平下,F值为532.053,P值为0.000,远小于0.005,所以回归方程高度显著,说明x2、x4整体上对y有高度显著的线性影响。
(3)回归系数检验
—
16
精选文档
Coefficientsa Standardized Coefficients Beta t Unstandardized Coefficients Model 国内游客 x4 国内游客 x4 平均工资 x2 B 8.685 17.822 -.520 Std. Error Collinearity Correlations Statistics Zero-PartTolerSig. order ial Part ance VIF 1 (Constant) -4274.271 550.449 .349 2 (Constant) -6150.148 662.057 -7.765 .000 -9.289 .000 .986 24.881 .000 .986 .986 .986 1.000 1.000 2.497 2.023 7.137 .000 .986 .866 .217 .012 86.857 -.66.141 -1.043 -3.681 .002 .968 -.112 .012 86.857 6 a. Dependent Variable: 国内旅游总 花费 y
由Coefficients表可知,常数项、平均工资x2和国内游客x4的回归系数检验的P值均小于0.05,所以通过检验。故综上述,该问题的最小二乘回归模型为:
y = -6150.148-0.52x2+17.822x4
(4)残差分析——正态性检验
根据直方图和正态概率分布可以看出,残差基本上符合正态性假设。
— 17
精选文档
—
18
精选文档
(5)残差分析——异方差性检验
Correlations
Spearman's rho
ABSE
Correlation Coefficient Sig.
(2-tailed) N
平均工资 Correlation x2 Coefficient
Sig.
(2-tailed) N
国内游客 Correlation x4 Coefficient
ABSE 1.000 . 20 .195 .409 20 .191 平均工资 x2 国内游客 x4
.195 .409 20 1.000 . 20 .998** .191 .420 20 .998** .000 20 1.000 — 19
精选文档
Sig.
(2-tailed) N
.420 20 .000 20
. 20 **. Correlation is significant at the 0.01 level (2-tailed).
由残差图可知,残差图上的点的散布是随机的,无任何规律;由
Correlations表可知,残差绝对值与x2, x4的相关系数分别为0.195,0.191,相应的P值均大于0.05,说明残差绝对值与各自变量之间显著不相关。故综上所述,认为不存在异方差。
(6)残差分析——自相关性检验 Model Summaryc Model 1 2 R .986a .992b Adjusted R Std. Error of the R Square Square Estimate Durbin-Watson .972 .984 .970 .982 1269.5952 974.5936 .711 a. Predictors: (Constant), 国内游客 x4 b. Predictors: (Constant), 国内游客 x4, 平均工资 x2 c. Dependent Variable: 国内旅游总花费 y D.W值为0.711,查D.W表,n=20,k=2,dl=1.20,du=1.41,D.W=0.711<dL,模型存在正自相关性,用迭代法解决。通过进一步考察自相关系数,ρ≈1-1/2D.W=1-0.5*0.711=0.6445。求出相关系数ρ后,做变量变换:
yi,= yi-ρyi-1 ;xi,= xi-ρxi-1
如果方程通过D.W 检验 , 迭代 结 束 , 否 则 , 继续 重 复 上 述 过 程,直到 通过D.W 检验 。
(7)多重线性检验
— 20
精选文档
Coefficientsa Standardized Coefficients Beta t Unstandardized Coefficients Model 国内游客 x4 国内游客 x4 平均工资 x2 B 8.685 17.822 -.520 Std. Error Collinearity Correlations Statistics Zero-PartTolerSig. order ial Part ance VIF 1 (Constant) -4274.271 550.449 .349 2 (Constant) -6150.148 662.057 -7.765 .000 -9.289 .000 .986 24.881 .000 .986 .986 .986 1.000 1.000 2.497 2.023 7.137 .000 .986 .866 .217 .012 86.857 -.66.141 -1.043 -3.681 .002 .968 -.112 .012 86.857 6 a. Dependent Variable: 国内旅游总 花费 y Collinearity Diagnosticsa Variance Proportions DimenEigenvaluCondition (Constant国内游客(百Model sion e Index ) 万人次) 1 2 1 2 1 2 3
由Coefficients表可知,各个自变量的VIF均大于10;由Collinearity Diagnostics表可知,共线性诊断中条件数有一个在40附近。综上述,说明自变量间存在多重共线性。为了消除共线性,接下来我们剔除解释变量x2。
(8)异常值检验
—
21
平均工资(元) 1.857 .143 2.780 .219 .002 1.000 3.600 1.000 3.564 40.430 .07 .93 .01 .34 .65 .07 .93 .00 .00 1.00 .00 .00 1.00 a. Dependent Variable: 国内旅游总花费(亿元) 精选文档
年 份 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013
SDR_2 0.528849 -1.0255 -0.55163 0.145612 0.029302 0.520868 0.982475 1.480207 0.863414 1.599435 -0.51511 -0.72747 -1.81281 -2.25004 -0.64923 -0.90362 0.305616 0.141964 0.577889 1.50316 COO_2 0.011608 0.077636 0.018073 0.001036 3.78E-05 0.009422 0.027359 0.062318 0.01998 0.169012 0.005408 0.01097 0.050985 0.079433 0.032751 0.067802 0.014638 0.001743 0.048942 0.527717 LEV_2 0.056533 0.131763 0.095951 0.071347 0.060696 0.040677 0.02822 0.033667 0.023388 0.12788 0.005273 0.007017 0.000155 0.005105 0.133785 0.147703 0.258001 0.146448 0.24698 0.379412 由上表可知,所有数据的删除学生化残差的绝对值均小于3,库克距离也均小于0.5,故数据不存在异常值。
五、模型修改
1.模型存在的问题
(1)自变量之间仍存在多重共线性; 2. 修改
剔除解释变量x2,利用SPSS软件采用逐步回归的方式,得到以下结果并加以分析。
(1) 拟合优度检验
—
22
精选文档
Variables Entered/Removeda Model 1 Variables Entered 国内游客(百万人次)x4 Variables Removed Method Stepwise (Criteria: . Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100). Stepwise (Criteria: . Probability-of-F-to-enter <= .050, Probability-of-F-to-remove >= .100). 2 客运量(万人)x3 a. Dependent Variable: 国内旅游总花费(亿元)y Model Summaryc Change Statistics Sig. AdjustStd. Error F ed R of the R Square ChangDurbin-R Square Square Estimate Change F Change df1 df2 e Watson .972 .981 .970 1269.59516 .978 1084.58337 .972 619.067 .009 7.665 1 18 .000 1 17 .013 .601 Model 1 2 R .986a .990b a. Predictors: (Constant), 国内游客(百万 人次)x4 b. Predictors: (Constant), 国内游客(百万人次)x4, 客运量(万人)x3 c. Dependent Variable: 国内旅游总花费(亿元)y
由Model Summary表可知,方程的复相关系数R=0.986,样本决定系数为R2为0.972,调整后的样本决定系数为0.970,说明方程拟合程度很好。
(2)回归方程显著性检验
—
23
精选文档
ANOVAc Model 1 Regression Residual Total 2 Regression Residual Total Sum of Squares 9.979E8 2.901E7 1.027E9 1.007E9 2.000E7 1.027E9 df 1 19 2 19 Mean Square F .000b Sig. .000a 9.979E8 619.067 18 1611871.858 5.034E8 427.975 17 1176321.086 a. Predictors: (Constant), 国内游客(百万人次)x4 b. Predictors: (Constant), 国内游客(百万人次)x4, 客运量(万 人)x3 c. Dependent Variable: 国内旅游总花费(亿元)y
由ANOVA表可知,在0.05的显著性水平下,F值为619.067,P值为0.000,远小于0.005,所以回归方程高度显著,说明x2、x4整体上对y有高度显著的线性影响。
(3)回归系数检验
—
24
精选文档
Coefficientsa Standardized Coefficients Beta t Unstandardized Coefficients Model 1 国内游客(百万人次)x4 2 国内游客(百万人次)x4 客运量(万人)x3 B Std. Error Collinearity Correlations Statistics Zero-PartToleraSig. order ial Part nce VIF (Constant) -4274.271 550.449 8.685 .349 -7.765 .000 .986 24.881 .000 .986 .986 .986 1.000 1.000 -4.292 .000 .283 3.528 .283 3.528 (Constant) -2916.426 679.462 9.997 -.002 .560 1.135 17.849 .000 .986 .974 .604 -.55-.09.001 -.176 -2.769 .013 .785 7 4 a. Dependent Variable: 国内旅游总花 费(亿元)y
由Coefficients表可知,常数项、平均工资x2和国内游客x4的回归系数检验的P值均小于0.05,所以通过检验。故综上述,该问题的最小二乘回归模型为:
y = -2916.426-0.002 x3+9.997x4
(4)残差分析——正态性检验
根据直方图和正态概率分布可以看出,残差基本上符合正态性假设。
— 25
—
精选文档
26
精选文档
(5)残差分析——异方差性检验
Correlations
E
Spearman's E rho
Correlation Coefficient Sig. (2-tailed) N
客运量Correlation (万人)Coefficient x3 Sig. (2-tailed) N
国内游客Correlation (百万人Coefficient
客运量(万人)x3 国内游客(百万人次)x4 .589** .006 20 1.000 . 20 .968** .471* .036 20 .968** .000 20 1.000 1.000 . 20 .589** .006 20 .471* — 27
精选文档
次)x4 Sig. (2-tailed) N .036 20 .000 20 . 20 **. Correlation is significant at the 0.01 level (2-tailed). *. Correlation is significant at the 0.05 level (2-tailed).
由残差图可知,残差图上的点的散布是随机的,无任何规律;由Correlations表可知,残差绝对值与x3, x4的相关系数分别为0.589,0.471,相应的P值均大于0.05,说明残差绝对值与各自变量之间显著不相关。故综上所述,认为不存在异方差。
(6)残差分析——自相关性检验
Model Summaryc Change Statistics Sig. AdjustStd. Error F ed R of the R Square ChangDurbin-R Square Square Estimate Change F Change df1 df2 e Watson .972 .981 .970 1269.59516 .978 1084.58337 .972 619.067 .009 7.665 1 18 .000 1 17 .013 .601 Model 1 2 R .986a .990b a. Predictors: (Constant), 国内游客(百万 人次)x4 b. Predictors: (Constant), 国内游客(百万人次)x4, 客运量(万人)x3 c. Dependent Variable: 国内旅游总花费(亿元)y D.W值为0.601,查D.W表,n=20,k=2,dl=1.20,du=1.41,D.W=0.601<dL,模型存在正自相关性,用迭代法解决。通过进一步考察自相关系数,ρ≈1-1/2D.W=1-0.5*0.601=0.6995。求出相关系数ρ后,做变量变换:
yi,= yi-ρyi-1 ;xi,= xi-ρxi-1
如果方程通过D.W 检验 , 迭代 结 束 , 否 则 , 继续 重 复 上 述 过 程,直到 通过D.W 检验 。
—
28
精选文档
第一次迭代: Model Summaryb Model 1 R Adjusted R R Square Square .965 .961 Std. Error of the Estimate 646.74416 Durbin-Watson .822 .983a a. Predictors: (Constant), x4', x3' b. Dependent Variable: Y' D.W值为0.822,查D.W表,n=19,k=2,dl=1.18,du=1.40,D.W=0.822<dL,模型存在正自相关性,用迭代法解决。通过进一步考察自相关系数,ρ≈1-1/2D.W=1-0.5*0.822=0.0.589。求出相关系数ρ后,做变量变换:
yi,= yi-ρyi-1 ;xi,= xi-ρxi-1
第二次迭代: Model Summaryb Model 1 R Adjusted R Std. Error of the R Square Square Estimate .933 .924 519.98866 Durbin-Watson 1.765 .966a a. Predictors: (Constant), x4'', x3'' b. Dependent Variable: y'' D.W值为1.765,查D.W表,n=18,k=2,dl=1.16,du=1.39,du (7)多重线性检验 Coefficientsa — 29 精选文档 Unstandardized Coefficients Std. Error Standardized Coefficients Collinearity Correlations Statistics Zero-ordPartiTolerSig. er al Part ance VIF Model 1 国内游客(百万人次)x4 2 国内游客(百万人次)x4 客运量(万人)x3 B Beta t (Constant) -4274.271 550.449 8.685 .349 -7.765 .000 .986 24.881 .000 .986 .986 .986 1.000 1.000 -4.292 .000 (Constant) -2916.426 679.462 9.997 -.002 .560 1.135 17.849 .000 .986 .974 .604 .283 3.528 .001 -.176 -2.769 .013 .785 -.557 -.094 .283 3.528 a. Dependent Variable: 国内旅游总花费 (亿元)y Collinearity Diagnosticsa Variance Proportions Dime nsioCondition (Constant国内游客(百万客运量(万人)n Eigenvalue Index ) 人次)x4 x3 1 2 2 1 2 3 由Coefficients表可知,各个自变量的VIF均小于10;由Collinearity Diagnostics表可知,共线性诊断中条件数均在10附近。综上述,说明自变量间不存在多重共线性。 Model 1 1.857 .143 2.829 .146 .026 1.000 3.600 1.000 4.406 10.527 .07 .93 .01 .51 .48 .07 .93 .01 .21 .78 .00 .00 .99 a. Dependent Variable: 国内旅游总花费(亿元)y — 30 精选文档 (8)异常值检验 年 份 1994 1995 1996 1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 SDR_3 0.383726 -0.1624 0.088626 0.620679 0.475016 0.691506 0.911909 0.943625 0.484398 0.121457 -0.5953 -0.98458 -1.62555 -1.99794 -0.98148 -1.30126 -0.44288 1.405522 2.484153 -0.39597 COO_3 0.00671 0.001079 2.94E-04 0.013171 0.007252 0.014715 0.02368 0.02398 0.005874 3.78E-04 0.007149 0.017788 0.042543 0.06594 0.052948 0.088227 0.016813 0.180135 0.663457 0.747914 LEV_3 0.064931 0.053715 0.045737 0.039965 0.034271 0.032136 0.027986 0.024308 0.016925 0.017594 0.005019 0.002087 3.02E-04 0.005069 0.091292 0.089923 0.146778 0.174356 0.246094 0.881511 由上表可知,所有数据的删除学生化残差的绝对值均小于3,库克距离也均小于0.5,故数据不存在异常值。 综上所述,该问题的回归模型是: y = -1693.9-0.002 x3+9.997x4 四、回归方程的经济意义分析 从所得到的回归方程可以看出,影响国内旅游总花费的因素主要有国内游客人数和客运量。由回归系数表可以看出,对国内旅游总花费影响最明显的是国内游客人数,客运量的影响相对较小。在其他因素不变的情况下,国内游客每增加一百万人,国内旅游总花费增加9.997亿元。建立模型过程中删除了国内生产总值、居民消费价格指数和人均收入三个因素,说明这三个因素对国内旅游总花费的影响不如前两者明显,这也很符合现实意义。 — 31 因篇幅问题不能全部显示,请点此查看更多更全内容