因子分析法在评价江西省各市的经济发展状况中的应用
信息管理学院 管理科学 yxs001
【摘要】: 本文以2005年的江西省统计年鉴的数据为来源,通过对江西省各市多项经济指标进行因子分析,运用社会经济统计软件SPSS 12.0,客观地评价了2004年江西省各市经济发展水平,并为江西省各市经济发展规划与决策提出了相应的政策建议。
【关键词】:因子分析、综合评价、区域经济
一、因子分析法的基本思想
因子分析的基本思想:通过变量的相关系数矩阵内部结构的研究,找出能够控制所有变量的少数几个随机变量的少数几个随机变量去描述多个变量之间的相关关系,但在这里,这少数.几个随机变量是不可观测的,通常称为因子。然后根据相关性的大小把变量分组,只得同组内的变量之间相关性较高,但不同组的变量相关性较低。
因子旋转,在实际应用因子分析中出现了难以解释的现象,根本原因是模型同实际数据的矛盾,而其直接原因表现在因子对变量的贡献不明确。于是设想在不改变因子协方差结构的情况下,通过旋转坐标轴来实现这一目的。
因子分析方法的计算步骤: 第一步:将原始数据标准化。 第二步:建立变量的相关系数R。
第三步:求R的特征根极其相应的单位特征向量。 第四步:对因子载荷阵施行最大正交旋转。 第五步:计算因子得分。
二、确立指标体系
本文运用多元统计学中的因子分析法,对江西省11个城市的经济情况进行分析,按经济综合实力评价各市在全省的地位,并为江西省各市经济发展规划与决策提出了相应的政策建议。在本文中选取了能足够反映经济发展总水平的7项主要指标(均以万元为单位),指标来源于2005年江西统计年鉴,所选取的指标如下:
X:农业总产值 x2:工业总产值 x3:建筑业总产值 x4:固定资产投资
x5:固定资产投资 x6:批零贸易餐饮业产值 x7:金融保险业总产值
数据如下: 单位(万元) 市区 农业总产值 工业总产值 3060760 649538.0 923791.0 1245152 619000.0 416628.0 946503.0 494037.0 953383.0 619309.0 967518.0 建筑业总产值 979844.0 222159.0 89989.00 522001.0 118400.0 30378.00 350228.0 294556.0 161588.0 240417.0 219508.0 固定资产投资 427383.0 84454.00 102558.0 271379.0 85428.00 117083.0 325334.0 131430.0 189587.0 89531.00 159839.0 交通运输邮电业产值 824349.0 163341.0 104838.0 342665.0 80253.00 49115.00 248270.0 158179.0 199583.0 59561.00 292811.0 批零贸易餐饮业产值 467139.0 139763.0 41377.00 118905.0 57100.00 30059.00 106856.0 107862.0 115380.0 40856.00 74265.00 金融保险业总产值 3383170 880327.0 942028.0 1434454 574015.0 413430.0 1450835 1029173 1027284 888795.0 1379343 南 昌 市 594005.0 景德镇市 159019.0 萍 乡 市 196176.0 九 江 市 554155.0 新 余 市 181000.0 鹰 潭 市 155488.0 赣 州 市 1126049 吉 安 市 742790.0 宜 春 市 885586.0 抚 州 市 630100.0 上 饶 市 708208.0 三、数据的因子分析
1、判断数据是否适合因子分析 KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy.
.793 Bartlett's Test Approx.
95.879 of Sphericity Chi-Square
df 21 Sig. .000 由表可知,KMO 统计量为0.793>0.7,因子分析的效果比较好,在由Bartlett球形检验,可知各变量的独立性假设不成立,故因子分析的适用性检验通过。
2、计算因子载荷和共同度
Total Variance Explained Extraction Sums of Squared Component Initial Eigenvalues Loadings % of Cumulative% of Cumulative Total Variance % Total Variance % 1 5.686 81.236 81.236 5.686 81.236 81.236 2 1.005 14.358 95.594 1.005 14.358 95.594 3 .130 1.860 97.454 4 .087 1.239 98.693 5 .059 .846 99.540 6 .023 .330 99.870 7 .009 .130 100.000 Extraction Method: Principal Component Analysis. 由相关系数矩阵R计算得到特征值、方差贡献率和累积贡献率,如上图所示,可知第一因子的方差占所有因子方差的81.2%左右,前两个因子的方差贡献率达到了95.59%,因此选前两个因子已经足够描述经济发展的总体水平。提取了两个公因子之后可以计算共同度,如下所示,
Communalities农业总产值工业总产值建筑业总产值固定资产投资交通运输邮电业产值批零贸易餐饮业产值金融保险业总产值Initial1.0001.0001.0001.0001.0001.0001.000Extraction.986.965.934.908.980.940.979Extraction Method: Principal Component Analysis. 从表中可以看出所有的共同度都在90%以上,可知被提取的公因子对各变量的解释能力是非常强的。
3、因子旋转
采用主成分法计算的因子载荷矩阵可以说明各因子在各变量上的载荷,即影响程度。但为了使载荷矩阵中系数向0—1分化,对初始因子载荷矩阵进行方差最大旋转,旋转后的因子载荷矩阵如下所示:
aRotated Component MatrixComponent1农业总产值工业总产值建筑业总产值固定资产投资交通运输邮电业产值批零贸易餐饮业产值金融保险业才产值.114.979.943.817.974.968.9612.986.073.210.490.176.045.237 由输出的表可以看出,第一公因子在除x1之外的其他变量上都有较大的载荷,主要表现在除农业以外的各经济指标,即工业,建筑业 ,第三产业和固定资产方面的指标,因此可以定义为经济发展的综合实力因子。第二公因子在X2上有很大的载荷,体现在农业在经济发展中的应用,定义为农业发展影响因子。这两个因子的性质及其顺序较好的体现了其所代表的产业对社会经济发展的影响及其地位,也完全符合社会经济发展的规律,即农业整体在经济中的地位逐渐的降低,而工业和第三产业的比重逐渐的增大,在社会发展的作用也越来越显著。
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.a. Rotation converged in 3 iterations.4、计算因子得分,对个地区经济的发展水平综合评价
为了考察各地区的发展状况,并对其进行分析和综合评价,采用回归法求出因子得分函数,spss输出的函数系数矩阵如下表
Component Score Coefficient MatrixComponent农业总产值工业总产值建筑业总产值固定资产投资交通运输邮电业产值批零贸易餐饮业产值金融保险业总产值1-.185.216.178.088.193.219.1762.897-.141-.006.282-.044-.166.016Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores. 由系数矩阵将两个公因子表示为7个指标的线性形式。因子得分的函数为: F1=-0.185X1+0.216X2+0.178X3+0.088X4+0.193X5+0.219X6+0.176X7 F2=0.897X1-0.141X2-0.006X3+0.282X4-0.044X5-0.166X6+0.016X7
Spss已经计算出两个因子的得分,两个因子分别从不同的方面反映了江西省各地区的经济发展状况的总水平,但单独使某一公因子并不能对各区在全省中的地位作出综合的评价,因此按各公因子对应的方差贡献率为权数计算如下综合统计量:
F=0.798058F1+0.201942F2
通过计算得可以得到综合得分,并求出各地区的排序。 地区 Fac1_1 Fac2_1 综合得分 排名 南 昌 市 2.87064 -0.2084 2.248853 1 景德镇市 -0.10444 -1.22948 -0.33163 7 萍 乡 市 -0.33434 -0.98629 -0.466 9 九 江 市 0.44046 0.19212 0.39031 2 新 余 市 -0.48542 -1.03544 -0.59649 10 鹰 潭 市 -0.67767 -0.9454 -0.73174 11 赣 州 市 -0.14333 1.98186 0.285835 3 吉 安 市 -0.42146 0.5541 -0.22445 6 宜 春 市 -0.36058 0.98257 -0.08934 5 抚 州 市 -0.62906 0.22865 -0.45585 8 上 饶 市 -0.1548 0.4657 -0.02949 4 从表中可以看书综合实力(除农业外)得分因子得分最高的是南昌,其次是九江,农业实力得分因子最高的是赣州,其次是宜春,吉安,上饶。
两个因子加权综合后即表示各个地区社会发展的整体水平,综合得分最高的南昌,靠前的有九江、赣州。靠后的是新余和鹰潭。综合得分几不平衡,说明了江西的经济发展的不平衡性。
为了能准确的为江西省各市经济发展规划与决策提出了相应的政策建议,把地区分为四类
各市经济发展状况分类表 分类 城 市 第一类城市 南昌、九江、赣州 第二类城市 宜春、上饶、景德镇 第三类城市 抚州、萍乡、新余、鹰潭
四、促进江西经济发展的政策建议 从以上因子分析的结果,我们可以看出江西省各城市间经济发展不平衡的现象较为明显。因此,想办法缩小区域差距,协调江西省各城市的经济发展是促进江西经济发展的一条有效途径。提出以点建议:
1、发挥南昌市作为中心城市的辐射作用。
南昌市经济综合实力雄厚,是江西省的经济发达城市,起着经济辐射作用。南昌市作为江西省的经济中心,汽车制造、机械工业、电子工业、纺织工业及一些新兴的产业发展迅速,经济实力强,对整个江西的经济发展有较强的影响力。应当充分发挥南昌市经济辐射和吸引能力,带动周边的城镇的发展,以缩小和逐步消除周边的不发达地区,实行空间整合发展,充分发挥南昌市在区域整合中的作用。
2、促进江西省各城市的协调发展。
充分挖掘各城市的潜力,把京九沿线(以南昌、九江、赣州、吉安为中心)和浙赣沿线(以新余、鹰潭、萍乡为中心)作为江西生产力布局的重点,其沿线生产力布局应以中心城市为依托,以沿线城镇和开发区为重点,高点起步,分步推进,建成以三高农业、优势工业、先进服务业为特征的新的增长点,带动江西经济起飞。
3、推进技术创新和科技进步,促进经济增长方式转变。
这是促进江西省经济发展的重要内在因素。推进技术创新和科技进步,推进科技产业机制的转变,增加科技开发的投入,促进企业成为技术创新的主体,适度向外引进,建立科技进步的调控机制。 4、进一步加强基础设施建设。
基础设施环节薄弱一度成制约江西省发展的瓶颈,近几年通过对基础设施建设的加强,江西省经济有了很大的发展,江西基础设施瓶颈制约因素基本消除。但是应该看到江西省的基础设施与发达省份相比还有一定差距,包括交通、通讯、水电等相应设施都还有待于进一步的完善。
5、发挥各地的地区优势,吸引高科技人才到各地区就业。注重各个地区的高校建设,以科技促进各方面经济的协调发展。
参考资料:《2005年江西省统计年鉴》
《多元统计分析》中国人民大学出版社 何晓群 编著
《多元统计分析》机械工业出版社 (美)James M.Lattin等 编著 《spss统计分析高级教程》高等教育出版社 张文彤 主编
因篇幅问题不能全部显示,请点此查看更多更全内容