究竟与城市的人均收入、基础设施建设等是否有无关联?本文结合前人的见解,以北京、上海两城市鸽相关数据通过
逐步回归模型和主成分分析法选取了三个角度、十余个可能相关的因子加以分析,从而对房价有一个清晰的认识,同 时根据结果提供了新的观察城市发展的角度。关键词:多元回归模型;房价中图分类号:F299.23
文献识别码:A 文章编号:2096 —3157(2019)18—0128 —03房价是我国社会经济发展过程中的一大热点问题和难 航客运量数据为基础,进行分析预测,得到了相对准确的结 果。刘丽泽曾选取了房价、城市GDP、人均收入、施工面积、 竣工面积等五个因子,收集了北京市2000年〜2014年的数
题。自2003年6月国家出台121号文件起,我国开始 以的形式对房价进行宏观压制性。2008年以后,
各大城市的房价进入了快速增长的时期。随后,一线城市
据,分别通过多元线性回归模型和ARIMA模型加以预测, 与真实结果对比后发现多元线性回归模型预测的拟合度更
相继推出限购制度,一度压低房价。而今,优质学区房、高 档科技房等房源紧张,导致价格持续飙涨,毫无消停之势。
好,ARIMA模型拟合度较低。何承朔在进行武汉市房价预 测时,选取了房屋竣工面积、商品房销售面积、人均生产总
归根到底,一是我国教育事业尚不发达,家长为了学区不惜
花费重金去购买学区房;二是我国环境问题严峻,高档科技 房凭借自动调温、自动净化空气等优点吸引了不少有实力 的买家为之买单,继而让炒房团有机可乘,致使房价越来 越高。值、生产总值、人员平均工资等五个自变量,以平均房价为因 变量,从武汉市统计局网站收集了 2008年〜2016年的相关 数据,通过多元线性回归模型加以分析,进行合理预测,得出 的结果与真实房价拟合度很高。由此可见,不同的学者在进
研究房价的影响因素对社会发展颇有助益。一者合理 行建模的时候都有自己的指标选择体系和建模方法。的房价可以为当地带来巨大的GDP贡献,促进地区经 济发展,推动相关基础设施建设;二来在人们传统的生产生
二、方法简介1. 回归模型设因变量为y,k个自变量分别为©,血‘…乙,描述因变 量y如何依赖于自变量为如,竝,…城和误差项e的方程称
活观念之中,户口有着不可取代的重要地位,因而合理的房 价能为当地引进更多的人才,同时促进年轻人的奋斗热情,
反作用于当地的经济,达成良性循环。为多元回归模型。其一般形式可表示为:北京和上海作为北方和南方的两座一线城市,在全国 范围内经济发展水平高,城市基础设施较为完善,是近年
y = Bo + Bi 如 + B2 孔----Bkxt +e式中,B0 ,B2 ,B2—Bk是自变量x,_,x2, —xk的系数,e为 误差项。来房价迅速增长的典型代表。我们希望通过分析相关因 素,进而建立一个房价的预测机制,分析各个影响因素对
2. 逐步回归方法原理逐步回归分析是多元回归分析中的一种方法。它往往 用于建立最优或合适的回归模型,从而更加深入地研究变量
两座城市房价增长的相关性,以回归结果为依据,从而对 房价有一个清晰的认识,同时为城市的发展提供新角度和
新方法。之间的依赖关系。其基本思想是逐个引入新变量,每引入一
一、文献综述前人对房价的研究与预测已经从很多角度采用了多种
个新变量时考虑是否剔除已选变量,直至不再引入新变量。 此方法既保障了方程能保留影响显著的变量,又能够剔除非
方法研究得出了相关参考结果。冷建飞、高旭、朱嘉平通过 研究多元线性回归的本质及作用,以1998年〜2013年的民
显著的变量。3. 主成分分析法128全国流通经济主成分分析是利用降维的思想,把多指标转化为少数几 个综合指标(即主成分),其中每个主成分都能够反映原始变 量的大部分信息,且所含信息互不重复。主成分分析的降维
的基本原理就是将一个矩阵中的样本数据投影到一个新的 空间中去。三、 相关因素分析北京、上海等一线城市经济发展较为成熟,房价相对稳 定,但还是不可避免等因素的影响。本选题以北京、上 海这两个一线城市为例,选取几个较为科学的要素加以分 析,从而对房价进行预测,为之后的年轻人选择就业城市和
就业方向提供一些参考依据。首先,供求影响价格,故城市房产的供需必然会对房价 产生一些影响;其次,一个城市的社会福利对人才的涌入起 到了不可忽视的作用,社会福利的建设不仅能保障公民的医
疗健康、教育保障,而且相关对创业的支持能带来良好 的创业环境,让更多的年轻人愿意到该城市生活,为城市发
展带来新的动力与活力;再者,城市的物价水平也对社会不 同阶层的人起到了程度不同的影响,对于刚刚步入社会,经 济条件较差的青年一代,自然会优先选择物价水平较低的城 市发展,故城市的物价水平对其房价也有不同程度的影响。
因此,本文综合前人已有的分析,我们从以下三个维度选取
了影响房价的因素:城市供需、城市社会福利、城市物价水 平。城市供需维度选择以下九个因素:常住人口、城镇人口、 乡村人口数、出生人数、户籍人口数、高等学校预计毕业生
数、研究生毕业生数、普通小学招生数、人口密度。城市社会
福利维度选择以下四个因素:公园面积、人均绿地面积、人均 道路面积、城市建设用地面积。城市物价水平维度选取了以
下一个因素:CPI水电燃料。依据上述的影响因素,我从国 家统计局、北京市统计局和上海市统计局以年为频率收集了
2004年〜2017年的数据。四、 建立回归模型以上述方面作为自变量,建立有关房价的多元回归
模型。我们利用SPSS进行数据分析与建模,在多元回归的过 程中,首先,为了避免回归中的自变量共线性问题,对各个变
量进行相关性分析,变量之间相关性在0. 8以上的显著相关 的有以下两组数据:一组是常住人口、城镇人口、乡村人口 数、出生人数、户籍人口数,另一组是高等学校预计毕业生 数、研究生毕业生数。其次,结合主成分分析的方法,将具有强相关性的自变
量进行主成分提取。对北京数据,进行两组主成分提取,结果如下:产业经济表1 北京市强相关性数据主成分分析结果一初始特征值提取平方和载入成份合计方差的%累积%合计方差的%累积%13. 9367& 71578. 7153. 93678. 7157& 71521. 00120. 0129& 7271. 00120. 0129& 7273.048.96299. 68840.16.311100.00050. 0000085.000100.000表2 北京市主成分分析成分矩阵一成份成分矩阵1常住人口.995城镇人口.996乡村人口数.998出生人数.981户籍人口数.994因此,对北京市常住人口、城镇人口、乡村人口数、出生
人数、户籍人口数几项强相关性变量的主成分建模结果的因
子表达是:因子1北京人口类=0. 995 X常住人口+0. 996 X城镇 人口+0. 998X乡村人口数+0. 981 X出生人数+ 0. 994X户
籍人口数该主成分对原始变量的解释程度达到了 0.787。在统计
学意义上认为该因子可以代替原有的五项自变量。表3 北京市强相关性数据主成分分析结果二初始特征值提取平方和载入成份合计方差的%累积%合计方差的%累积%11. 2. 69592. 6951. 2. 69592.6952.1467. 305100.000表4 北京市主成分分析成分矩阵二成份成分矩阵1高等学校预计毕业生数.963研究生毕业生数.963因此,对北京市高等学校预计毕业生数、研究生毕业生数几项强相关性变量的主成分建模结果的因子表达是:因子2北京高等教育类=0. 963X高等学校预计毕业生
数+ 0. 963X研究生毕业生数该主成分对原始变量的解释程度达到了 0.927。在统计
学意义上认为该因子可以代替原有的两项自变量。对上海数据,也进行了两组主成分提取,结果如下:表5
上海市强相关性数据主成分分析结果一仰择M总方盖初始特征值提取平方和载入成份合计方差的%累积%合计方差的%累积%14. 61192. 21692. 21. 61192. 21692.2162.2044. 086. 3043.1212. 41398.7174• 0551.099.8155.009.185100.000全国流通经济129产业经济表6 上海市主成分分析成分矩阵一成份成分矩阵1常住人口.962城镶人口.974乡村人口数.9出生人数.918户籍人口数.992因此,对上海市常住人口、城镇人口、乡村人口数、出生
人数、户籍人口数几项强相关性变量的主成分建模结果的因
子表达是:因子3上海人口类=0. 962 X常住人口 +0. 974 X城镇 人口+0. 9X乡村人口数+ 0. 918X出生人数+ 0. 992X户
籍人口数该主成分对原始变量的解释程度达到了 0. 922。在统计
学意义上认为该因子可以代替原有的五项自变量。表7 上海市强相关性数据主成分分析结果二初始特征值提取平方和载入成份合计方差的%累积%合计方差的%累积%11. 90795. 33295.3321. 90795. 33295. 3322.0934. 668100. 000表8 上海市主成分分析成分矩阵二成份
成分矩阵1高等学校预计毕业生数.976研究生毕业生数.976因此,对上海市高等学校预计毕业生数、研究生毕业生 数几项强相关性变量的主成分建模结果的因子表达是:因子4上海高等教育类=0. 976 X高等学校预计毕业生
数+ 0. 976X研究生毕业生数该主成分对原始变量的解释程度达到了 0. 953。在统计
学意义上认为该因子可以代替原有的两项自变量。重复相关性分析数次,我们确认了剩余的变量不存在数
据内部的相关性问题了。接下来,将普通小学招生数、人口密度、公园面积、人均绿地
面积、人均道路面积、城市建设用地面积、CPI水电燃料、因子1
(人口类)、因子2(高等教育类)进行逐步回归分析。回归分析 后,为了去除量纲的影响,将数据标准化,得到如下结果。北京模型标准化系数囲子1北京人口类0. 966城市公园面积0. 758上海模型标准化系数因子3上海人口类0. 943城市建设用地面积0. 769城市人均公园绿地面积0. 505北京市房价价格指数=0. 966X因子1(人口类)+0. 758
X城市公园面积。上海市房价价格指数=0. 943X因子3(人口类)+0. 769
X城市建设用地面积+ 0. 505X城市人均公园绿地面积。130全国流通经济五、结论经过多元线性回归和相关性分析后,得到了以下结论: 北京市的房价与人口、城市公园面积两个因子强相关;上海
市的房价与人口、城市建设用地面积、城市人均公园绿地面 积三个因子强相关。两座城市重合的部分有人口和城市公 园建设两方面。由此可见,人口对于一个城市的经济发展、
科技发展带来的市基础性的影响。对于城市来说,人口中包含了人才引进这一部分,只有 大量优秀人才的涌入才能给城市带来新的生机,从而反作用
于城市的发展,为城市带来巨大的经济效益;而城市的公园
建设对房价的影响也较为明显,公园的建设代表着一个城市 的绿化程度和环境管理水平,从侧面反映出了一个城市 的管理建设和经济发展水平,适当的绿化也能让城市的整体 环境得到改善,吸引更多的人才涌入。因此,不同城市要根
据自己的定位制定相应的:对于经济发达的一线城市, 应当适当控制人口,使优秀的社会精英拥有更多的机会和社 会资源,也要适当地出台相关来遏制房价的盲目增
长。倘若一味地追求人口数量和房价增长,就可能会出现泡
沫经济的风险,同时巨大的社会压力也会使大量人才流失,
从长远来看对社会经济发展是不利的;对于经济相对富裕的 二线、三线城市,应当大力加强社会基础设施的建设以及公 园等环境绿化的建设,更好的就业环境和空气质量往往能吸
引更多的年轻人来此就业,逐渐形成良性循环,促进城市经
济发展的同时也能美化环境、建设美丽城市。对于青年一代来说,刚刚离开校园步入社会,可以适当
地选择房价、物价较为合理的二线城市发展。倘若大学在北 上广深等城市学习,有提供的相关支持,例如上海 市的打分入户制,则可以考虑留在本地区就业,这样也能充 分地利用好周围的人脉资源和就业支持。参考文献::1 ]何承朔.基于多元线性回归建模的武汉市房价预测[J].
科技经济导刊,2018,26(28):213〜215.[2] 贾俊平,何晓群,金勇进.统计学(第7版)21世纪,统计
学系列教材[M].中国人民大学出版社,201&[3] 冷建飞,高旭,朱嘉平.多元线性回归统计预测模型的
应用[J].统计与决策,2016,(7):82〜85.[4] 刘丽泽.基于多元线性回归模型及ARIMA模型的北
京市房价预测[J],科技经济导刊, 2018,26(29):176 〜177.[5] 吴昌耀,刘钮靖,谭希丽,吴旭韩,王雪婷.基于多元逐
步回归对均衡房价影响因素的研究——以长春市、吉林
市为例[J].东北电力大学学报,2018,38(3):90〜95.[6] 张文形.SPSS统计分析高级教程[M].高等教育出版
社,2004—9.作者简介:戴上阂,浙江省杭州学军中学学生。
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- huatuo6.com 版权所有 湘ICP备2023023988号-11
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务