抑制房地产泡沫问题的模型设计
摘要: 本文讨论了影响房地产价格的主要因素,找出了价格和其主要因素之间近似成线性关系,从而建立表示房地产价格的数学模型——多元线性回归模型,并对模型进行了全方面的论述,得出求解其中各个参数的方法,并最终求出房地产价格。建模过程中,首先用科学分析的方法,确定主要因素并对其作数学抽象,再针对各因素综合运用多种数学方法进行分析求解。第一,用概率论与数理统计的方法找出价格和各个因素之间的近似线性关系,确定模型;第二,用最小二乘法求解模型中的参数;第三,用回归分析确定模型精度及检验,从而得出一个完整的数学模型;第四,通过该模型深入分析了影响房地产价格主要因素,提出了一些政策建议,把高的开发成本降下来,同时调整供给结构。第五,根据模型及建议进行合理的预测,最后分析模型的优缺点并提出了改进方向。
一 问题重述
所谓房地产泡沫直的是商品房售价远远超过起实际的价值。近几年来,我国各大城市房价出现了普遍的持续上涨、高居不下的情况。房价的上涨使生活成本大幅度增加,导致许多低收入人群买房难,目前我国城镇居民的人均居住面积只有发达国家的一半左右,甚至低于不少发展中国家,居民不是没有住房需求,而是现有的货币支付能力无法使其去实现购房的愿望。尽管现在买房可以贷款,可以分期付款,但这也需要居民有相当好的收入水平,还要用好多年来供房直到中年甚至更晚才可以还清,一生中最好的时光就都交给了房子。因此如何有效地抑制价格上扬,甚至能够降低房价,是一个备受关注的社会问题。下面就就这个问题展开分析与建立数学模型,来研究如何有效的抑制房价上扬。
二 基本假设
影响房价的因素有许多,房屋建造成本、市场供求关系、城市经济发展、城市规模、等等。现假设房屋价格与各个因素间的关系均为线性关系,且:
(1) 房屋建造成本用竣工房屋造价来代替。
(2) 城市经济发展用人均GDP来表示。
(3) 城市规模用建成区面积来表示。
(4) 市场供求关系通过消费者的支付能力竣工房屋价格来体现,而消费者的支付能力有通过在岗职工的平均工资来衡量。
(5) 房地产价格通过房屋均衡价格来表示
(6) 忽略消费者偏好如有无学校、绿化率、停车位、热水供应状态、通信、房屋建筑形式等对住房价格的影响。
(7) 忽略消费成本如交通费用、物业费用、停车费用等对房价的影响。
(8) 忽略一些炒作对房价的影响。
三 基本符号、变量和用语
A:表示人均GDP序列(元)
B:表示在岗职工平均工资序列(元)
C:表示竣工房屋造价序列(元/㎡)
D:城乡人均储蓄余额序列/元
Y:住房均衡价格指标序列,均衡价格(equilibrium price)是指消费者对某种商品的需求量等于生产者所提供的该商品的供给量时的市场价格。均衡价格是由需求和供给两种力量共同决定的。它与吸纳率和交易价格有关。[1]
:为随机变量;
Uy,Ua,Ub,UcUd分别为Y,A,B,C,D序列的均值序列
ΔY,ΔA,ΔB,ΔC,ΔD分别表示Y-Uy,A-Ua,B-Ub,C-Uc,D-Ud序列,即中心化序列
:序列的方差
, , , :模型参数
S(a):为残差的平方和
n :统计城市数(样本数)
R:中心化序列的协方差
四 建立模型并分析
一、 模型推导过程
表一为我国12个主要城市住房均衡价格及其相关因素的统计表。依照此表我们可以求得各因素与住房均衡价格的相关系数进而判断各因素对房价的影响程度如表二所示。
表一 12个主要城市住房均衡价格及其相关因素的统计表[1]
序号 城市 住宅均衡价格指标
/元/㎡ 人均GDP
/元 建成面积
km2 非农业人口变化率 在岗职工平均工资
/元 人均住宅面积
/m 城乡人均储蓄余额/元 竣工房屋造价
/元/㎡
1 北京 3494.97 19846 488 0.072 14054 13.97 21447.03 2037
2 天津 1636.2 15976 378 0.041 11123 8.6 12417.38 1061
3 石家庄 1424.85 10425 108 0.147 7983 3.16 8105.87 767
4 太原 859.21 10678 177 0.076 7378 12.23 13147.17 760
5 呼和浩特 872.57 7489 79 0.16 7346 6.22 6721.47 866
6 沈阳 1655.62 14989 202 0.028 8511 10.03 13317.48 978
7 大连 1935.43 18429 234 0.079 10259 8.45 13857.8 978
8 长春 1222.49 10261 154 0.073 8618 6.5 6949.56 1087
9 哈尔滨 1502.94 9142 165 0.345 7577 6.96 6957.27 897
10 上海 3119.62 30805 550 0.052 16641 14.96 19778.24 2232
11 南京 1934.31 16816 194 0.108 11931 8.59 10569.5 910
12 杭州 2311.06 19961 171 0.147 12187 6.54 12054.16 1217
同时可以求得各个因素序列的平均值,见附表一
附表一各个因素序列的平均值
住宅均衡价格指标
/元/㎡ 人均GDP
/元 建成面积
km2 非农业人口变化率 在岗职工平均工资
/元 人均住宅面积
/m 城乡人均储蓄余额/元 竣工房屋造价
/元/㎡
平均 1830.8 15401 241.67 0.111 10300 8.85 12110. 1149
表二 各因素与住房均衡价格的相关系数表
人均GDP 建成面积 非农业人口变化率 在岗职工平均工资 人均住宅面积 城乡人均储蓄余额
竣工房屋造价
相关系数r 0.848 0.824 -0.236 0.910 0.766 0.836 0.894
由表二可得,住房均衡价格与非农业人口变化率、人均住宅面积、建成面积的相关系数相对要小,所以这里我们忽略二者的影响,只考虑其他主要因素的影响,主要包括:人均GDP、在岗职工平均 工资、竣工房屋造价、城人均储蓄余额等方面
通过表一我们依次做出主要因素和住房均衡价格的关系图:
图1
图2
图3
图4
由均衡房价和人均GDP、均衡房价和人均工资、均衡房价和竣工造价, 均衡房价和居民平均储蓄的关系图可以看出,均衡房价和人均GDP、人均工资、竣工造价、居民平均储蓄存在着相依的关系,很容易想到用多元线性回归模型
Y= A+ B+ C+ D+…….+
表示因变量Y,对自变量A,B,C,D…….的相依性,其中 , , , …….为参数
模型特点如下:
1、 A、B、C、D….为一般变量, 为随机变量;
2、 Y为一般变量和随机变量的线形组合,Y序列的值既取决于A,B,C序列,又受制于 。
如表三所示各序列
一般假定为白噪声序列,假定其服从均值为0,方差为 的正态分布
表三
序号 城市 Y A B D C
1 北京 3494.97 19846 14054 21447.03 2037
2 天津 1636.2 15976 11123 12417.38 1061
3 石家庄 1424.85 10425 7983 8105.87 767
4 太原 859.21 10678 7378 13147.17 760
5 呼和浩特 872.57 .47 866
6 沈阳 1655.62 14989 8511 13317.48 978
7 大连 1935.43 18429 10259 13857.8 978
8 长春 1222.49 10261 8618 6949.56 1087
9 哈尔滨 1502.94 .27 897
10 上海 3119.62 30805 16641 19778.24 2232
11 南京 1934.31 16816 11931 10569.5 910
12 杭州 2311.06 19961 12187 12054.16 1217
将其中心化后得
Y-Uy= *(A-Ua)+ *(B-Ub)+ *(C-Uc)+ *(D-Ud)+
上式即为
ΔY = *ΔA + *ΔB + *ΔC + *ΔD+
现在对模型的参数进行最小二乘法估计
其中ΔY、ΔA、ΔB、ΔC、ΔD各序列(矩阵)的值见表四
表四
序号 城市 ΔY ΔA ΔB ΔD ΔC
1 北京 1664.197 4444.58 3753.33 9336.79 887.33
2 天津 -194.573 574.58 822.33 307.14 -88.67
3 石家庄 -405.923 -4976.42 -2317.67 -4004.37 -382.67
4 太原 -971.563 -4723.42 -2922.67 1036.93 -389.67
5 呼和浩特 -958.203 -7912.42 -2954.67 -5388.77 -283.67
6 沈阳 -175.153 -412.42 -1789.67 1207.24 -171.67
7 大连 104.657 3027.58 -41.67 1747.56 -171.67
8 长春 -608.283 -5140.42 -1682.67 -5160.68 -62.67
9 哈尔滨 -327.833 -6259.42 -2723.67 -5152.97 -252.67
10 上海 1288.847 15403.58 6340.33 7668 1082.33
11 南京 103.537 1414.58 1630.33 -1540.74 -239.67
12 杭州 480.287 4559.58 1886.33 -56.08 67.33
令a= ( , , , ) ,则a 的最小二乘估计,应使残差 平方和S(a)达到最小,其中
S(a)= = (ΔY t- *ΔA t- *ΔB t- *ΔC - *ΔDt) ,取 S(a) =0即可得到:
S(a) = 2*(ΔY t- *ΔA t- *ΔB t- *ΔCt- *ΔD)*(-ΔA t)=0---------------------------式1
用Rya表示序列ΔY和ΔA的协方差,Raa表示ΔA序列的方差,Rba,表示序列ΔB和ΔA的协方差,Rca表示序列ΔC和ΔA的协方差:式1可写成:
-Rya+ *Raa+ *Rba+ *Rca+ *Rda=0-----------------------------式2
同理 S(a)=o推出:
-Ryb+ *Rab+ *Rbb+ *Rcb+ *Rdb =0-----------------------------式3
S(a)=0推出:
-Ryc+ *Rac+ *Rbc+ *Rcc+ *Rdc =0-----------------------------式4
S(a)=0推出:
-Ryd+ *Rad+ *Rbd+ *Rcd+ *Rdd=0-----------------------------式5
把式2、式3,式4,式5写成矩阵相乘的形式为:
* =
推求参数的公式为:
= * --------------式6
具体到本题中,我们运用往年的统计数据对模型中各个参数的求解。
经计算得各个协方差的值为:(利用matlab软件)
Raa=38730662
Rba=Rab=18250255
Rca=Rac=2543343
Rda=Rad=25327000
Rbb=8106483
Rcb=Rbc=1257098
Rdb=Rbd=11269000
Rcc=211174.1
Rdc=Rcd=1882000
Rdd=22936000
Rya=4475718
Ryb=2197259
Ryc=343656.3
Ryd=3251000
通过矩阵运算得到 , , , 的值为:(利用matlab软件)
,=0.0583
=-0.0487
=1.1621
=0.0059
把系数 , , , 代回原模型得:
Y-1830.77=0.0583*(A-15401.4)-0.0487*(B-10300)+1.1621*(C-1149)+ 0.0059*(D-12110.24)+
利用表三中的均衡房价、人均GDP、在岗职工平均工资、竣工房屋造价、城乡人均储蓄余额反推 的值,即:
=Y-1830.77-〔0.0583*(A-15401.4)-0.0487*(B-10300)+1.1621*(C-1149)+ 0.0059*(D-12110.24)〕
得到的12个 值为:
表五 残差数据
城市序号 残差
1 501.5639
2 -86.8221
3 239.8316
4 -391.561
5 -279.054
6 -45.8512
7 115.1803
8 -287.093
9 228.7031
10 -604.037
11 387.9655
12 228.1861
平均值 0.584425
图5
由于 的平均值为0.584,相对Y值来说非常小,可以近似看成是0,从而予以忽略
故模型进一步化简为:
Y-1830.77=0.0583*(A-15401.4)-0.0487*(B-10300)+ 1.1621*(C-1149)+ 0.0059*(D-12110.24)
即
Y=0.0583*(A-15401.4)-0.0487*(B-10300)+1.1621*(C-1149)+ 0.0059*(D-12110.24)+1830.77
即 六 模型的优化
虽然我们采用统计规律建立起了表示房地产价格的多元线形回归模型,而由此计算出来的结果从整体来看,大体趋势与实际还是比较符合的。但该模型仍然存在着很多问题。
首先,影响房地产价格的因素有好多,而在建立模型时我们忽略掉了很多被认为不好似很重的因素。
除了以上模型中考虑到的影响房屋价格的因素之外,还有一系列其他因素的影响:
(1)房屋的结构、质量、功能、新旧程度是影响房屋价格的重要因素。由于使用不同的建筑材料,不同的施工机构、施工方法和施工技术力量而形成价格差异。
(2)房屋的层数、层次和朝向。房屋有高屋,多层和低层之分,由于其所用设备、施工技术:施工机械化程度不同,各种层数、各种朝向的房屋形成一定的价格差异。
(3)环境因素。房屋所处位置是在城区还是在郊区,交通便利的繁华地段还是背街小巷,交通、文化教育和社区服务设施都对房屋价格产生很大的影响。
(4)国家政策。房屋价格受政策因素的影响很大,在某种情况下,政策因素往往成为房屋价格的决定因素。例如:我国在计划经济时期,实行住宅不作为商品的福利分房政策,其价格远远低于价值,严重影响了房屋的再生产。
(5)还有一些人的投机心理,想利用房价上涨来捞一把,多置房,想以房屋增殖来赚取利润。
以上几个因素对住宅价格都有一定的影响,但由于时间仓促和能力有限,不能对诸多因素进行一一考虑,仅考虑了影响比较大的因素。由此我们采用的是“把握主要矛盾,忽略次要矛盾”的方法,因此该模型仍然具有一种普遍性和代表性,表示了一种基本的思路和算法,在此基础上在考虑其他因素时,此方法仍然是适用的。
其次,我们用来确定模型参数的样本序列仅仅有12组数据,这可以说是犯了应用统计规律的大戒,因为统计规律本来只是适用于一些大样本甚至是无穷大序列,如果在样本很小的情况下应用,结果误差会很大,甚至有时候是错误的。但我们在这里还是用了这样一个小的样本来计算,实际上只是为了说明一种计算的方法,而我们在提出该模型时也确实参考很多的数据,才将之间的个各因素确定为线性的。在计算时为了节省时间又能够说明问题,所以我们只选用了几组数据。
还有就是模型中有些因素存在共线性问题,有待进一步改进。
针对以模型中存在的问题,我们提出如下改进建议。
(1)、对更多的城市的统计数据(样本)进行模型运算,我想精度一定会更高。
(2)、综合考虑城市的各方面因素,如考虑建成面积、流动人口、交通环境等因素。
(3)考虑到共线性问题,我们尽量利用相互独立的因素或利用一些其他更经典的模型。
写论文的一般格式如下:
1、原始问题描述(问题的背景及简要分析)
2、模型的选取,也即解决问题用到的数学方法
3、仿真求解,包括步骤,结果等
4、总结,对求解结果给与评价,如果用几种方法解得,对各种方法做一下对比分析。
这样一篇论文就出来了,记住一定要把摘要写好!
分析因素,比如学校,专业,性别,什么的或者就业率,就业方向,捡主要的因素,选一个方向就自己写吧,可能用多元线性回归解得各因素所占几率
数学建模论文写作
一、写好数模答卷的重要性
1. 评定参赛队的成绩好坏、高低,获奖级别,数模答卷,是唯一依据。
2. 答卷是竞赛活动的成绩结晶的书面形式。
3. 写好答卷的训练,是科技写作的一种基本训练。
二、答卷的基本内容,需要重视的问题
1.评阅原则
假设的合理性,建模的创造性,结果的合理性,表述的清晰程度。
2.答卷的文章结构
题目(写出较确切的题目;同时要有新意、醒目)
摘要(200-300字,包括模型的主要特点、建模方法和主要结论)
关键词(求解问题、使用的方法中的重要术语)
1)问题重述。
2)问题分析。
3)模型假设。
4)符号说明。
5)模型的建立(问题分析,公式推导,基本模型,最终或简化模型等)。
6)模型求解(计算方法设计或选择;算法设计或选择,算法思想依据,步骤及实现,计算框图;所采用的软件名称;引用或建立必要的数学命题和定理;求解方案及流程。)
7)进一步讨论(结果表示、分析与检验,误差分析,模型检验)
8)模型评价(特点,优缺点,改进方法,推广。)
9)参考文献。
10)附录(计算程序,框图;各种求解演算过程,计算中间结果;各种图形,表格。)
3. 要重视的问题
1)摘要。
包括:
a. 模型的数学归类(在数学上属于什么类型);
b. 建模的思想(思路);
c. 算法思想(求解思路);
d. 建模特点(模型优点,建模思想或方法,算法特点,结果检验,灵敏度分析,模型检验……);
e. 主要结果(数值结果,结论;回答题目所问的全部“问题”)。
▲ 注意表述:准确、简明、条理清晰、合乎语法、要求符合文章格式。务必认真校对。
2)问题重述。
3)问题分析。
因素之间的关系、因素与环境之间的关系、因素自身的变化规律、确定研究的方法或模型的类型。
5)模型假设。
根据全国组委会确定的评阅原则,基本假设的合理性很重要。
a. 根据题目中条件作出假设
b. 根据题目中要求作出假设
关键性假设不能缺;假设要切合题意。
6) 模型的建立。
a. 基本模型:
ⅰ)首先要有数学模型:数学公式、方案等;
ⅱ)基本模型,要求完整,正确,简明;
b. 简化模型:
ⅰ)要明确说明简化思想,依据等;
ⅱ)简化后模型,尽可能完整给出;
c. 模型要实用,有效,以解决问题有效为原则。
数学建模面临的、要解决的是实际问题,不追求数学上的高(级)、深(刻)、难(度大)。
ⅰ)能用初等方法解决的、就不用高级方法;
ⅱ)能用简单方法解决的,就不用复杂方法;
ⅲ)能用被更多人看懂、理解的方法,就不用只能少数人看懂、理解的方法。
d.鼓励创新,但要切实,不要离题搞标新立异。数模创新可出现在:
▲ 建模中,模型本身,简化的好方法、好策略等;
▲ 模型求解中;
▲ 结果表示、分析、检验,模型检验;
▲ 推广部分。
e.在问题分析推导过程中,需要注意的问题:
ⅰ)分析:中肯、确切;
ⅱ)术语:专业、内行;
ⅲ)原理、依据:正确、明确;
ⅳ)表述:简明,关键步骤要列出;
ⅴ)忌:外行话,专业术语不明确,表述混乱,冗长。
7)模型求解。
a. 需要建立数学命题时:
命题叙述要符合数学命题的表述规范,尽可能论证严密。
b. 需要说明计算方法或算法的原理、思想、依据、步骤。
若采用现有软件,说明采用此软件的理由,软件名称。
c. 计算过程,中间结果可要可不要的,不要列出。
d. 设法算出合理的数值结果。
8) 结果分析、检验;模型检验及模型修正;结果表示。
a. 最终数值结果的正确性或合理性是第一位的;
b. 对数值结果或模拟结果进行必要的检验;
结果不正确、不合理、或误差大时,分析原因, 对算法、计算方法、或模型进行修正、改进。
c. 题目中要求回答的问题,数值结果,结论,须一一列出;
d. 列数据问题:考虑是否需要列出多组数据,或额外数据对数据进行比较、分析,为各种方案的提出提供依据;
e. 结果表示:要集中,一目了然,直观,便于比较分析。
▲ 数值结果表示:精心设计表格;可能的话,用图形图表形式。
▲ 求解方案,用图示更好。
9)必要时对问题解答,作定性或规律性的讨论。最后结论要明确。
10)模型评价
优点突出,缺点不回避。
改变原题要求,重新建模可在此做。
推广或改进方向时,不要玩弄新数学术语。
11)参考文献
12)附录
详细的结果,详细的数据表格,可在此列出,但不要错,错的宁可不列。主要结果数据,应在正文中列出,不怕重复。
检查答卷的主要三点,把三关:
a. 模型的正确性、合理性、创新性
b. 结果的正确性、合理性
c. 文字表述清晰,分析精辟,摘要精彩
三、关于写答卷前的思考和工作规划
答卷需要回答哪几个问题――建模需要解决哪几个问题;
问题以怎样的方式回答――结果以怎样的形式表示;
每个问题要列出哪些关键数据――建模要计算哪些关键数据;
每个量,列出一组还是多组数――要计算一组还是多组数。
四、答卷要求的原理
1. 准确――科学性;
2. 条理――逻辑性;
3. 简洁――数学美;
4. 创新――研究、应用目标之一,人才培养需要;
5. 实用――建模、实际问题要求。
五、建模理念
1. 应用意识
要解决实际问题,结果、结论要符合实际;
模型、方法、结果要易于理解,便于实际应用;站在应用者的立场上想问题,处理问题。
2. 数学建模
用数学方法解决问题,要有数学模型;
问题模型的数学抽象,方法有普适性、科学性,不局限于本具体问题的解决。
3. 创新意识
建模有特点,更加合理、科学、有效、符合实际;更有普遍应用意义;不单纯为创新而创新。