山西省GDP实证分析及发展预测摘 要: 本文用数学建模的思想分别用插值、拟合、灰色模型、时间序列和logistic模型五种方法对山西省1990年到2011年的GDP数据作了拟合预测,并对每一种方法都进行拟合误差分析。并针对山西省GDP数据本身的内在规律,针对性地提出用“多logistic”模型作拟合预测,预测效果较好。关键词:拟合;预测;logistic模型Abstract:In this paper, the author made a fitting prediction on the GDP data of Shanxi Province from 1990 to 2011, using five kinds of methods respectively, namely interpolation, fitting, grey model, time series and logistics under the guide of the mathematical modeling thought, and made error analysis on the those methods above. The paper carried out specific fitting predication on logistics model with a view to the inherent law of the GDP data, and came to a better prediction :fitting; Forecast; logistics model中图分类号:TU205文献标识码:A文章编号:2095-2104(2013)1.引言山西是典型的能源大省,60多年来,山西生产原煤130亿吨,外输90亿吨,基本充当着“锅炉房”和“原料地”的角色,产业低端,生态破坏严重,资金、技术和人才高度沉淀在采掘中。全省的GDP基本由第二产业支撑。现在的山西正在探索“以煤为基,多元发展”的产业转型之路,分析预测山西省的GDP数据有助于为今后决策提供参考及依据,也为数学建模中此类问题提供快速准确的预测方案。随着GDP预测的应用领域的不断拓展,GDP的预测方法、模型等成果也不断涌现。像一些有影响力的成果,如孙旭东的多元线性回归和BP网络模型、灰色模型[1]、孙彩的非线性GDP模型[2]等。本文特别提出用logistic模型来拟合预测山西的GDP,并结合了已有的数据特征和模型的特征。下表1是,得到的山西省各年的生产总值:图1是从山西省统计信息网获得的1990-2011年山西省GDP统计数据[3]随年份的增长状况,可以粗略分析出全省GDP一直呈现总体平稳指数增长:Figure 1. Timing diagram of Shanxi Province's GDP图1.山西省GDP的时序图2.全局拟合预测由图1可以看到1990年到2011年山西省22年的GDP数据图像总体为下凸的离散点,且呈指数增长形势。由此这里采用以下几种方法进行拟合预测。2.1.拟合模型拟合[4]是数学建模拟合预测中最简单最常用的方法,这里利用matlab进行最小二乘拟合预测,经多次测试,确定取五次多项式。表1为预测数据,2012年到2015年的平均增长率为。Table 1. Quintic polynomial forecast data表1.五次多项式预测数据表2为五次多项式对1990年到2011年的拟合数据及绝对误差和相对误差,可以看到有12个预测相对误差在5%以内,原始数据和预测数据的相关系数为,预测准确程度较好。Table 2. Quintic polynomial fitting data表2.五次多项式拟合数据.灰色预测灰色预测模型[5](Gray Forecast Model)是通过少量的、不完全的信息,建立数学模型并作出预测的一种预测方法。所需建模信息少,运算方便,建模精度高,因此,首先建立山西省GDP的灰色预测模型GM(1,1)。灰色预测模型的一阶微分方程为:.其通解为:.对于通解:若,则, ,即,于是.所以.当时, .则时间响应序列为. 灰色建模是对累加处理后的数据建立微分方程,预测的结果是该指标在未来各个时刻的具体数值。(1)采用累加生成算子(AGO)灰生成递增数列 (2)构造数据矩阵B及数据向量Y,.(3)最小二乘估计求参数列:=()(4)建模将代入时间响应序列.于是生成的灰色模型各个时期的数值: 为模型的计算值.(5)残差检验计算原始序列的绝对误差序列和相对误差序列根据计算数据和统计数据,可以对模型进行精度检验,以上指标能反映模型的准确程度有上述理论,我们利用matlab编程,求得GDP灰色预测值。如表3,每年保持的增长率。Table 3. Gray model forecast data表3.灰色模型预测数据表4为五次多项式对1990年到2011年的拟合数据及绝对误差和相对误差,有8个预测相对误差在5%以内,原始数据和预测数据的相关系数为。 表4.灰色模型误差分析.时间序列模型时间序列是同一种现象在不同时刻上的观察值排成的一组数字序列。利用时间序列做预测的基本思想是:用该现象的过去行为规律来预测未来的状况。即通过时间序列的历史数据来揭示该现象未来时间的变化规律。本文讨论确定型时间序列的预测方法。确定型时间序列模型预测方法的基本思想是用一个确定的时间函数来拟合时间序列。可分为趋势预测法、分解分析法、平滑预测法等在简单的移动平均公式中,每个数据在求平均时的作用是相同的。但是,每个数据包含的信息量不一样,我们认为近期数据包含更多的未来情况的信息。故把各期数据等同看是不合理的,应当考虑各期数据的重要性的不同,对近期数据要给较大的权重,这就是加权移动平均法的基本思想。设时间序列为、、……;加权移动平均公式为式中为期加权移动平均数;为 的权数,体现了相应的的重要性。用加权移动平均数做预测,预测公式为.即以第t期加权移动平均数作为下一期的预测值。这里我们就采用时间序列模型预测中的加权平均法。我们取按预测公式预测值依次求出后我们根据偏差值依次进行修正。先预测2011年的GDP结果,显然偏低,我们修正。方法是:先计算每年预测值和实际值的相对误差,再计算平均误差。然后我们可以利用公式得到修正后的预测值。下表5为时间预测的预测数据,2012年到2015年的平均增长率为,增长速度快。表5.时间序列模型预测数据. Logistic模型经过改革开放三十多年的蓬勃发展,山西省不可能无限制增长下去,会受到很多因素的限制。因此尝试使用Logistic模型做预测[6]。Logistic模型如下:其中常数表示所能达到的最大值,表示随着时间的增长率。通过变量分离可以解得logistic方程的积分解为:其中为待定常数。Logistic解曲线是s型严格单增的,为了数据严格单调递增,我们把原始GDP数据累加为,即,时间平移到0至22,这样随时间的变化如图2,它更符合logistic解曲线,能很好地提高精度。下图2为累加数据的时序图,可以看到比原始数据更具指数增长态势。利用logistic模型做预测,关键问题是确定系数、、。这里利用matlab的拟合函数fittype,选择合适的拟合初值,寻找到最优的系数、、.编程如下以及拟合效果图如图 = [385300 ];ft_ = fittype('k./(1+a*exp(-r*t))','dependent',{'y'},'independent',{'t'},'coefficients',{'k', 'a','r'});[cf_,good]= fit(t,y,ft_ ,'Startpoint',st_)h_ = plot(cf_,'fit',);legend off;% turn off legend from plot method callset(h_(1),'Color',[1 0 0],...'LineStyle','-', 'LineWidth',2,...'Marker','none', 'MarkerSize',6);运行结果为:cf_ =General model: cf_(t) = k./(1+a*exp(-r*t)) Coefficients (with 95% confidence bounds): k =(, ) a =(, ) r =(, )good = sse: rsquare: dfe: 19adjrsquare: : 2. Logistic model fitting results on cumulative series图2. Logistic模型对累加数列拟合图故拟合模型为 .方程的确定系数r平方为,接近1,方程的变量对的解释能力较好,对累加数据的拟合效果如图9。逆用累加公式原始预测数据,计算的2012年到2015年GDP预测值见下表6。平均增长率为。Table 6. logistic model predictions表6. logistic模型预测数据下表7是logistic模型的预测数据及绝对误差和相对误差,只有六个数据相对误差在5%范围内,预测数据和实际GDP数据的相关系数为。表模型拟合值及误差3多logistic模型本文引用的数据源自山西省统计年鉴的1990年到2011年的GDP,整体数据呈现递增态势,而且理论上,经济发展状况满足logistic模型[7],但是在应用logistic模型过程中,有两个问题需要我们考虑,第一,模型中的最值在1990到2011这22年间随着改革开放的不断深化以及经济结构的不断调整必然是变化的;第二,模型中的内禀增长率同样受到省内省外甚至国际经济状况等诸多影响,也不可能22年恒定不变。基于以上两方面考虑,这里提出局部logistic模型,即在增长稳定的几年内,最值和增长率变化很小,假设不变,我们应用logistic模型进行拟合预测。为了计算方便,这里把时间坐标平移到1到22。从山西省GDP 数据本身的趋势来看,将数据分为四组:[1,8]、[9,12]、[13,18]、[19,22]。1990年到1997年利用matlab的fittype函数拟合得到模型为.1998年到2001年数据中,1999年的GDP值大致和1998年的一样,属于随机情况,这里用1998年和2000的平均值代替,拟合得到模型为:2002年到2007年的拟合模型为:2008年到2011年中,2008年的数值和2009年的基本一样,因特殊原因造成这样的零增长,为了减小其他随机因素造成的数据误差,我们选择平均数,即 用2008年和2009年的平均值代替。利用matlab里的fittype函数我们拟合到拟合模型为下表8为多logistic模型的预测数据,每年保持增长率为。表8.多logistic模型预测值下表9为多logistic模型的你和数据以及绝对误差和相对误差,拟合数据只有起始点相对误差超过了5%,拟合数据和实际数据的相关系数为,拟合效果非常好。表9.多logistic模型拟合值及误差下图3直观地显示出多logistic模型良好的拟合效果和预测数据, Figure 3. Partly logistic model fitting and prediction map 图3.多logistic模型拟合及预测图 4.结论通过以上多种预测方法我们可以看到对于总体呈增长的数据,就拟合效果而言,灰色模型和局部logistic模型的效果比较好,而多logistic模型的拟合误差除了特殊点外都保持在5%以内,拟合效果最好。就预测效果而言,通过查询得到山西省2012年的GDP值为亿元,五次多项式拟合和多logistic模型的误差都保持在3%以下。因此,总体而言,多logistic模型更符合不断调整变化的经济增长规律,拟合预测效果都很好。多logistic模型预测到2012年山西省GDP值为亿元,而2012年山西省GDP的实际值为亿元,相对误差为,1991年到2011年的拟合相对误差都保持在5%以内,预测值相关系数达到,模型可信度很高。分析表10的数据,可以看到2015年前山西省GDP仍将保持快速稳定地增长,经济转型跨越发展政策利好,社会经济生活秩序良好。参考文献[1]孙旭东,姜金秋,王国辉. GDP分析预测模型[OL].中国科技论文在线,[2006-10-05]. [2]孙彩,姜明辉.基于GP的非线性GDP预测模型的构造与应用[J].哈尔滨工业大学学报(社会科学版).2008,10(1):133-138.[3]山西省统计信息网..[4]卓金武.MATLAB在数学建模中的应用[M]。北京:北京航空航天大学出版社,2011:6-9.[5]杨华龙,刘金霞,郑斌.灰色预测GM(1,1)模型的改进及应用[J].数学的实践与认识,2011,41(23):39-46.[6]郭石磊,王云鹏. 改进的 Logistic 模型预测人口数量[J]. 宁波职业技术学院学报,2010,14(2):44-45.[7]范国兵.一种估计Logistic 模型参数的方法及应用实例[J]. 经济数学,2010,27(1):105-110.