在统计学中,统计模型是指当有些过程无法用理论分析 方法 导出其模型,但可通过试验或直接由工业过程测定数据,经过数理统计法求得各变量之间的函数关系。下文是我为大家整理的关于统计模型论文的 范文 ,欢迎大家阅读参考!
统计套利模型的理论综述与应用分析
【摘要】统计套利模型是基于数量经济学和统计学建立起来的,在对历史数据分析的基础之上,估计相关变量的概率分布,并结合基本面数据对未来收益进行预测,发现套利机会进行交易。统计套利这种分析时间序列的统计学特性,使其具有很大的理论意义和实践意义。在实践方面广泛应用于个对冲基金获取收益,理论方面主要表现在资本有效性检验以及开放式基金评级,本文就统计套利的基本原理、交易策略、应用方向进行介绍。
【关键词】统计套利 成对交易 应用分析
一、统计套利模型的原理简介
统计套利模型是基于两个或两个以上具有较高相关性的股票或者其他证券,通过一定的方法验证股价波动在一段时间内保持这种良好的相关性,那么一旦两者之间出现了背离的走势,而且这种价格的背离在未来预计会得到纠正,从而可以产生套利机会。在统计套利实践中,当两者之间出现背离,那么可以买进表现价格被低估的、卖出价格高估的股票,在未来两者之间的价格背离得到纠正时,进行相反的平仓操作。统计套利原理得以实现的前提是均值回复,即存在均值区间(在实践中一般表现为资产价格的时间序列是平稳的,且其序列图波动在一定的范围之内),价格的背离是短期的,随着实践的推移,资产价格将会回复到它的均值区间。如果时间序列是平稳的,则可以构造统计套利交易的信号发现机制,该信号机制将会显示是否资产价格已经偏离了长期均值从而存在套利的机会 在某种意义上存在着共同点的两个证券(比如同行业的股票), 其市场价格之间存在着良好的相关性,价格往往表现为同向变化,从而价格的差值或价格的比值往往围绕着某一固定值进行波动。
二、统计套利模型交易策略与数据的处理
统计套利具 体操 作策略有很多,一般来说主要有成对/一篮子交易,多因素模型等,目前应用比较广泛的策略主要是成对交易策略。成对策略,通常也叫利差交易,即通过对同一行业的或者股价具有长期稳定均衡关系的股票的一个多头头寸和一个空头头寸进行匹配,使交易者维持对市场的中性头寸。这种策略比较适合主动管理的基金。
成对交易策略的实施主要有两个步骤:一是对股票对的选取。海通证券分析师周健在绝对收益策略研究―统计套利一文中指出,应当结合基本面与行业进行选股,这样才能保证策略收益,有效降低风险。比如银行,房地产,煤电行业等。理论上可以通过统计学中的聚类分析方法进行分类,然后在进行协整检验,这样的成功的几率会大一些。第二是对股票价格序列自身及相互之间的相关性进行检验。目前常用的就是协整理论以及随机游走模型。
运用协整理论判定股票价格序列存在的相关性,需要首先对股票价格序列进行平稳性检验,常用的检验方法是图示法和单位根检验法,图示法即对所选各个时间序列变量及一阶差分作时序图,从图中观察变量的时序图出现一定的趋势册可能是非平稳性序列,而经过一阶差分后的时序图表现出随机性,则序列可能是平稳的。但是图示法判断序列是否存在具有很大的主观性。理论上检验序列平稳性及阶输通过单位根检验来确定,单位根检验的方法很多,一般有DF,ADF检验和Phillips的非参数检验(PP检验)一般用的较多的方法是ADF检验。
检验后如果序列本身或者一阶差分后是平稳的,我们就可以对不同的股票序列进行协整检验,协整检验的方法主要有EG两步法,即首先对需要检验的变量进行普通的线性回归,得到一阶残差,再对残差序列进行单位根检验,如果存在单位根,那么变量是不具有协整关系的,如果不存在单位根,则序列是平稳的。EG检验比较适合两个序列之间的协整检验。除EG检验法之外,还有Johansen检验,Gregory hansan法,自回归滞后模型法等。其中johansen检验比较适合三个以上序列之间协整关系的检验。通过协整检验,可以判定股票价格序列之间的相关性,从而进行成对交易。
Christian L. Dunis和Gianluigi Giorgioni(2010)用高频数据代替日交易数据进行套利,并同时比较了具有协整关系的股票对和没有协整关系股票对进行套利的立即收益率,结果显示,股票间价格协整关系越高,进行统计套利的机会越多,潜在收益率也越高。
根据随机游走模型我们可以检验股票价格波动是否具有“记忆性”,也就是说是否存在可预测的成分。一般可以分为两种情况:短期可预测性分析及长期可预测性分析。在短期可预测性分析中,检验标准主要针对的是随机游走过程的第三种情况,即不相关增量的研究,可以采用的检验工具是自相关检验和方差比检验。在序列自相关检验中,常用到的统计量是自相关系数和鲍克斯-皮尔斯 Q统计量,当这两个统计量在一定的置信度下,显著大于其临界水平时,说明该序列自相关,也就是存在一定的可预测性。方差比检验遵循的事实是:随机游走的股价对数收益的方差随着时期线性增长,这些期间内增量是可以度量的。这样,在k期内计算的收益方差应该近似等于k倍的单期收益的方差,如果股价的波动是随机游走的,则方差比接近于1;当存在正的自相关时,方差比大于1;当存在负的自相关是,方差比小于1。进行长期可预测性分析,由于时间跨度较大的时候,采用方差比进行检验的作用不是很明显,所以可以采用R/S分析,用Hurst指数度量其长期可预测性,Hurst指数是通过下列方程的回归系数估计得到的:
Ln[(R/S)N]=C+H*LnN
R/S 是重标极差,N为观察次数,H为Hurst指数,C为常数。当H>0.5时说,说明这些股票可能具有长期记忆性,但是还不能判定这个序列是随机游走或者是具有持续性的分形时间序列,还需要对其进行显著性检验。
无论是采用协整检验还是通过随机游走判断,其目的都是要找到一种短期或者长期内的一种均衡关系,这样我们的统计套利策略才能够得到有效的实施。
进行统计套利的数据一般是采用交易日收盘价数据,但是最近研究发现,采用高频数据(如5分钟,10分钟,15分钟,20分钟收盘价交易数据)市场中存在更多的统计套利机会。日交易数据我们选择前复权收盘价,而且如果两只股票价格价差比较大,需要先进性对数化处理。Christian L. Dunis和Gianluigi Giorgioni(2010)分别使用15分钟收盘价,20分钟收盘价,30分以及一个小时收盘价为样本进行统计套利分析,结果显示,使用高频数据进行统计套利所取得收益更高。而且海通证券金融分析师在绝对收益策略系列研究中,用沪深300指数为样本作为统计套利 配对 交易的标的股票池,使用高频数据计算累计收益率比使用日交易数据高将近5个百分点。
三、统计套利模型的应用的拓展―检验资本市场的有效性
Fama(1969)提出的有效市场假说,其经济含义是:市场能够对信息作出迅速合理的反应,使得市场价格能够充分反映所有可以获得的信息,从而使资产的价格不可用当前的信息进行预测,以至于任何人都无法持续地获得超额利润.通过检验统计套利机会存在与否就可以验证资本市场是有效的的,弱有效的,或者是无效的市场。徐玉莲(2005)通过运用统计套利对中国资本市场效率进行实证研究,首先得出结论:统计套利机会的存在与资本市场效率是不相容的。以此为理论依据,对中国股票市场中的价格惯性、价格反转及价值反转投资策略是否存在统计套利机会进行检验,结果发现我国股票市场尚未达到弱有效性。吴振翔,陈敏(2007)曾经利用这种方法对我国A股市场的弱有效性加以检验,采用惯性和反转两种投资策略发现我国A股若有效性不成立。另外我国学者吴振翔,魏先华等通过对Hogan的统计套利模型进行修正,提出了基于统计套利模型对开放式基金评级的方法。
四、结论
统计套利模型的应用目前主要表现在两个方面:1.作为一种有效的交易策略,进行套利。2.通过检测统计套利机会的存在,验证资本市场或者某个市场的有效性。由于统计套利策略的实施有赖于做空机制的建立,随着我股指期货和融资融券业务的推出和完善,相信在我国会有比较广泛的应用与发展。
参考文献
[1] A.N. Burgess:A computational Methodolology for Modelling the Dynamics of statistical arbitrage, London business school,PhD Thesis,1999.
[2]方昊.统计套利的理论模式及应用分析―基于中国封闭式基金市场的检验.统计与决策,2005,6月(下).
[3]马理,卢烨婷.沪深 300 股指期货期现套利的可行性研究―基于统计套利模型的实证.财贸研究,2011,1.
[4]吴桥林.基于沪深 300 股指期货的套利策略研究[D].中国优秀硕士学位论文.2009.
[5]吴振翔,陈敏.中国股票市场弱有效性的统计套利检验[J].系统工程理论与实践.2007,2月.
关于半参统计模型的估计研究
【摘要】随着数据模型技术的迅速发展,现有的数据模型已经无法满足实践中遇到的一些测量问题,严重的限制了现代科学技术在数据模型上应用和发展,所以基于这种背景之下,学者们针对数据模型测量实验提出了新的理论和方法,并研制出了半参数模型数据应用。半参数模型数据是基于参数模型和非参数模型之上的一种新的测量数据模型,因此它具备参数模型和非参数模型很多共同点。本文将结合数据模型技术,对半参统计模型进行详细的探究与讨论。
【关键词】半参数模型 完善误差 测量值 纵向数据
本文以半参数模型为例,对参数、非参数分量的估计值和观测值等内容进行讨论,并运用三次样条函数插值法得出非参数分量的推估表达式。另外,为了解决纵向数据下半参数模型的参数部分和非参数部分的估计问题,在误差为鞅差序列情形下,对半参数数据模型、渐近正态性、强相合性进行研究和分析。另外,本文初步讨论了平衡参数的选取问题,并充分说明了泛最小二乘估计方法以及相关结论,同时对半参数模型的迭代法进行了相关讨论和研究。
一、概论
在日常生活当中,人们所采用的参数数据模型构造相对简单,所以操作起来比较容易;但在测量数据的实际使用过程中存在着相关大的误差,例如在测量相对微小的物体,或者是对动态物体进行测量时。而建立半参数数据模型可以很好的解决和缓解这一问题:它不但能够消除或是降低测量中出现的误差,同时也不会将无法实现参数化的系统误差进行勾和。系统误差非常影响观测值的各种信息,如果能改善,就能使其实现更快、更及时、更准确的误差识别和提取过程;这样不仅可以提高参数估计的精确度,也对相关科学研究进行了有效补充。
举例来说,在模拟算例及坐标变换GPS定位重力测量等实际应用方面,体现了这种模型具有一定成功性及实用性;这主要是因为半参数数据模型同当前所使用的数据模型存在着一致性,可以很好的满足现在的实际需要。而新建立的半参数模型以及它的参数部分和非参数部分的估计,也可以解决一些污染数据的估计问题。这种半参数模型,不仅研究了纵向数据下其自身的t型估计,同时对一些含光滑项的半参数数据模型进行了详细的阐述。另外,基于对称和不对称这两种情况,可以在一个线性约束条件下对参数估计以及假设进行检验,这主要是因为对观测值产生影响的因素除了包含这个线性关系以外,还受到某种特定因素的干扰,所以不能将其归入误差行列。另外,基于自变量测量存在一定误差,经常会导致在计算过程汇总,丢失很多重要信息。
二、半参数回归模型及其估计方法
这种模型是由西方著名学者Stone在上世纪70年代所提出的,在80年代逐渐发展并成熟起来。目前,这种参数模型已经在医学以及生物学还有经济学等诸多领域中广泛使用开来。
半参数回归模型介于非参数回归模型和参数回归模型之间,其内容不仅囊括了线性部分,同时包含一些非参数部分,应该说这种模型成功的将两者的优点结合在一起。这种模型所涉及到的参数部分,主要是函数关系,也就是我们常说的对变量所呈现出来的大势走向进行有效把握和解释;而非参数部分则主要是值函数关系中不明确的那一部分,换句话就是对变量进行局部调整。因此,该模型能够很好的利用数据中所呈现出来的信息,这一点是参数回归模型还有非参数归回模型所无法比拟的优势,所以说半参数模型往往拥有更强、更准确的解释能力。
从其用途上来说,这种回归模型是当前经常使用的一种统计模型。其形式为:
三、纵向数据、线性函数和光滑性函数的作用
纵向数据其优点就是可以提供许多条件,从而引起人们的高度重视。当前纵向数据例子也非常多。但从其本质上讲,纵向数据其实是指对同一个个体,在不同时间以及不同地点之上,在重复观察之下所得到一种序列数据。但由于个体间都存在着一定的差别,从而导致在对纵向数据进行求方差时会出现一定偏差。在对纵向数据进行观察时,其观察值是相对独立的,因此其特点就是可以能够将截然不同两种数据和时间序列有效的结合在一起。即可以分析出来在个体上随着时间变化而发生的趋势,同时又能看出总体的变化形势。在当前很多纵向数据的研究中,不仅保留了其优点,并在此基础之上进行发展,实现了纵向数据中的局部线性拟合。这主要是人们希望可以建立输出变量和协变量以及时间效应的关系。可由于时间效应相对比较复杂,所以很难进行参数化的建模。
另外,虽然线性模型的估计已经取得大量的成果,但半参数模型估计至今为止还是空白页。线性模型的估计不仅仅是为了解决秩亏或病态的问题,还能在百病态的矩阵时,提供了处理线性、非线性及半参数模型等方法。首先,对观测条件较为接近的两个观测数据作为对照,可以削弱非参数的影响。从而将半参数模型变成线性模型,然后,按线性模型处理,得到参数的估计。而多数的情况下其线性系数将随着另一个变量而变化,但是这种线性系数随着时间的变化而变化,根本求不出在同一个模型中,所有时间段上的样本,亦很难使用一个或几个实函数来进行相关描述。在对测量数据处理时,如果将它看作为随机变量,往往只能达到估计的作用,要想在经典的线性模型中引入另一个变量的非线性函数,即模型中含有本质的非线性部分,就必须使用半参数线性模型。
另外就是指由各个部分组成的形态,研究对象是非线性系统中产生的不光滑和不可微的几何形体,对应的定量参数是维数,分形上统计模型的研究是当前国际非线性研究的重大前沿课题之一。因此,第一种途径是将非参数分量参数化的估计方法,也称之为参数化估计法,是关于半参数模型的早期工作,就是对函数空间附施加一定的限制,主要指光滑性。一些研究者认为半参数模型中的非参数分量也是非线性的,而且在大多数情形下所表现出来的往往是不光滑和不可微的。所以同样的数据,同样的检验方法,也可以使用立方光滑样条函数来研究半参数模型。
四、线性模型的泛最小二乘法与最小二乘法的抗差
(一)最小二乘法出现于18世纪末期
在当时科学研究中常常提出这样的问题:怎样从多个未知参数观测值集合中求出参数的最佳估值。尽管当时对于整体误差的范数,泛最小二乘法不如最小二乘法,但是当时使用最多的还是最小二乘法,其目的也就是为了估计参数。最小二乘法,在经过一段时间的研究和应用之后,逐步发展成为一整套比较完善的理论体系。现阶段不仅可以清楚地知道数据所服从的模型,同时在纵向数据半参数建模中,辅助以迭代加权法。这对补偿最小二乘法对非参数分量估计是非常有效,而且只要观测值很精确,那么该法对非参数分量估计更为可靠。例如在物理大地测量时,很早就使用用最小二乘配置法,并得到重力异常最佳估计值。不过在使用补偿最小二乘法来研究重力异常时,我们还应在兼顾着整体误差比较小的同时,考虑参数估计量的真实性。并在比较了迭代加权偏样条的基础上,研究最小二乘法在当前使用过程中存在的一些不足。应该说,该方法只强调了整体误差要实现最小,而忽略了对参数分量估计时出现的误差。所以在实际操作过程中,需要特别注意。
(二)半参模型在GPS定位中的应用和差分
半参模型在GPS相位观测中,其系统误差是影响高精度定位的主要因素,由于在解算之前模型存在一定误差,所以需及时观测误差中的粗差。GPS使用中,通过广播卫星来计算目标点在实际地理坐标系中具体坐标。这样就可以在操作过程中,发现并恢复整周未知数,由于观测值在卫星和观测站之间,是通过求双差来削弱或者是减少对卫星和接收机等系统误差的影响,因此难于用参数表达。但是在平差计算中,差分法虽然可以将观测方程的数目明显减少,但由于种种原因,依然无法取得令人满意的结果。但是如果选择使用半参数模型中的参数来表达系统误差,则能得到较好的效果。这主要是因为半参数模型是一种广义的线性回归模型,对于有着光滑项的半参数模型,在既定附加的条件之下,能够提供一个线性函数的估计方法,从而将测值中的粗差消除掉。
另外这种方法除了在GPS测量中使用之外,还可应用于光波测距仪以及变形监测等一些参数模型当中。在重力测量中的应用在很多情形下,尤其是数学界的理论研究,我们总是假定S是随机变量实际上,这种假设是合理的,近几年,我们对这种线性模型的研究取得了一些不错的成果,而且因其形式相对简洁,又有较高适用性,所以这种模型在诸多领域中发挥着重要作用。
通过模拟的算例及坐标变换GPS定位重力测量等实际应用,说明了该法的成功性及实用性,从理论上说明了流行的自然样条估计方法,其实质是补偿最小二乘方法的特例,在今后将会有广阔的发展空间。另外 文章 中提到的分形理论的研究对象应是非线性系统中产生的不光滑和不可微的几何形体,而且分形已经在断裂力学、地震学等中有着广泛的应用,因此应被推广使用到研究半参数模型中来,不仅能够更及时,更加准确的进行误差的识别和提取,同时可以提高参数估计的精确度,是对当前半参数模型研究的有力补充。
五、 总结
文章所讲的半参数模型包括了参数、非参数分量的估计值和观测值等内容,并且用了三次样条函数插值法得到了非参数分量的推估表达式。另外,为了解决纵向数据前提下,半参数模型的参数部分和非参数部分的估计问题,在误差为鞅差序列情形下,对半参数数据模型、渐近正态性、强相合性进行研究和分析。同时介绍了最小二乘估计法。另外初步讨论了平衡参数的选取问题,还充分说明了泛最小二乘估计方法以及有关结论。在对半参数模型的迭代法进行了相关讨论和研究的基础之上,为迭代法提供了详细的理论说明,为实际应用提供了理论依据。
参考文献
[1]胡宏昌.误差为AR(1)情形的半参数回归模型拟极大似然估计的存在性[J].湖北师范学院学报(自然科学版),2009(03).
[2]钱伟民,李静茹.纵向污染数据半参数回归模型中的强相合估计[J].同济大学学报(自然科学版),2009(08).
[3]樊明智,王芬玲,郭辉.纵向数据半参数回归模型的最小二乘局部线性估计[J].数理统计与管理,2009(02).
[4]崔恒建,王强.变系数结构关系EV模型的参数估计[J].北京师范大学学报(自然科学版).2005(06).
[5]钱伟民,柴根象.纵向数据混合效应模型的统计分析[J].数学年刊A辑(中文版).2009(04)
[6]孙孝前,尤进红.纵向数据半参数建模中的迭代加权偏样条最小二乘估计[J].中国科学(A辑:数学),2009(05).
[7]张三国,陈希孺.EV多项式模型的估计[J].中国科学(A辑),2009(10).
[8]任哲,陈明华.污染数据回归分析中参数的最小一乘估计[J].应用概率统计,2009(03).
[9]张三国,陈希孺.有重复观测时EV模型修正极大似然估计的相合性[J].中国科学(A辑).2009(06).
[10]崔恒建,李勇,秦怀振.非线性半参数EV四归模型的估计理论[J].科学通报,2009(23).
[11]罗中明.响应变量随机缺失下变系数模型的统计推断[D].中南大学,2011.
[12]刘超男.两参数指数威布尔分布的参数Bayes估计及可靠性分析[D].中南大学,2008.
[13]郭艳.湖南省税收收入预测模型及其实证检验与经济分析[D].中南大学,2009.
[14]桑红芳.几类分布的参数估计的损失函数和风险函数的Bayes推断[D].中南大学,2009.
[15]朱琳.服从几类可靠性分布的无失效数据的bayes分析[D].中南大学,2009.
[16]黄芙蓉.指数族非线性模型和具有AR(1)误差线性模型的统计分析[D].南京理工大学,2009.
猜你喜欢:
1. 统计学分析论文
2. 统计方面论文优秀范文参考
3. 统计优秀论文范文
4. 统计学的论文参考范例
数学建模论文写作
一、写好数模答卷的重要性
1. 评定参赛队的成绩好坏、高低,获奖级别,数模答卷,是唯一依据。
2. 答卷是竞赛活动的成绩结晶的书面形式。
3. 写好答卷的训练,是科技写作的一种基本训练。
二、答卷的基本内容,需要重视的问题
1.评阅原则
假设的合理性,建模的创造性,结果的合理性,表述的清晰程度。
2.答卷的文章结构
题目(写出较确切的题目;同时要有新意、醒目)
摘要(200-300字,包括模型的主要特点、建模方法和主要结论)
关键词(求解问题、使用的方法中的重要术语)
1)问题重述。
2)问题分析。
3)模型假设。
4)符号说明。
5)模型的建立(问题分析,公式推导,基本模型,最终或简化模型等)。
6)模型求解(计算方法设计或选择;算法设计或选择,算法思想依据,步骤及实现,计算框图;所采用的软件名称;引用或建立必要的数学命题和定理;求解方案及流程。)
7)进一步讨论(结果表示、分析与检验,误差分析,模型检验)
8)模型评价(特点,优缺点,改进方法,推广。)
9)参考文献。
10)附录(计算程序,框图;各种求解演算过程,计算中间结果;各种图形,表格。)
3. 要重视的问题
1)摘要。
包括:
a. 模型的数学归类(在数学上属于什么类型);
b. 建模的思想(思路);
c. 算法思想(求解思路);
d. 建模特点(模型优点,建模思想或方法,算法特点,结果检验,灵敏度分析,模型检验……);
e. 主要结果(数值结果,结论;回答题目所问的全部“问题”)。
▲ 注意表述:准确、简明、条理清晰、合乎语法、要求符合文章格式。务必认真校对。
2)问题重述。
3)问题分析。
因素之间的关系、因素与环境之间的关系、因素自身的变化规律、确定研究的方法或模型的类型。
5)模型假设。
根据全国组委会确定的评阅原则,基本假设的合理性很重要。
a. 根据题目中条件作出假设
b. 根据题目中要求作出假设
关键性假设不能缺;假设要切合题意。
6) 模型的建立。
a. 基本模型:
ⅰ)首先要有数学模型:数学公式、方案等;
ⅱ)基本模型,要求完整,正确,简明;
b. 简化模型:
ⅰ)要明确说明简化思想,依据等;
ⅱ)简化后模型,尽可能完整给出;
c. 模型要实用,有效,以解决问题有效为原则。
数学建模面临的、要解决的是实际问题,不追求数学上的高(级)、深(刻)、难(度大)。
ⅰ)能用初等方法解决的、就不用高级方法;
ⅱ)能用简单方法解决的,就不用复杂方法;
ⅲ)能用被更多人看懂、理解的方法,就不用只能少数人看懂、理解的方法。
d.鼓励创新,但要切实,不要离题搞标新立异。数模创新可出现在:
▲ 建模中,模型本身,简化的好方法、好策略等;
▲ 模型求解中;
▲ 结果表示、分析、检验,模型检验;
▲ 推广部分。
e.在问题分析推导过程中,需要注意的问题:
ⅰ)分析:中肯、确切;
ⅱ)术语:专业、内行;
ⅲ)原理、依据:正确、明确;
ⅳ)表述:简明,关键步骤要列出;
ⅴ)忌:外行话,专业术语不明确,表述混乱,冗长。
7)模型求解。
a. 需要建立数学命题时:
命题叙述要符合数学命题的表述规范,尽可能论证严密。
b. 需要说明计算方法或算法的原理、思想、依据、步骤。
若采用现有软件,说明采用此软件的理由,软件名称。
c. 计算过程,中间结果可要可不要的,不要列出。
d. 设法算出合理的数值结果。
8) 结果分析、检验;模型检验及模型修正;结果表示。
a. 最终数值结果的正确性或合理性是第一位的;
b. 对数值结果或模拟结果进行必要的检验;
结果不正确、不合理、或误差大时,分析原因, 对算法、计算方法、或模型进行修正、改进。
c. 题目中要求回答的问题,数值结果,结论,须一一列出;
d. 列数据问题:考虑是否需要列出多组数据,或额外数据对数据进行比较、分析,为各种方案的提出提供依据;
e. 结果表示:要集中,一目了然,直观,便于比较分析。
▲ 数值结果表示:精心设计表格;可能的话,用图形图表形式。
▲ 求解方案,用图示更好。
9)必要时对问题解答,作定性或规律性的讨论。最后结论要明确。
10)模型评价
优点突出,缺点不回避。
改变原题要求,重新建模可在此做。
推广或改进方向时,不要玩弄新数学术语。
11)参考文献
12)附录
详细的结果,详细的数据表格,可在此列出,但不要错,错的宁可不列。主要结果数据,应在正文中列出,不怕重复。
检查答卷的主要三点,把三关:
a. 模型的正确性、合理性、创新性
b. 结果的正确性、合理性
c. 文字表述清晰,分析精辟,摘要精彩
三、关于写答卷前的思考和工作规划
答卷需要回答哪几个问题――建模需要解决哪几个问题;
问题以怎样的方式回答――结果以怎样的形式表示;
每个问题要列出哪些关键数据――建模要计算哪些关键数据;
每个量,列出一组还是多组数――要计算一组还是多组数。
四、答卷要求的原理
1. 准确――科学性;
2. 条理――逻辑性;
3. 简洁――数学美;
4. 创新――研究、应用目标之一,人才培养需要;
5. 实用――建模、实际问题要求。
五、建模理念
1. 应用意识
要解决实际问题,结果、结论要符合实际;
模型、方法、结果要易于理解,便于实际应用;站在应用者的立场上想问题,处理问题。
2. 数学建模
用数学方法解决问题,要有数学模型;
问题模型的数学抽象,方法有普适性、科学性,不局限于本具体问题的解决。
3. 创新意识
建模有特点,更加合理、科学、有效、符合实际;更有普遍应用意义;不单纯为创新而创新。
数学建模
内容摘要:
数学作为现代科学的一种工具和手段,要了解什么是数学模型和数学建模,了解数学建模一般方法及步骤。
关键词:
数学模型、数学建模、实际问题
伴随着当今社会的科学技术的飞速发展,数学已经渗透到各个领域,数学建模也显得尤为重要。数学建模在人们生活中扮演着重要的角色,而且随着计算机技术的发展,数学建模更是在人类的活动中起着重要作用,数学建模也更好的为人类服务。
一、数学模型
数学模型是对于现实世界的一个特定对象,一个特定目的,根据特有的内在规律,做出一些必要的假设,运用适当的数学工具,得到一个数学结构.
简单地说:就是系统的某种特征的本质的数学表达式(或是用数学术语对部分现实世界的描述),即用数学式子(如函数,图形,代数方程,微分方程,积分方程,差分方程等)来描述(表述,模拟)所研究的客观对象或系统在某一方面的存在规律.
随着社会的发展,生物,医学,社会,经济……,各学科,各行业都涌现现出大量的实际课题,急待人们去研究,去解决.但是,社会对数学的需求并不只是需要数学家和专门从事数学研究的人才,而更大量的是需要在各部门中从事实际工作的人善于运用数学知识及数学的思维方法来解决他们每天面临的大量的实际问题,取得经济效益和社会效益.他们不是为了应用数学知识而寻找实际问题(就像在学校里做数学应用题),而是为了解决实际问题而需要用到数学.而且不止是要用到数学,很可能还要用到别的学科,领域的知识,要用到工作经验和常识.特别是在现代社会,要真正解决一个实际问题几乎都离不开计算机.可以这样说,在实际工作中遇到的问题,完全纯粹的只用现成的数学知识就能解决的问题几乎是没有的.你所能遇到的都是数学和其他东西混杂在一起的问题,不是"干净的"数学,而是"脏"的数学.其中的数学奥妙不是明摆在那里等着你去解决,而是暗藏在深处等着你去发现.也就是说,你要对复杂的实际问题进行分析,发现其中的可以用数学语言来描述的关系或规律,把这个实际问题化成一个数学问题,这就称为数学模型.
数学模型具有下列特征:数学模型的一个重要特征是高度的抽象性.通过数学模型能够将形象思维转化为抽象思维,从而可以突破实际系统的约束,运用已有的数学研究成果对研究对象进行深入的研究.数学模型的另一个特征是经济性.用数学模型研究不需要过多的专用设备和工具,可以节省大量的设备运行和维护费用,用数学模型可以大大加快研究工作的进度,缩短研究周期,特别是在电子计算机得到广泛应用的今天,这个优越性就更为突出.但是,数学模型具有局限性,在简化和抽象过程中必然造成某些失真.所谓"模型就是模型"(而不是原型),即是指该性质.
二、数学建模
数学建模是利用数学方法解决实际问题的一种实践.即通过抽象,简化,假设,引进变量等处理过程后,将实际问题用数学方式表达,建立起数学模型,然后运用先进的数学方法及计算机技术进行求解.简而言之,建立数学模型的这个过程就称为数学建模.
模型是客观实体有关属性的模拟.陈列在橱窗中的飞机模型外形应当象真正的飞机,至于它是否真的能飞则无关紧要;然而参加航模比赛的飞机模型则全然不同,如果飞行性能不佳,外形再象飞机,也不能算是一个好的模型.模型不一定是对实体的一种仿照,也可以是对实体的某些基本属性的抽象,例如,一张地质图并不需要用实物来模拟,它可以用抽象的符号,文字和数字来反映出该地区的地质结构.数学模型也是一种模拟,是用数学符号,数学式子,程序,图形等对实际课题本质属性的抽象而又简洁的刻划,它或能解释某些客观现象,或能预测未来的发展规律,或能为控制某一现象的发展提供某种意义下的最优策略或较好策略.数学模型一般并非现实问题的直接翻版,它的建立常常既需要人们对现实问题深入细微的观察和分析,又需要人们灵活巧妙地利用各种数学知识.这种应用知识从实际课题中抽象,提炼出数学模型的过程就称为数学建模.实际问题中有许多因素,在建立数学模型时你不可能,也没有必要把它们毫无遗漏地全部加以考虑,只能考虑其中的最主要的因素,舍弃其中的次要因素.数学模型建立起来了,实际问题化成了数学问题,就可以用数学工具,数学方法去解答这个实际问题.如果有现成的数学工具当然好.如果没有现成的数学工具,就促使数学家们寻找和发展出新的数学工具去解决它,这又推动了数学本身的发展.例如,开普勒由行星运行的观测数据总结出开普勒三定律,牛顿试图用自己发现的力学定律去解释它,但当时已有的数学工具是不够用的,这促使了微积分的发明.求解数学模型,除了用到数学推理以外,通常还要处理大量数据,进行大量计算,这在电子计算机发明之前是很难实现的.因此,很多数学模型,尽管从数学理论上解决了,但由于计算量太大而没法得到有用的结果,还是只有束之高阁.而电子计算机的出现和迅速发展,给用数学模型解决实际问题打开了广阔的道路.而在现在,要真正解决一个实际问题,离了计算机几乎是不行的.数学模型建立起来了,也用数学方法或数值方法求出了解答,是不是就万事大吉了呢 不是.既然数学模型只能近似地反映实际问题中的关系和规律,到底反映得好不好,还需要接受检验,如果数学模型建立得不好,没有正确地描述所给的实际问题,数学解答再正确也是没有用的.因此,在得出数学解答之后还要让所得的结论接受实际的检验,看它是否合理,是否可行,等等.如果不符合实际,还应设法找出原因,修改原来的模型,重新求解和检验,直到比较合理可行,才能算是得到了一个解答,可以先付诸实施.但是,十全十美的答案是没有的,已得到的解答仍有改进的余地,可以根据实际情况,或者继续研究和改进;或者暂时告一段落,待将来有新的情况和要求后再作改进.
应用数学知识去研究和和解决实际问题,遇到的第一项工作就是建立恰当的数学模型.从这一意义上讲,可以说数学建模是一切科学研究的基础.没有一个较好的数学模型就不可能得到较好的研究结果,所以,建立一个较好的数学模型乃是解决实际问题的关键之一.数学建模将各种知识综合应用于解决实际问题中,是培养和提高同学们应用所学知识分析问题,解决问题的能力的必备手段之一.
三、数学建模的一般方法
建立数学模型的方法并没有一定的模式,但一个理想的模型应能反映系统的全部重要特征:模型的可靠性和模型的使用性
建模的一般方法:
1.机理分析
机理分析就是根据对现实对象特性的认识,分析其因果关系,找出反映内部机理的规律,所建立的模型常有明确的物理或现实意义.
(1) 比例分析法--建立变量之间函数关系的最基本最常用的方法.
(2) 代数方法--求解离散问题(离散的数据,符号,图形)的主要方法.
(3) 逻辑方法--是数学理论研究的重要方法,对社会学和经济学等领域的实际
问题,在决策,对策等学科中得到广泛应用.
(4) 常微分方程--解决两个变量之间的变化规律,关键是建立"瞬时变化率"
的表达式.
(5) 偏微分方程--解决因变量与两个以上自变量之间的变化规律.
2.测试分析方法
测试分析方法就是将研究对象视为一个"黑箱"系统,内部机理无法直接寻求,通过测量系统的输入输出数据,并以此为基础运用统计分析方法,按照事先确定的准则在某一类模型中选出一个数据拟合得最好的模型.
(1) 回归分析法--用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式,由于处理的是静态的独立数据,故称为数理统计方法.
(2) 时序分析法--处理的是动态的相关数据,又称为过程统计方法.
(3) 回归分析法--用于对函数f(x)的一组观测值(xi,fi)i=1,2,…,n,确定函数的表达式,由于处理的是静态的独立数据,故称为数理统计方法.
(4) 时序分析法--处理的是动态的相关数据,又称为过程统计方法.
将这两种方法结合起来使用,即用机理分析方法建立模型的结构,用系统测试方法来确定模型的参数,也是常用的建模方法, 在实际过程中用那一种方法建模主要是根据我们对研究对象的了解程度和建模目的来决定.机理分析法建模的具体步骤大致可见左图.
3.仿真和其他方法
(1) 计算机仿真(模拟)--实质上是统计估计方法,等效于抽样试验.
① 离散系统仿真--有一组状态变量.
② 连续系统仿真--有解析表达式或系统结构图.
(2) 因子试验法--在系统上作局部试验,再根据试验结果进行不断分析修改,求得所需的模型结构.
(3) 人工现实法--基于对系统过去行为的了解和对未来希望达到的目标,并考虑到系统有关因素的可能变化,人为地组成一个系统.(参见:齐欢《数学模型方法》,华中理工大学出版社,1996)
四、数学模型的分类
数学模型可以按照不同的方式分类,下面介绍常用的几种.
1.按照模型的应用领域(或所属学科)分:如人口模型,交通模型,环境模型,生态模型,城镇规划模型,水资源模型,再生资源利用模型,污染模型等.范畴更大一些则形成许多边缘学科如生物数学,医学数学,地质数学,数量经济学,数学社会学等.
2.按照建立模型的数学方法(或所属数学分支)分:如初等数学模型,几何模型,微分方程模型,图论模型,马氏链模型,规划论模型等.
按第一种方法分类的数学模型教科书中,着重于某一专门领域中用不同方法建立模型,而按第二种方法分类的书里,是用属于不同领域的现成的数学模型来解释某种数学技巧的应用.在本书中我们重点放在如何应用读者已具备的基本数学知识在各个不同领域中建模.
3.按照模型的表现特性又有几种分法:
确定性模型和随机性模型 取决于是否考虑随机因素的影响.近年来随着数学的发展,又有所谓突变性模型和模糊性模型.
静态模型和动态模型 取决于是否考虑时间因素引起的变化.
线性模型和非线性模型 取决于模型的基本关系,如微分方程是否是线性的.
离散模型和连续模型 指模型中的变量(主要是时间变量)取为离散还是连续的.
虽然从本质上讲大多数实际问题是随机性的,动态的,非线性的,但是由于确定性,静态,线性模型容易处理,并且往往可以作为初步的近似来解决问题,所以建模时常先考虑确定性,静态,线性模型.连续模型便于利用微积分方法求解,作理论分析,而离散模型便于在计算机上作数值计算,所以用哪种模型要看具体问题而定.在具体的建模过程中将连续模型离散化,或将离散变量视作连续,也是常采用的方法.
4.按照建模目的分:有描述模型,分析模型,预报模型,优化模型,决策模型,控制模型等.
5.按照对模型结构的了解程度分:有所谓白箱模型,灰箱模型,黑箱模型.这是把研究对象比喻成一只箱子里的机关,要通过建模来揭示它的奥妙.白箱主要包括用力学,热学,电学等一些机理相当清楚的学科描述的现象以及相应的工程技术问题,这方面的模型大多已经基本确定,还需深入研究的主要是优化设计和控制等问题了.灰箱主要指生态,气象,经济,交通等领域中机理尚不十分清楚的现象,在建立和改善模型方面都还不同程度地有许多工作要做.至于黑箱则主要指生命科学和社会科学等领域中一些机理(数量关系方面)很不清楚的现象.有些工程技术问题虽然主要基于物理,化学原理,但由于因素众多,关系复杂和观测困难等原因也常作为灰箱或黑箱模型处理.当然,白,灰,黑之间并没有明显的界限,而且随着科学技术的发展,箱子的"颜色"必然是逐渐由暗变亮的.
五、数学建模的一般步骤
建模的步骤一般分为下列几步:
1.模型准备.首先要了解问题的实际背景,明确题目的要求,搜集各种必要的信息.
2.模型假设.在明确建模目的,掌握必要资料的基础上,通过对资料的分析计算,找出起主要作用的因素,经必要的精炼,简化,提出若干符合客观实际的假设,使问题的主要特征凸现出来,忽略问题的次要方面.一般地说,一个实际问题不经过简化假设就很难翻译成数学问题,即使可能,也很难求解.不同的简化假设会得到不同的模型.假设作得不合理或过份简单,会导致模型失败或部分失败,于是应该修改和补充假设;假设作得过分详细,试图把复杂对象的各方面因素都考虑进去,可能使你很难甚至无法继续下一步的工作.通常,作假设的依据,一是出于对问题内在规律的认识,二是来自对数据或现象的分析,也可以是二者的综合.作假设时既要运用与问题相关的物理,化学,生物,经济等方面的知识,又要充分发挥想象力,洞察力和判断力,善于辨别问题的主次,果断地抓住主要因素,舍弃次要因素,尽量将问题线性化,均匀化.经验在这里也常起重要作用.写出假设时,语言要精确,就象做习题时写出已知条件那样.
3.模型构成.根据所作的假设以及事物之间的联系, 利用适当的数学工具去刻划各变量之间的关系,建立相应的数学结构――即建立数学模型.把问题化为数学问题.要注意尽量采取简单的数学工具,因为简单的数学模型往往更能反映事物的本质,而且也容易使更多的人掌握和使用.
4.模型求解.利用已知的数学方法来求解上一步所得到的数学问题,这时往往还要作出进一步的简化或假设.在难以得出解析解时,也应当借助计算机求出数值解.
5.模型分析.对模型解答进行数学上的分析,有时要根据问题的性质分析变量间的依赖关系或稳定状况,有时是根据所得结果给出数学上的预报,有时则可能要给出数学上的最优决策或控制,不论哪种情况还常常需要进行误差分析,模型对数据的稳定性或灵敏性分析等.
6.模型检验.分析所得结果的实际意义,与实际情况进行比较,看是否符合实际,如果结果不够理想,应该修改,补充假设或重新建模,有些模型需要经过几次反复,不断完善.
7.模型应用.所建立的模型必须在实际中应用才能产生效益,在应用中不断改进和完善.应用的方式自然取决于问题的性质和建模的目的.
参考文献:
(1)齐欢《数学模型方法》,华中理工大学出版社,1996。
(2)《数学的实践与认识》,(季刊),中国数学会编辑出版。