概率统计论文模板

统计学是一门实质性的社会科学，既研究社会生活的客观规律，也研究统计方法。下文是我为大家整理的关于统计相关论文的范文，欢迎大家阅读参考!

浅谈概率在统计学中的应用

摘要：概率是研究随机现象的数学学科，其理论严谨、应用广泛、发展迅速。目前，概率的理论与方法已广泛应用于统计学中，主要是从正态分布、小概率事件两方面介绍了概率在统计学中的一些应用。

关键词：随机现象;事件;样本;母体;正态分布;小概率原理

统计学主要分为描述性统计学和推断性统计学。给定一组数据统计学可以摘要并且描述这些数据，这个用法称为描述性统计学。另外，观察者以数据的形式建立起一个用以解释其随机性和不确定性的数学模型，以之来推论研究中的步骤及母体，这种用法被称为应用统计学。另外，还有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。

同一仪器多次测量同一物体的重量，所得的结果彼此总是略有差异，这是由于诸如测量仪器受大气影响，观察者身体或心理上的变化等等偶然因素引起的。同样的，同一门炮向同一目标发射多发同种炮弹，弹落点也不一样，因为炮弹制造时的种种偶然因素对炮弹质量也会有影响。此外，炮筒位置的误差，天气条件的微小变化等等都影响弹落点。再如从某生产线上用同一种工艺生产出来的灯泡寿命也是有差异的等等。

总之所举这些现象的一个共同点是：在基本条件不变的情况下，经过一系列试验或观察会得到不同的结果。换句话说，就个别的试验结果或观察结果而言，它会时而出现这种结果，时而出现那种结果，呈现出一种偶然性。这种现象称为随机现象。对于随机现象通常关心的是在试验或观察中某个结果是否出现，这种结果称为随机事件，简称事件。为了实际的理由选择研究团体的子集代替研究母体的每一笔资料，这个子集称作样本。推论统计学被用来将资料中的数据模型化，计算它的几率并且做出对于母体的推论，这个推论可能以对或错的答案呈现(假设检验)出对未来观察的预测，关联性的预测，或是将关系模式化(回归)。

随机现象有其偶然性的一面，也有其必然性的一面。这种必然性表现为大量试验中随机事件出现的频率的稳定性，即一个随机事件的频率常在某个固定的常数附近摆动，这种规律我们称之为统计规律性。频率的稳定性说明随机事件发生的可能性的大小是随机事件本身所固有的，不随人们的意志而改变的一种客观属性，因此可以对它进行度量。对于一个随机事件A用一个数p(A)来表示该事件发生的可能性的大小，这个数p(A)就称为随机事件A的概率，因此概率度量了随机事件发生的可能性的大小。

如果样本足以代表母体，那么由样本所做的推论和结论可以引申到整个母体之上，统计学提供了许多方法来估计和修正样本资料过程中的随机性(误差)。要了解随机性的一定几率必须具备基本的数学观念。数理统计是应用数学的分支，它使用几率论来分析并且验证统计的理论基础。

概率在统计学中有着重要的作用，包括总体、抽样研究、统计描述、统计推断、正态分布规律等，正态分布是概率中最重要的一种分布。一方面正态分布是自然界最常见的一种分布，例如测量的误差;炮弹弹落点的分布;人的生理特征的尺寸：身长、体重等;农作物的收获量;工厂产品的尺寸：直径、长度、宽度、高度，都近似服从正态分布。

一般来说若影响某一个数量指标的随机因素很多，而每个因素所起的作用又不太大，则服从正态分布这点可以用概率论的极限定理来加以证明。另一方面正态分布具有许多良好的性质，许多分布可用正态分布来近似，另外一些分布又可由正态分布来导出，因此在理论研究中，正态分布十分重要。如利用正态分布规律统计学校的成绩分布，得出一个阶段的学生总体是否进步，然后寻找原因，得出改进办法。分析一年经济的发展，预测来年的收入。找出影响发展的主要因素，寻求改进的方法等等。

小概率事件即发生概率很小的事件(p≤0.05)，在统计学中有着重要的应用，这样的事件理论上发生的可能性则几乎为零。如买彩票中大奖，就是典型的小概率事件，也许每一期均会有大奖开出(可能性很小)，但对于每一个彩民来说，他买一注中大奖的可能性(小概率事件在一次试验中就发生的概率几乎没有。其实，这就是小概率事件在统计学上应用的重要理论依据——小概率原理。)即小概率事件在一次试验中发生的可能性很小，如果真的发生了，根据统计学可怀疑其真实性。

如某接待站在一天内共接待5人单独来访，结果这5人全在周一到访，由此能否推断接待站有规定的接待日?假定没有规定的接待日，一个来访者在五天中任何一天来访都是等可能的用Am(m=1,2,3,4,5,)表示“一周接待了m个人，全都是周一来访”事件，Am的概率如下表示：

事件 A1概率 0.2 事件 A2概率 0.22

事件 A3概率 0.23 事件 A4概率 0.24

事件 A5概率 0.25

5个人都在周一来访的概率为0.00032，大约万分之三。现在概率很小的事件在一次试验中发生了，于是怀疑假定的正确性，从而推断接待站有规定的接待日。

公元1814年，拉普拉斯在他的新作中，记载了一个有趣的统计，世界上男婴与女婴的出生比值是22∶21，即在出生的婴儿中，男婴占51.2%，女婴占48.8%，可奇怪的是1745-1784年四十年间统计巴黎男婴的出生率时，却得到另一个比是25∶24，男婴占51.02%，与前者相差0.18%，对于这千分之一点八的微小差异，进行调查研究，发现巴黎人有“重女轻男”的现象，有抛弃男婴的陋习，以至于歪曲了出生率，经过修正出生比依然是22∶21。统计学依据小概率原理作出结论的正确性很高，但也存在犯错误的风险(较低)。

小概率原理在统计上有着非常重要的应用。如假设检验结论的判断，假设检验是用样本信息推测总体的一种统计推断方法，由于抽样误差的存在，样本信息和总体特征间可能不尽相同，所以假设检验实际上就是判断待比较各方的差别是不是由抽样误差造成的。假设检验中p值的大小反映的就是差别由抽样误差造成的概率。在假设检验中就是通过比较p值与检验水准a(通常设为0.05)的大小关系,从而做出差别有无统计学意义。

如果p值小于a统计学则认为差别由抽样误差造成的概率很低,那么根据小概率原理认为,小概率事件在一次抽样中就发生的可能性几乎为零,所以判定差别可能是由于比较各方在本质上的不同导致的。否则认为差别是由抽样误差造成的。在这里检验水准是在假设检验前认为设定的，是研究者能够承受的本次假设检验放弃真错误的概率，也可以理解为是研究者设立的小概率事件的概率。而p值则是通过计算，即在检验假设成立的情况下，差别是由抽样误差造成的概率。

统计在现代化管理和社会生活中的地位日益重要，随着社会经济和科学技术的发展统计在现代化国家管理和企业管理中的地位越来越重要，人们的日常生活都离不开统计，统计的影响是这样巨大，故与之密切相关的概率的作用也越来越重要。

浅谈统计学基础教学方法与学生应用能力的培养

摘要:统计学基础知识是一门研究数据的技术性学科,具有综合性,抽象性及应用面广等特点,通过该课程的教学能培养学生运用统计工具,系统的分析问题和解决问题的能力。在中职教学中需结合本学科的特点,不断改进教学方法,提高学生综合应用统计知识的能力。

关键词:统计学教学方法设计能力培养

统计学基础知识是一门研究数据的技术性学科,学科内容中的调查研究和分析处理问题的方法,不仅应用于各项工作中,也用于其他学科研究过程中的数据搜集、整理、分析并得出结论。故统计学具有综合性,抽象性,应用面广等特点,通过该课程的教学能培养学生运用统计工具,系统的分析问题和解决问题的能力。现结合本学科的特点探讨其教学方法和学生应用能力的培养。

一、统计学基础课程教学的特点

统计学基础也是社会经济统计学原理,其学科内容的特点:一是基本概念多,理论讲授上较抽象;二是指标类别多,初学时严格划清各种指标内涵难;三是调查分析方法多,正确理解和选择恰当的调查方法难;四是正确的调查方式、方法指标体系的设置,统计范围的界定与是否得出反映事物的正确结论直接相关;五是科学设置调查事物的指标体系又与弄清反映该事物的客观内在本质的相关指标直接相关。因此,对年龄小,分析能力差的中职学生教学对象来讲,即便从概念上掌握了统计学的原理,如果不结合实际的统计案例资料和采用恰当的教学方法,就很难达到正确应用统计知识解决现实社会经济中问题的目的,甚至会因为错误使用方法,得出对事物评判的错误结论。

二、结合本学科知识的特点采用适当的教学方法,增强应用能力的培养

在教学中,首先通过对教材内容体系的全面分析和教学对象知识结构的分析,以及学生对统计学知识学习的兴趣、理解的深度和掌握应用情况的总结,在教学中的不同环节恰当地实施不同的教学方法。

1、通过学科内容体系导入与工作任务联系,提升学生学习兴趣

在讲授本学科内容时,首先给学生介绍统计学基础教材内容的基本框架:统计学的涵义、研究对象、性质、职能和研究的基本方法。其次是介绍学科知识体系:统计学中的基本概念,统计资料调查整理的方式方法,统计数据的显示与提供,以及提供的统计数字资料运用多种指标法进行分析(总量指标法--反映事物的规模状况,平均指标法--反映事物的集中趋势及一般规律,相对指标法--反映事物的纵向横向比较和事物之间的联系,标准差法--反映事物中总体单位标志值之间的离散趋势和程度,分析事物之间的差异。统计指数法--反映事物中各种直接因素的影响。

时间数列法--反映事物在时间段上的发展变化趋势。抽样调查法--统计专门调查方法中最科学的方法。相关回归分析法--分析事物中的因果关系。)通过内容体系的简单讲解导入,让学生在学习具体理论知识前就对该学科有一个总体感性认识,产生兴趣。带着要通过掌握统计知识去解决实际问题的意识和目的去学习。

2、让学生的学习从理性认识过渡到感性认识,增强应用能力

我在教学中介绍统计学的基本概念和统计调查方法内容时,除对每个知识点进行举例说明外,一部分知识讲完后,给出几个典型的统计调查方案让学生弄清在这些调查方案中所涉及的统计总体、总体范围的界定、总体单位、标志、指标以及采用的哪种调查方式等。这不仅让学生把抽象的统计学概念知识从理性认识过渡到了感性认识,而且通过这些案例还进一步让学生明白了调查方式的选用必须要根据调查对象和要解决的问题适当选取,而不是什么调查目的,什么事物都可以用任何一种调查方式。只有正确选用统计方式、方法去调查分析客观事物才能得出正确的结论,才能具备正确利用统计知识去分析解决问题的能力。

3、综合指标应用与典型资料结合法,提高学生的应用能力在讲授综合指标法时,对每一种指标的理解都是

分别举例说明让学生理解该指标的含义和作用。为了让学生能正确理解和区分每一种指标的作用,在所有指标介绍完后,我选用了国民经济年度统计公报资料作为案例,让学生从统计公报资料中找出学习过的每一种综合指标,如:2007年全国GDP总值,人口数等是总量指标。本年度GDP完成百分比是计划完成相对指标,本年度GDP比上年度增长百分比是动态相对指标。人均GDP是强度相对指标。

GDP构成比例是结构相对指标。五年中平均每年增长的百分比是后面要学习的平均发展速度和平均增长速度的应用。通过这样的案例,学生不仅对各种综合指标法的应用有了正确的理解,而且把各种指标的理解认识变成了应用能力,同时还对后面学习动态数列知识奠定了基础。在教学中很好地起到了巩固理解知识和预习下一教学环节内容的潜在作用。还起到了掌握知识综合性的效果。通过这样一个案例,学生进一步明确,研究一个总体的问题时,可以对问题的不同方面运用多种指标进行分析,弄清事物之间客观存在的关联,这些都必须用一定的统计数据来说话。因此进一步强调了学生学习统计知识的必要性,也让他们认识到统计学知识的科学性和实用性。

4、新旧知识在现实案例中的综合运用,提升学生应用能力

在讲授统计指数的内容时,传授给学生统计指数编制的基本方法的原理,教材中举例的商品价格、商品量、以及职工工资水平指数的编制都仅仅是一种计算基本方法的介绍。要培养学生应用能力还必须结合实际统计指数编制的案例进行讲解,让学生能够将理论知识及其计算方法应用到实际工作中去,所以我特意在理论知识和计算方法讲完后,介绍实际工作中零售物价指数的编制。这个经济指数也是民众普遍关注的问题,与人们生活水平息息相关。

告诉学生,物价指数的编制运用了抽样调查的知识,实际工作中不可能对每一种商品都采价调查,而是分大类商品,在商场和集贸市场分别采价。例如集贸市场的蔬菜价格每周至少要采集三次,每次要采集成交价的三人次,进入零售商品物价指数编制的价格实际上是一个多次简单平均的价格,而每天某种商品的三个价格要简单平均,每周三次的平均价格再简单平均。商场的商品价格如较稳定可用期初和期末的平均。通过这样一个案例,既给学生传授了新知识,又复习巩固了平均指标计算方法的具体应用,不仅日常生活中用,而且在经济研究中应用非常广泛。进一步告诉学生加权平均法和调和平均法在编制物价指数和其他社会经济现象指数中的应用。

5、典型调查案例教学法,培养学生综合应用统计知识,分析解决问题的能力

教学中我把学生应用统计知识,分析问题能力的培养放在抽样技术的教学内容中,抽样技术的基本理论也是抽象的。如,抽样误差,抽样平均误差,抽样的组织方式。针对研究对象的特点,都必须具体问题具体分析,而抽样误差的计算既涉及到平均指标的计算又涉及到标准差的计算,新旧知识的交替如何培养学生应用新旧知识计算、分析问题,解决问题是教学的难点。

为了突破这个难点,我在教学中利用了一个草席质量抽样调查的案例,这个案例体现了从制定调查方案中的调查方式的确定,采用主要标志划类,简单随机抽样原则,到调查实施的步骤:草席宽度分类,登记原验级等级,编顺序号,确定抽样总体,计算全级总体标准差,决定抽样数目,设计计算表格,决定样本号,现场调查中的统一验级标准。

验级过程:由5人分别验级,级数的最后确定采用众数办法,5人验级中的3人验级标准为准。以上这些都具有前面介绍的抽样调查方式的代表性,而又用到了平均指标和众数的方法。同时,在计算草席平均等级时,还用到了品质标志值平均指标的计算,即将等级品质标志值过渡成数量标志来计算该批不同尺寸草席的平均等级,再计算抽样指标与原验级指标之间的误差。

这样一个复杂的抽样调查过程和指标的计算结果,更清晰的告诉学生要说明和解决的问题:由于收购草席时,验级人员在判断标准上的误差带来了草席等级误差与价格的差异。而由于误差的存在,根据此抽样调查结果计算出的整个库存草席的总价值与实际价值的差异巨大。对导致这样的结果,进一步结合政策市场以及人为等多种因素进行分析,查找了原因并提出了切实可行的解决方案,促使了草席的收购价实相符。

通过以上几方面的教学方法设计,能让学生对统计学有更全面的认识,对学科基础内容有一个总体框架性把握,让那些学生在学习时感觉模糊的概念和繁杂的理论通过这几个教学环节的反复巩固和练习也逐步变得清晰,并大大提高了其综合应用统计知识的能力。

统计模型论文

在统计学中，统计模型是指当有些过程无法用理论分析方法导出其模型，但可通过试验或直接由工业过程测定数据，经过数理统计法求得各变量之间的函数关系。下文是我为大家整理的关于统计模型论文的范文，欢迎大家阅读参考!

统计套利模型的理论综述与应用分析

【摘要】统计套利模型是基于数量经济学和统计学建立起来的，在对历史数据分析的基础之上，估计相关变量的概率分布，并结合基本面数据对未来收益进行预测，发现套利机会进行交易。统计套利这种分析时间序列的统计学特性，使其具有很大的理论意义和实践意义。在实践方面广泛应用于个对冲基金获取收益，理论方面主要表现在资本有效性检验以及开放式基金评级，本文就统计套利的基本原理、交易策略、应用方向进行介绍。

【关键词】统计套利成对交易应用分析

一、统计套利模型的原理简介

统计套利模型是基于两个或两个以上具有较高相关性的股票或者其他证券，通过一定的方法验证股价波动在一段时间内保持这种良好的相关性，那么一旦两者之间出现了背离的走势，而且这种价格的背离在未来预计会得到纠正，从而可以产生套利机会。在统计套利实践中，当两者之间出现背离，那么可以买进表现价格被低估的、卖出价格高估的股票，在未来两者之间的价格背离得到纠正时，进行相反的平仓操作。统计套利原理得以实现的前提是均值回复，即存在均值区间(在实践中一般表现为资产价格的时间序列是平稳的，且其序列图波动在一定的范围之内)，价格的背离是短期的，随着实践的推移，资产价格将会回复到它的均值区间。如果时间序列是平稳的，则可以构造统计套利交易的信号发现机制，该信号机制将会显示是否资产价格已经偏离了长期均值从而存在套利的机会在某种意义上存在着共同点的两个证券(比如同行业的股票)，其市场价格之间存在着良好的相关性，价格往往表现为同向变化，从而价格的差值或价格的比值往往围绕着某一固定值进行波动。

二、统计套利模型交易策略与数据的处理

统计套利具体操作策略有很多，一般来说主要有成对/一篮子交易，多因素模型等，目前应用比较广泛的策略主要是成对交易策略。成对策略，通常也叫利差交易，即通过对同一行业的或者股价具有长期稳定均衡关系的股票的一个多头头寸和一个空头头寸进行匹配，使交易者维持对市场的中性头寸。这种策略比较适合主动管理的基金。

成对交易策略的实施主要有两个步骤：一是对股票对的选取。海通证券分析师周健在绝对收益策略研究―统计套利一文中指出，应当结合基本面与行业进行选股，这样才能保证策略收益，有效降低风险。比如银行，房地产，煤电行业等。理论上可以通过统计学中的聚类分析方法进行分类，然后在进行协整检验，这样的成功的几率会大一些。第二是对股票价格序列自身及相互之间的相关性进行检验。目前常用的就是协整理论以及随机游走模型。

运用协整理论判定股票价格序列存在的相关性，需要首先对股票价格序列进行平稳性检验，常用的检验方法是图示法和单位根检验法，图示法即对所选各个时间序列变量及一阶差分作时序图，从图中观察变量的时序图出现一定的趋势册可能是非平稳性序列，而经过一阶差分后的时序图表现出随机性，则序列可能是平稳的。但是图示法判断序列是否存在具有很大的主观性。理论上检验序列平稳性及阶输通过单位根检验来确定，单位根检验的方法很多，一般有DF，ADF检验和Phillips的非参数检验(PP检验)一般用的较多的方法是ADF检验。

检验后如果序列本身或者一阶差分后是平稳的，我们就可以对不同的股票序列进行协整检验，协整检验的方法主要有EG两步法，即首先对需要检验的变量进行普通的线性回归，得到一阶残差，再对残差序列进行单位根检验，如果存在单位根，那么变量是不具有协整关系的，如果不存在单位根，则序列是平稳的。EG检验比较适合两个序列之间的协整检验。除EG检验法之外，还有Johansen检验，Gregory hansan法，自回归滞后模型法等。其中johansen检验比较适合三个以上序列之间协整关系的检验。通过协整检验，可以判定股票价格序列之间的相关性，从而进行成对交易。

Christian L. Dunis和Gianluigi Giorgioni(2010)用高频数据代替日交易数据进行套利，并同时比较了具有协整关系的股票对和没有协整关系股票对进行套利的立即收益率，结果显示，股票间价格协整关系越高，进行统计套利的机会越多，潜在收益率也越高。

根据随机游走模型我们可以检验股票价格波动是否具有“记忆性”，也就是说是否存在可预测的成分。一般可以分为两种情况：短期可预测性分析及长期可预测性分析。在短期可预测性分析中，检验标准主要针对的是随机游走过程的第三种情况，即不相关增量的研究，可以采用的检验工具是自相关检验和方差比检验。在序列自相关检验中，常用到的统计量是自相关系数和鲍克斯-皮尔斯 Q统计量，当这两个统计量在一定的置信度下，显著大于其临界水平时，说明该序列自相关，也就是存在一定的可预测性。方差比检验遵循的事实是：随机游走的股价对数收益的方差随着时期线性增长，这些期间内增量是可以度量的。这样，在k期内计算的收益方差应该近似等于k倍的单期收益的方差，如果股价的波动是随机游走的，则方差比接近于1;当存在正的自相关时，方差比大于1;当存在负的自相关是，方差比小于1。进行长期可预测性分析，由于时间跨度较大的时候，采用方差比进行检验的作用不是很明显，所以可以采用R/S分析，用Hurst指数度量其长期可预测性，Hurst指数是通过下列方程的回归系数估计得到的：

Ln[(R/S)N]=C+H*LnN

R/S 是重标极差，N为观察次数，H为Hurst指数，C为常数。当H>0.5时说，说明这些股票可能具有长期记忆性，但是还不能判定这个序列是随机游走或者是具有持续性的分形时间序列，还需要对其进行显著性检验。

无论是采用协整检验还是通过随机游走判断，其目的都是要找到一种短期或者长期内的一种均衡关系，这样我们的统计套利策略才能够得到有效的实施。

进行统计套利的数据一般是采用交易日收盘价数据，但是最近研究发现，采用高频数据(如5分钟，10分钟，15分钟，20分钟收盘价交易数据)市场中存在更多的统计套利机会。日交易数据我们选择前复权收盘价，而且如果两只股票价格价差比较大，需要先进性对数化处理。Christian L. Dunis和Gianluigi Giorgioni(2010)分别使用15分钟收盘价，20分钟收盘价，30分以及一个小时收盘价为样本进行统计套利分析，结果显示，使用高频数据进行统计套利所取得收益更高。而且海通证券金融分析师在绝对收益策略系列研究中，用沪深300指数为样本作为统计套利配对交易的标的股票池，使用高频数据计算累计收益率比使用日交易数据高将近5个百分点。

三、统计套利模型的应用的拓展―检验资本市场的有效性

Fama(1969)提出的有效市场假说，其经济含义是:市场能够对信息作出迅速合理的反应,使得市场价格能够充分反映所有可以获得的信息,从而使资产的价格不可用当前的信息进行预测,以至于任何人都无法持续地获得超额利润.通过检验统计套利机会存在与否就可以验证资本市场是有效的的，弱有效的，或者是无效的市场。徐玉莲(2005)通过运用统计套利对中国资本市场效率进行实证研究，首先得出结论：统计套利机会的存在与资本市场效率是不相容的。以此为理论依据，对中国股票市场中的价格惯性、价格反转及价值反转投资策略是否存在统计套利机会进行检验，结果发现我国股票市场尚未达到弱有效性。吴振翔，陈敏(2007)曾经利用这种方法对我国A股市场的弱有效性加以检验，采用惯性和反转两种投资策略发现我国A股若有效性不成立。另外我国学者吴振翔，魏先华等通过对Hogan的统计套利模型进行修正，提出了基于统计套利模型对开放式基金评级的方法。

四、结论

统计套利模型的应用目前主要表现在两个方面：1.作为一种有效的交易策略，进行套利。2.通过检测统计套利机会的存在，验证资本市场或者某个市场的有效性。由于统计套利策略的实施有赖于做空机制的建立，随着我股指期货和融资融券业务的推出和完善，相信在我国会有比较广泛的应用与发展。

参考文献

[1] A.N. Burgess：A computational Methodolology for Modelling the Dynamics of statistical arbitrage, London business school,PhD Thesis,1999.

[2]方昊.统计套利的理论模式及应用分析―基于中国封闭式基金市场的检验.统计与决策,2005,6月(下).

[3]马理,卢烨婷.沪深 300 股指期货期现套利的可行性研究―基于统计套利模型的实证.财贸研究,2011,1.

[4]吴桥林.基于沪深 300 股指期货的套利策略研究[D].中国优秀硕士学位论文.2009.

[5]吴振翔,陈敏.中国股票市场弱有效性的统计套利检验[J].系统工程理论与实践.2007,2月.

关于半参统计模型的估计研究

【摘要】随着数据模型技术的迅速发展，现有的数据模型已经无法满足实践中遇到的一些测量问题，严重的限制了现代科学技术在数据模型上应用和发展，所以基于这种背景之下，学者们针对数据模型测量实验提出了新的理论和方法，并研制出了半参数模型数据应用。半参数模型数据是基于参数模型和非参数模型之上的一种新的测量数据模型，因此它具备参数模型和非参数模型很多共同点。本文将结合数据模型技术，对半参统计模型进行详细的探究与讨论。

【关键词】半参数模型完善误差测量值纵向数据

本文以半参数模型为例，对参数、非参数分量的估计值和观测值等内容进行讨论，并运用三次样条函数插值法得出非参数分量的推估表达式。另外，为了解决纵向数据下半参数模型的参数部分和非参数部分的估计问题，在误差为鞅差序列情形下，对半参数数据模型、渐近正态性、强相合性进行研究和分析。另外，本文初步讨论了平衡参数的选取问题，并充分说明了泛最小二乘估计方法以及相关结论，同时对半参数模型的迭代法进行了相关讨论和研究。

一、概论

在日常生活当中，人们所采用的参数数据模型构造相对简单，所以操作起来比较容易;但在测量数据的实际使用过程中存在着相关大的误差，例如在测量相对微小的物体，或者是对动态物体进行测量时。而建立半参数数据模型可以很好的解决和缓解这一问题：它不但能够消除或是降低测量中出现的误差，同时也不会将无法实现参数化的系统误差进行勾和。系统误差非常影响观测值的各种信息，如果能改善，就能使其实现更快、更及时、更准确的误差识别和提取过程;这样不仅可以提高参数估计的精确度，也对相关科学研究进行了有效补充。

举例来说，在模拟算例及坐标变换GPS定位重力测量等实际应用方面，体现了这种模型具有一定成功性及实用性;这主要是因为半参数数据模型同当前所使用的数据模型存在着一致性，可以很好的满足现在的实际需要。而新建立的半参数模型以及它的参数部分和非参数部分的估计，也可以解决一些污染数据的估计问题。这种半参数模型，不仅研究了纵向数据下其自身的t型估计，同时对一些含光滑项的半参数数据模型进行了详细的阐述。另外，基于对称和不对称这两种情况，可以在一个线性约束条件下对参数估计以及假设进行检验，这主要是因为对观测值产生影响的因素除了包含这个线性关系以外，还受到某种特定因素的干扰，所以不能将其归入误差行列。另外，基于自变量测量存在一定误差，经常会导致在计算过程汇总，丢失很多重要信息。

二、半参数回归模型及其估计方法

这种模型是由西方著名学者Stone在上世纪70年代所提出的，在80年代逐渐发展并成熟起来。目前，这种参数模型已经在医学以及生物学还有经济学等诸多领域中广泛使用开来。

半参数回归模型介于非参数回归模型和参数回归模型之间，其内容不仅囊括了线性部分，同时包含一些非参数部分，应该说这种模型成功的将两者的优点结合在一起。这种模型所涉及到的参数部分，主要是函数关系，也就是我们常说的对变量所呈现出来的大势走向进行有效把握和解释;而非参数部分则主要是值函数关系中不明确的那一部分，换句话就是对变量进行局部调整。因此，该模型能够很好的利用数据中所呈现出来的信息，这一点是参数回归模型还有非参数归回模型所无法比拟的优势，所以说半参数模型往往拥有更强、更准确的解释能力。

从其用途上来说，这种回归模型是当前经常使用的一种统计模型。其形式为：

三、纵向数据、线性函数和光滑性函数的作用

纵向数据其优点就是可以提供许多条件，从而引起人们的高度重视。当前纵向数据例子也非常多。但从其本质上讲，纵向数据其实是指对同一个个体，在不同时间以及不同地点之上，在重复观察之下所得到一种序列数据。但由于个体间都存在着一定的差别，从而导致在对纵向数据进行求方差时会出现一定偏差。在对纵向数据进行观察时，其观察值是相对独立的，因此其特点就是可以能够将截然不同两种数据和时间序列有效的结合在一起。即可以分析出来在个体上随着时间变化而发生的趋势，同时又能看出总体的变化形势。在当前很多纵向数据的研究中，不仅保留了其优点，并在此基础之上进行发展，实现了纵向数据中的局部线性拟合。这主要是人们希望可以建立输出变量和协变量以及时间效应的关系。可由于时间效应相对比较复杂，所以很难进行参数化的建模。

另外，虽然线性模型的估计已经取得大量的成果，但半参数模型估计至今为止还是空白页。线性模型的估计不仅仅是为了解决秩亏或病态的问题，还能在百病态的矩阵时，提供了处理线性、非线性及半参数模型等方法。首先，对观测条件较为接近的两个观测数据作为对照，可以削弱非参数的影响。从而将半参数模型变成线性模型，然后，按线性模型处理，得到参数的估计。而多数的情况下其线性系数将随着另一个变量而变化，但是这种线性系数随着时间的变化而变化，根本求不出在同一个模型中，所有时间段上的样本，亦很难使用一个或几个实函数来进行相关描述。在对测量数据处理时，如果将它看作为随机变量，往往只能达到估计的作用，要想在经典的线性模型中引入另一个变量的非线性函数，即模型中含有本质的非线性部分，就必须使用半参数线性模型。

另外就是指由各个部分组成的形态，研究对象是非线性系统中产生的不光滑和不可微的几何形体，对应的定量参数是维数，分形上统计模型的研究是当前国际非线性研究的重大前沿课题之一。因此，第一种途径是将非参数分量参数化的估计方法，也称之为参数化估计法，是关于半参数模型的早期工作，就是对函数空间附施加一定的限制，主要指光滑性。一些研究者认为半参数模型中的非参数分量也是非线性的，而且在大多数情形下所表现出来的往往是不光滑和不可微的。所以同样的数据，同样的检验方法，也可以使用立方光滑样条函数来研究半参数模型。

四、线性模型的泛最小二乘法与最小二乘法的抗差

(一)最小二乘法出现于18世纪末期

在当时科学研究中常常提出这样的问题：怎样从多个未知参数观测值集合中求出参数的最佳估值。尽管当时对于整体误差的范数，泛最小二乘法不如最小二乘法，但是当时使用最多的还是最小二乘法，其目的也就是为了估计参数。最小二乘法，在经过一段时间的研究和应用之后，逐步发展成为一整套比较完善的理论体系。现阶段不仅可以清楚地知道数据所服从的模型，同时在纵向数据半参数建模中，辅助以迭代加权法。这对补偿最小二乘法对非参数分量估计是非常有效，而且只要观测值很精确，那么该法对非参数分量估计更为可靠。例如在物理大地测量时，很早就使用用最小二乘配置法，并得到重力异常最佳估计值。不过在使用补偿最小二乘法来研究重力异常时，我们还应在兼顾着整体误差比较小的同时，考虑参数估计量的真实性。并在比较了迭代加权偏样条的基础上，研究最小二乘法在当前使用过程中存在的一些不足。应该说，该方法只强调了整体误差要实现最小，而忽略了对参数分量估计时出现的误差。所以在实际操作过程中，需要特别注意。

(二)半参模型在GPS定位中的应用和差分

半参模型在GPS相位观测中，其系统误差是影响高精度定位的主要因素，由于在解算之前模型存在一定误差，所以需及时观测误差中的粗差。GPS使用中，通过广播卫星来计算目标点在实际地理坐标系中具体坐标。这样就可以在操作过程中，发现并恢复整周未知数，由于观测值在卫星和观测站之间，是通过求双差来削弱或者是减少对卫星和接收机等系统误差的影响，因此难于用参数表达。但是在平差计算中，差分法虽然可以将观测方程的数目明显减少，但由于种种原因，依然无法取得令人满意的结果。但是如果选择使用半参数模型中的参数来表达系统误差，则能得到较好的效果。这主要是因为半参数模型是一种广义的线性回归模型，对于有着光滑项的半参数模型，在既定附加的条件之下，能够提供一个线性函数的估计方法，从而将测值中的粗差消除掉。

另外这种方法除了在GPS测量中使用之外，还可应用于光波测距仪以及变形监测等一些参数模型当中。在重力测量中的应用在很多情形下，尤其是数学界的理论研究，我们总是假定S是随机变量实际上，这种假设是合理的，近几年，我们对这种线性模型的研究取得了一些不错的成果，而且因其形式相对简洁，又有较高适用性，所以这种模型在诸多领域中发挥着重要作用。

通过模拟的算例及坐标变换GPS定位重力测量等实际应用，说明了该法的成功性及实用性，从理论上说明了流行的自然样条估计方法，其实质是补偿最小二乘方法的特例，在今后将会有广阔的发展空间。另外文章中提到的分形理论的研究对象应是非线性系统中产生的不光滑和不可微的几何形体，而且分形已经在断裂力学、地震学等中有着广泛的应用，因此应被推广使用到研究半参数模型中来，不仅能够更及时，更加准确的进行误差的识别和提取，同时可以提高参数估计的精确度，是对当前半参数模型研究的有力补充。

五、总结

文章所讲的半参数模型包括了参数、非参数分量的估计值和观测值等内容，并且用了三次样条函数插值法得到了非参数分量的推估表达式。另外，为了解决纵向数据前提下，半参数模型的参数部分和非参数部分的估计问题，在误差为鞅差序列情形下，对半参数数据模型、渐近正态性、强相合性进行研究和分析。同时介绍了最小二乘估计法。另外初步讨论了平衡参数的选取问题，还充分说明了泛最小二乘估计方法以及有关结论。在对半参数模型的迭代法进行了相关讨论和研究的基础之上，为迭代法提供了详细的理论说明，为实际应用提供了理论依据。

参考文献

[1]胡宏昌.误差为AR(1)情形的半参数回归模型拟极大似然估计的存在性[J].湖北师范学院学报(自然科学版)，2009(03).

[2]钱伟民，李静茹.纵向污染数据半参数回归模型中的强相合估计[J].同济大学学报(自然科学版)，2009(08).

[3]樊明智，王芬玲，郭辉.纵向数据半参数回归模型的最小二乘局部线性估计[J].数理统计与管理，2009(02).

[4]崔恒建，王强.变系数结构关系EV模型的参数估计[J].北京师范大学学报(自然科学版).2005(06).

[5]钱伟民，柴根象.纵向数据混合效应模型的统计分析[J].数学年刊A辑(中文版).2009(04)

[6]孙孝前，尤进红.纵向数据半参数建模中的迭代加权偏样条最小二乘估计[J].中国科学(A辑：数学)，2009(05).

[7]张三国，陈希孺.EV多项式模型的估计[J].中国科学(A辑)，2009(10).

[8]任哲，陈明华.污染数据回归分析中参数的最小一乘估计[J].应用概率统计，2009(03).

[9]张三国，陈希孺.有重复观测时EV模型修正极大似然估计的相合性[J].中国科学(A辑).2009(06).

[10]崔恒建，李勇，秦怀振.非线性半参数EV四归模型的估计理论[J].科学通报，2009(23).

[11]罗中明.响应变量随机缺失下变系数模型的统计推断[D].中南大学，2011.

[12]刘超男.两参数指数威布尔分布的参数Bayes估计及可靠性分析[D].中南大学，2008.

[13]郭艳.湖南省税收收入预测模型及其实证检验与经济分析[D].中南大学，2009.

[14]桑红芳.几类分布的参数估计的损失函数和风险函数的Bayes推断[D].中南大学，2009.

[15]朱琳.服从几类可靠性分布的无失效数据的bayes分析[D].中南大学，2009.

[16]黄芙蓉.指数族非线性模型和具有AR(1)误差线性模型的统计分析[D].南京理工大学，2009.

哪位有概率论与数理统计的论文？

是2篇？各一份还是什么？

概率论与数理统计”是理工科大学生的一门必修课程，由于该学科与生活实践和科学试验有着紧密的联系，是许多新发展的前沿学科(如控制论、信息论、可靠性理论、人工智能等)的基础，因此学好这一学科是十分重要的。�
“概率论与数理统计”的学习应注重的是概念的理解，而这正是广大学生所疏忽的，在复习时几乎有近一半以上学生对“什么是随机变量”、“为什么要引进随机变量”仍说不清楚。对于涉及随机变量的独立，不相关等概念更是无从着手，这一方面是因为高等数学处理的是“确定”的事件。如函数y=f(x)，当x确定后y有确定的值与之对应。而概率论中随机变量X在抽样前是不确定的，我们只能由随机试验确定它落在某一区域中的概率，要建立用“不确定性”的思维方法往往比较困难，如果套用确定性的思维方法就会出错。由于基本概念没有搞懂，即使是十分简单的题目也难以得分。从而造成低分多的现象。另一方面由于概率论中涉及的计算技巧不多，除了古典概型，几何概型和计算二维随机变量的函数分布时如何确定积分上、下限有一些计算的难点，其他的只是数值或者积分、导数的计算。因而如果概念清楚，那么解题往往很顺利且易得到正确答案，这正是高分较多的原因。�
根据上面分析，启示我们不能把高等数学的学习方法照搬到“概率统计”的学习上来，而应按照概率统计自身的特点提出学习方法，才能取得“事半功倍”的效果。下面我们分别对“概率论”和“数理统计”的学习方法提出一些建议。�

一、学习“概率论”要注意以下几个要点

1. 在学习“概率论”的过程中要抓住对概念的引入和背景的理解，例如为什么要引进“随机变量”这一概念。这实际上是一个抽象过程。正如小学生最初学数学时总是一个苹果加2个苹果等于3个苹果，然后抽象为1+2=3.对于具体的随机试验中的具体随机事件，可以计算其概率，但这毕竟是局部的，孤立的，能否将不同随机试验的不同样本空间予以统一，并对整个随机试验进行刻画？随机变量X(即从样本空间到实轴的单值实函数)的引进使原先不同随机试验的随机事件的概率都可转化为随机变量落在某一实数集合B的概率，不同的随机试验可由不同的随机变量来刻画。此外若对一切实数集合B，知道P(X∈B)。那么随机试验的任一随机事件的概率也就完全确定了。所以我们只须求出随机变量X的分布P(X∈B)。就对随机试验进行了全面的刻画。它的研究成了概率论的研究中心课题。故而随机变量的引入是概率论发展历史中的一个重要里程碑。类似地，概率公理化定义的引进，分布函数、离散型和连续型随机变量的分类，随机变量的数学特征等概念的引进都有明确的背景，在学习中要深入理解体会。�

2. 在学习“概率论”过程中对于引入概念的内涵和相互间的联系和差异要仔细推敲，例如随机变量概念的内涵有哪些意义：它是一个从样本空间到实轴的单值实函数X(w)，但它不同于一般的函数，首先它的定义域是样本空间，不同随机试验有不同的样本空间。而它的取值是不确定的，

随着试验结果的不同可取不同值，但是它取某一区间的概率又能根据随机试验予以确定，而我们关心的通常只是它的取值范围，即对于实轴上任一B，计算概率P(X∈B)，即随机变量X的分布。只有理解了随机变量的内涵，下面的概念如分布函数等等才能真正理解。又如随机事件的互不相容和相互独立两个概念通常会混淆，前者是事件的运算性质，后者是事件的概率性质，但它们又有一定联系，如果P(A)。P(B)＞0，则A，B独立则一定相容。类似地，如随机变量的独立和不相关等概念的联系与差异一定要真正搞懂。�

3. 搞懂了概率论中的各个概念，一般具体的计算都是不难的，如F(x)=P(X≤x)，EX，DX等按定义都易求得。计算中的难点有古典概型和几何概型的概率计算，二维随机变量的边缘分布fx(x)=∫-∞∞ f(x，y)dy，事件B的概率P((X，Y)∈B)=∫∫Bf(x，y)dxdy，卷积公式等的计算，它们形式上很简单，但是由于f(x，y)通常是分段函数，真正的积分限并不再是(-∞，∞)或B，这时如何正确确定事实上的积分限就成了正确解题的关键，要切实掌握。�

4. 概率论中也有许多习题，在解题过程中不要为解题而解题，而应理解题目所涉及的概念及解题的目的，至于具体计算中的某些技巧基本上在高等数学中都已学过。因此概率论学习的关键不在于做许多习题，而要把精力放在理解不同题型涉及的概念及解题的思路上去。这样往往能“事半功倍”。

二、学习“数理统计”要注意以下几个要点�

1. 由于数理统计是一门实用性极强的学科，在学习中要紧扣它的实际背景，理解统计方法的直观含义。了解数理统计能解决那些实际问题。对如何处理抽样数据，并根据处理的结果作出合理的统计推断，该结论的可靠性有多少要有一个总体的思维框架，这样，学起来就不会枯燥而且容易记忆。例如估计未知分布的数学期望，就要考虑到① 如何寻求合适的估计量的途径，②如何比较多个估计量的优劣？这样，针对①按不同的统计思想可推出矩估计和极大似然估计，而针对②又可分为无偏估计、有效估计、相合估计，因为不同的估计名称有着不同的含义，一个具体估计量可以满足上面的每一个，也可能不满足。掌握了寻求估计的统计思想，具体寻求估计的步骤往往是“套路子”的，并不困难，然而如果没有从根本上理解，仅死背套路子往往会出现各种错误。�

2. 许多同学在学习数理统计过程中往往抱怨公式太多，置信区间，假设检验表格多而且记不住。事实上概括起来只有八个公式需要记忆，而且它们之间有着紧密联系，并不难记，而区间估计和假设检验中只是这八个公式的不同运用而已，关键在于理解区间估计和假设检验的统计意义，在理解基础上灵活运用这八个公式，完全没有必要死记硬背。