首页学术期刊 显著性检验论文范文

显著性检验论文范文

显著性区域检测论文新闻显著性论文显著性检验论文范文

兜兜兜尔 2023-12-06 18:42:39

共3条回答301浏览

比福爷爷

1小时前发布
- 国民经济是一个错综复杂的多维度的整体,涉及到一个国家所有的经济利益群体,意义重大,因此需要通过国民经济统计来反映其总体状况和发展趋势。下面是我为大家推荐的国民经济学论文，供大家参考。
  
  国民经济学论文范文一：国民经济管理论文
  
  第1章前言
  
  长期而言，我国的产业结构域经济正常之间具有共同的随机变动趋势。因此，通过调整和优化产业结构从而控制经济增长的产业政策在中国是有效的。
  
  中国经济结构的不合理及需要重组是一个老话题。应该肯定，自从改革开放以来，中国的经济结构业已有所调整。例如，农业在GDP中所占比重的下降;外贸结构中初级产品比例有所调整;但随着经济全球化的发展及中国加入WTO，经济结构的调整与重组，已成为十分迫切的问题。经济结构调整是十分复杂的话题，需要做大量深入的调查研究工作及基础工作。
  
  第2章我国三大产业结构现状
  
  产业结构的现状
  
  产业结构，指的是国民经济各个产业部门之间和每个产业部门内部的构成以及它们之间相互制约的经济联系和数量对比关系，亦称国民经济的部门结构。它是通过产业之间的关系有机结合，在一般分工和特殊分工的基础上产生和发展起来的。而所谓产业优化升级，其含义一是指随着经济发展水平的提高或在相关政府政策引导下，一国的产业结构演变呈现由低级向高级发展并优化完善的过程，即推动产业结构合理化和高度化发展的过程。二是指产业个体向劳动密集型向资本和技术密集型经济领域发展的过程，即产业由低技术水平、低附加值状态向高技术、高附加值状态演变的过程。
  
  改革开放以来,尤其是进入新世纪以来,为适应全球高新技术产业竞争发展的大局和趋势,我国坚持体制创新与技术创新相结合,着力发展对经济增长有突破性重大带动作用的高新技术产业,有力地促进了产业结构调整。2010年国内生初步核实数计算的三次产业结构为，2010年国内生产总值现价总量为401202亿元，比初步核算数增加3219亿元，按不变价格计算的增长速度为，比初步核算数提高个百分点。其中，第一产业增加值为40534亿元，比初步核算数增加37亿元，增长速度为，与初步核算速度相同。第二产业增加值为187581亿元，比初步核算数增加1100亿元，增长速度为，比初步核算数提高个百分点。第三产业增加值为173087亿元，比初步核算数增加2082亿元，增长速度为，比初步核算数提高个百分点。按初步核实数计算的三次产业结构，第一产业占，第二产业占，第三产业占。
  
  近年来，我国第一产业比重持续下降，其中第三产业比重进一步提高，可见服务业对中国经济的贡献率越来越高，第三产业需继续大力发展。总体上目前我国的三大产业结构较为合理,逐步改变了各个产业之间的相对比重和技术关联,提高了产业结构的整体效率,优化了产业结构。
  
  产业结构存在的问题
  
  农业存在的问题
  
  改革开放以来,我国农业和农村经济取得了长足发展,农业产业结构经过不断调整形成了较好的格局。但是,目前的农业产业结构仍存在不少的问题。
  
  (1)农业基础设施仍然薄弱。供水、供电、交通、通信等基础设施还很不完善,有些地区的矛盾还比较尖锐。例如华北、西北等地区缺水较为严重,影响农业生产和人民生活。
  
  (2)农产品品种、品质结构尚不优化,农产品优质率较低。我国的牛、羊、猪等肉类产品、苹果、梨等水果产品、花卉产品,以及水产品等在国际市场上具有明显的价格优势,但面临着品种不优、质量不高的困扰。
  
  (3)农产品加工业尚处在初级阶段,保鲜、包装、贮运、销售体系发展滞后,初级产品与加工品比例不协调。发达国家的农产品加工业产值与农业产值之比大都在2:1以上,而我国只有∶1,与国外相比差距比较大。
  
  (4)农产品区域布局不合理,各地没有充分发挥自身的地区比较优势,未能形成有鲜明特色的农产品区域布局结构。
  
  第二产业存在的问题
  
  第二产业总量扩张明显,但生产结构不够合理,结构升级较慢,经济增长质量不高。主要表现在:。(1)处于全球价值链底端,产业升级面临困难。
  
  改革开放后的三十年,中国经济高速增长,批量化生产的成本优势使我国获得了“世界工厂”的称号。但我国的比较优势在相当程度上是依靠廉价劳动力获得的,这导致行业的竞争优势主要集中在低附加价值的非核心部件制造和劳动密集的装配环节中,产品的附加值难以提高。
  
  在总出口额中,加工贸易所占比重同样超过了50%。这表明,即使是本土企业,也严重依赖外国企业的订单,而不是依靠自主研发和自有产品来开拓国际市场。这种对订单的依赖是中国产业处于全球价值链底端的又一明证。而一旦国外市场出现疲软,这种模式就难以为继。此次金融危机就是一个很好的例证。
  
  (2)产业研发投入不足,技术创新能力差。目前,我国制造业总量规模占全球的6%,而研发投入仅占,研发投入严重匮乏,产业共性技术研究队伍出现严重萎缩。产业的技术创新能力差,导致对国外核心技术和关键部件高度依赖,企业无法在品质、创新等差异化竞争中取得优势,只能靠低成本维持收益。这正是我国的企业在彩电、空调、手机等诸多领域都深陷价格战泥潭不能自拔的重要原因。
  
  第三产业存在的问题
  
  第三产业发展滞后,内部结构需进一步调整完善。我国第三产业增长非常快,在就业中已经发挥了主渠道的作用,但存在总量偏小和行业结构不合理问题,发展水平滞后。从总量来看,第三产业增加值在GDP中所占比重明显偏低。目前,绝大部分发达国家的第三产业比重在70%左右,大部分发展中国家在50%左右,而我国的第三产业比重长期徘徊在30%～40%之间。从第三产业内部结构看,发达国家主要以信息、咨询、科技、金融等新兴产业为主,而我国的商业餐饮、交通运输等传统服务业比重较大,占40%以上;邮电通讯、金融保险等基础性服务业以及信息咨询、科研开发、旅游、新闻出版、广播电视等新兴服务业虽然发展较快,但比重仍然不高,发育仍然不足。
  
  产业结构存在问题原因
  
  由于中国是一个特殊的发展中人口大国，劳动力资源丰富，农业剩余劳动力自非农产业的转移是中国经济增长的最大动力;同对资本、技术，以及其他新兴资源相对短缺，对经济增长的作用与别的国家相比明显较小。在农村剩余劳动力的数量极其庞大，向城市转移又遇到各种障碍和限制的情况下，我国农村的剩余劳动力转移较多地采取了就地转移的方法，走出了一条农村工业化的道路，但由于这种“农村工业化”并没有与农村的城市化相结合起来，加上农村居民的收入水平低，从而导致他们的消费水平低，服务业发展受到当地需求的限制，而工业生产能够从城市市场为依托，因此农业剩余劳动力大多数向农村第二产业尤其是工业转移，而第三产业没有得到相应的较快发展。
  
  我国经济的高速增长主要是由工业的超高速增长推动的，而工业高速增长的原因主要在于乡镇工业的超高速增长，乡镇工业产值占工业总产值的比重1985年为，1990年上升为，1995年进一步上升到，但是乡镇企业的高速发展对第三产业增长的作用较小，这主要是由于乡镇企业的产业结构自第二产业的高度倾斜所导致的，这在很大程度上加深了我国产业结构中工业比重过高而第三产业比重偏低的偏差。
  
  另一方面，农村中资本、技术，以及管理知识、人才、信息等资源的短缺更加突出，技术更新和技术进步远远跟不上农村工业扩张的速度，工业结构的升级相当缓慢。而第一、第三产业的发展相对滞后，其结构升级的进程相应受到影响。由于乡镇企业在全国经济中的比重迅速上升，其产业结构状况越来越突出影响到整个产业结构升级的过程。
  
  我国的产业结构偏差，与改革前片面强调工业化所留下的滞后影响有很大关系，这种影响在改革以来的二十多年中虽然有了一些变化，但一直没有得到根本性的扭转。首先中国是在人均收入水平很低的条件下推进工业化的。作为一个人口众多的特大发展中国家，经济发展水平低和人口数目巨大使我国的人均收入水平很低，1952年开始工业化时我国的人均GDP只有119元人民币，在改革前的二十多年中，我国的工业化一直是在人均收入水平很低的条件下大幅推进的，工业产值的比重上升几乎与人均收入水平的变动失去了联系，1978年时人均GDP只为379元人民币，明显低于钱纳里等人关于人均收入水平与工业化变动关系的“一般模式”中作为工业化起点的人均收入水平而这一年中我国工业在GDP中的比重为，与1952年的相比上升了个百分点。这种工业比重提高与人均收入水平上升相分离的特殊现象，所带来的影响一直持续到现在。
  
  其次我国是在市场化落后的条件下推进工业化的。市场经济国家在工业化开始时，市场化已经得到了很大程度上的发展，第三产业的比重较高，随着工业化阶段的前进，市场化继续发展，第三产业的比重以低于工业化率的速度继续上升。而我国在工业化起点时市场化程度和第三产业比重相对较低，特别是在工业化迅速推进的过程中市场化没有得到相应发展，第三产业的比重没有逐步提高，市场化远远滞后于工业化进程的状况，导致了改革初期产业结构中第二产业，尤其是工业比重偏高，而第三产业比重偏低的结构性偏差。在改革后，八十年代城市第三产业有了较快的发展，但没有根本性地改变第三产业的状况，而九十年代以来，在农村工业化的进程的加快和经济增长结构倾斜的影响下，又趋于加深。最后，工业化与城市化相脱离。由于我国的工业化是在在计划经济时期打下基础的，计划推动的工业化，与市场推动的工业化的不同特点，是产业结构的变动与需求结构的变动相分离。人为因素导致了片面性，并阻碍了工业化过程中市场机制的形成和作用，改革前的工业化主要是一种城市的工业化，但只有少数的农民被有计划地安排“农转非”而到城市就业，其余的大量农村人口被排除在计划之外而继续滞留在农村，结果在迅速工业化的过程中城市化的进展很慢，农村人口的比重依然很高，工业产值比重大幅度提高的，同时农业的就业比重仍居高不下，农业剩余劳动力不能转移出去，这种城市化远远滞后于工业化的状况，一直到现在也没有多大改变，城市化的滞后，给我国的产业结构问题产生了严重的影响，主要是阻碍了第三产业的发展，加大了产业结构的偏差，因为第三产业的发展是与城市化相联系的，只有城市数量和规模的扩张才能为第三产业的发展提供较为广阔空间。
  
  第3章当前国内外新形势的挑战及演进方向
  
  国际环境的挑战
  
  尽管我国产业结构对比改革开放之前有着质的飞跃，我们的产业结构在内外环境的双重影响下，面临着转型升级的历史使命。从国际环境来看，美国次贷危机引发的金融危机已经演变为全球性的经济危机，当前欧盟、日本、美国等发达经济体均已经陷入衰退，有些国家仅有一些复苏的迹象，世界银行等机构仍然降低了对未来经济增长的预期，全球经济将进入一个缓慢增长期。
  
  同时，中国对外出口有效需求下降，国外外商投资不旺，投资需求和消费需求的大幅下滑，导致企业业务持续萎缩，尽量减少新增投资。可见经济危机也是一次优胜劣汰的过程，一些旧产业、旧技术不得不退出战场，采用新产业、新技术是必然选择，部分企业利用这一国际形势的机遇，进行产业升级，而此时产业升级的难度与风险都大大增加。
  
  中国对外贸易量的持续扩大、贸易摩擦增加以及货币快速升值等因素使得我国劳动密集型产品的出口变得越来越困难，欧美日等经济的衰退也给我国产品的出口蒙上了阴影，因此过度依赖外需暴露了我国产业结构的脆弱性，导致我国经济增长具有不稳定性。
  
  国内环境的挑战
  
  除了外部世界不利经济环境的影响外，中国产业的发展困境也有内部因素的制约，中国经济在经过30 年的高速发展后，正逐步进入经济转型期。三十年来的经济增长虽然使得资本与劳动的比重有所改善，但中国经济增长仍主要依赖低水平生产能力的扩张，即在生产能力迅速增长的同时，软实力上升速度相对滞后，部分技术将必须继续依附于发达国家，技术水平不能得到提高，难以形成自己的自主创新产品，即便是企业加强研发投入，目前我们综合水平的设计开发能力和国际竞争力并还处于较低位置;同时中国企业高层跨国人才缺乏，海外拓展人员水平较弱，国际市场开拓能力没有相应扩大。
  
  当前中国要素禀赋结构的特点仍然是普通劳动力相对丰富而高端人才紧缺，且信息技术等资本也相对稀缺，长期依赖低廉生产要素成本优势的中国产品逐步丧失其竞争力，随着要素禀赋结构的提升和比较优势的演化，中国产业发展必须开始从劳动密集型向技术、知识密集型进行转型，这种转型要求中国企业必须加快产业升级步伐，实现经济发展方式的转变。当前，中国经济转型与全球经济放缓双重作用，使得中国经济面临更加严峻的挑战，在此背景下，中国产业是否能够抓住历史机遇，选择正确的升级路径加快产业结构调整步伐，是现今中国经济健康可持续发展的关键。
  
  三大产业演进的方向
  
  对三次产业结构变动趋势的总体判断是, 中国工业化进程中期阶段可能将持续到2020年之后。一、二、三大产业中, 以第二产业为主的格局不大可能在 2020 年前发生变化。“ 十一五” 到 2020 年, 第一产业收入比重将持续下降; 第二产业比重在“ 十一五” 期间还有可能上升, 在 2010年前后达到顶点后, 有可能开始下降; 第三产业比重在“ 十一五” 期间基本稳定, 2010 年之后可能出现明显增加。
  
  1.农业基础地位不变
  
  农业在国民经济中的比重将持续下降,但其重要性和基础地位不会改变。传统农业中, 种植业比重将下降,渔业、畜牧业的贡献将会增加。在种植业内部,粮食作物的比例会缓慢下降,经济作物、瓜菜作物和其他作物的比重将会上升。
  
  2.工业内部结构调整
  
  (1)重工业化阶段不可逾越,霍夫曼法则表明,工业化中后期产业结构出现重工业化趋势,是许多国家工业化过程中的一个普遍规律。根据国际经验 ,人均国内生产总值从1000美元向3000美元攀升的时期,居民消费结构随之持续升级,即从吃饱穿暖、有耐用消费品可用、有屋可住,向吃好穿好、改善居住条件、提高耐用消费品质量、扩大服务消费转变。与之对应的是,汽车、住宅、建材、通信等行业将会有长足的发展,从而带动钢铁、机械、建材、化工等重化工业和电子及通讯设备制造业快速发展,重化工业发展是必然的趋势。
  
  (2)信息产业将成为我国未来的主导产业。据统计,1985-2003年,世界高技术产业出口年增长,比中低技术和低技术产业出口年增长速度高5～6个百分点。高技术产业正在逐步替代传统产业变为主导制造业的部门。
  
  我国是目前世界上最大的IT产品消费国家之一,同时也是当今世界参与信息产业制造业国际分工最多的国家。我国东部沿海地区已经集中了大量发展信息产业所必需的人力资本,同时,较低的劳动力成本是我国的IT产业制造业具有强大的国际竞争力。我国通过参与IT产业制造业的国际分工,既能实现充分就业,也能获得较高的比较利益,通过不间断的“干中学”和“用中学”,将逐渐积累起强大的IT产业技术开发能力。信息产业应该而且也能够成为我国未来的主导产业。
  
  国民经济学论文范文二：国民经济统计分析论文
  
  摘要
  
  消费需求作为其中很重要的一部分，对总需求具有很重要的影响，进而对总需求政策的制定也有明显的影响，它影响着宏观经济的均衡发展。本文首先建立模型，利用SPSS软件，研究了影响国民消费的因素，并对模型的分析结果进行了经济意义检验，以及统计推断检验。最后得出居民的收入水平对消费水平的影响是最显著的，其他因素则次之。通过对消费支出用途结构的分析，了解到居民的生活水平消费支出结构上的变化趋势，不管是城镇居民还是农村居民，恩格尔系数都随时间变化而下降，这表明了我国居民整体生活水平的提高。通过对比分析消费需求、投资需求、进出口需求这三大需求对国内生产总值增长的贡献率，得出消费和投资对经济增长的贡献率和拉动作用明显大于净出口，经济增长过分依赖于投资，而消费需求还有很大的发展空间。
  
  关键词：国民消费，消费结构，消费需求
  
  一、研究国民消费的意义
  
  按照经济学的分析，社会需求包括消费需求，投资需求和净出口。消费需求作为其中很重要的一部分，对总需求具有很重要的影响，进而对总需求政策的制定也有明显的影响，它影响着宏观经济的均衡发展。
  
  现阶段，我国有条件也有必要依靠扩大国内需求尤其是居民消费需求促进经济发展。首先，我国处于居民消费结构优化升级的发展阶段，较高的国民储蓄率和巨大的国内市场潜力为拉动需求增长提供了物质条件。其次，我国居民生存型消费需求已基本得到满足并正向发展型消费需求升级过渡，但产业产品结构、收入分配结构、区域协调发展程度及消费政策和观念等严重滞后于消费结构升级变化的需求，既导致了消费需求的缩减，也给社会生产造成了不良影响，因此，我们必须扩大内需，推动经济增长。
  
  关于如何扩大国内需求方面，中央经济会议曾指出增加居民消费是重点。从理论角度讲，消费需求的具体内容主要体现在消费结构上，要增加居民消费，就要从研究居民消费结构入手，只有了解居民消费结构变化的趋势和规律，掌握消费需求的热点和发展方向，才能为消费者提供良好的政策环境，引导消费者合理扩大消费，才能促进产业结构调整与消费结构优化升级相协调，才能推动国民经济平稳、健康发展。
  
  二、影响消费水平的因素分析
  
  (一) 模型建立与求解
  
  居民消费水平受诸多因素的影响，例如收入水平，消费价格指数以及恩格尔系数。下表给出了从1991年到2010 年消费水平的相关数据。基于表1和表2的数据，分别建立城镇、农村居民消费水平关于其三个影响因素的多元线性回归模型,进行逐步回归分析。
  
  (二)模型检验
  
  1、经济意义检验根据回归结果:城镇：y? 农村：y?，得知，其中x1前面的系数与分别表示在城镇(农村)居民消费价格指数和城镇(农村)居民恩格尔系数不变的条件下,城镇居民人均可支配收入(农村居民人均纯收入)每增加1元,城镇(农村)居民消费水平绝对数平均增加元(元),与理论中描述的居民收入水平增加对居民消费水平变化有明显的影响，居民收入水平是影响消费水平增长的重要原因这个结论是一致的。
  
  2.统计推断检验
  
  (1)拟合优度检验：
  
  由上面分析数据知两个模型的决定系数R分别为、，调整的决定系数为、，可见解释变量与被解释变量间的关系极为密切，说明模型对样本的拟合效果非常好，解释变量能对被解释变量的离差做出解释。
  
  (2)方程显著性检验—F检验
  
  给定显著性水平?=，由表中可以看出F=()，查F分布表中自由度分别为k=3，n?k?1?4的临界值2F?3,4?? ，由于
  
  F>,所以认为在5%的显著性水平下,Y对x1, x2, x3有显著的线性关系，回归方程式是显著的，即城镇居民家庭人均可支配收入(农村居民家庭人均纯收入)、城镇居民消费价格指数(农村居民消费价格指数)、城镇居民恩格尔系数(农村居民恩格尔系数)联合起来对被解释变量有显著影响。
  
  (3)变量显著性检验—t检验给定的显著性水平?=，查t分布表得出自由度为4的临界值t?4?=，由于回归分析表中：
  
  城镇： t1?
  
  农村： t1? 由检验可知，城镇t1?是显著的，而t2?都是不显著国民经济统计分析论文的，农村t1?，t2?，t3?也是不显著的，即可以认为居民消费价格指数与居民恩格尔系数对居民消费水平没有显著的影响，在建立模型时，可以不作为解释变量引进模型。而居民的收入水平对居民的消费水平的影响是显著的。
  
  结论
  
  通过对影响消费水平的因素分析，得出居民的收入水平对消费水平的影响是最显著的，其他因素则次之。通过对消费支出用途结构的分析，了解到居民的生活水平消费支出结构上，生存型消费所占的比重会出现下降的趋势，而享受型消费和发展型消费所占的比重会呈现上升的趋势。对恩格尔系数分析得出不管是城镇居民还是农村居民，恩格尔系数都随时间变化而下降，这表明了我国居民整体生活水平的提高。对比分析消费需求、投资需求、进出口需求这三大需求对国内生产总值增长的贡献率，得出消费和投资对经济增长的贡献率和拉动作用明显大于净出口，经济增长过分依赖于投资，而消费需求还有很大的发展空间。必须从思想上彻底摒弃“投资至上”的观念，牢固树立“消费第一”的思想。把扩大消费作为经济增长的根本目标和动力，才能不断改善和提高人们的生活水平和生活质量。
  
  参考文献
  
  [1]李宝瑜.《国民经济统计分析》[M].中国统计出版社，2002.
  
  [2]徐小飞、龚德恩、吴成业.《关于生产函数的新思考-理论研究与实证分析》 [3]潘文卿、李子奈、张伟.《21 世纪前20 时年中国经济增长前景展望》
140 评论
满天星RF

5小时前发布
- SPSS软件是“统计产品与服务解决方案”软件，是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的范文，欢迎大家阅读参考!
  
  统计分析软件SPSS的特点和应用分析
  
  【摘要】通过文献资料法，介绍了统计分析软件SPSS的特点，并通过实例：用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析，对该软件的应用做了详细的介绍，旨在为学习SPSS软件的人们提供参考。
  
  【关键词】统计分析软件;SPSS;独立样本;非参数检验
  
  一、前言
  
  统计分析软件SPSS是一款统计产品与服务解决方案的软件，其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件，目前在各专业毕业论文经常可以看到它的身影，其应用范围广、方便快捷等特点吸引着众多的爱好者。本文通过对统计分析软件SPSS的功特点进行介绍，通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析，对该软件的操作用做了详细的介绍，为学习SPSS软件的人们提供参考。
  
  二、SPSS软件的特点
  
  (一)操作简便
  
  SPSS软件的界面非常友好，除了数据录入及部分命令程序等少数输入工作需要键盘键入外，大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
  
  (二)编程方便
  
  具有第四代语言的特点，告诉系统要做什么，无需告诉怎样做。只要了解统计分析的原理，无需通晓统计方法的各种算法，即可得到需要的统计分析结果。对于常见的统计方法，SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此，用户无需花大量时间记忆大量的命令、过程、选择项。
  
  (三)功能强大
  
  具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法，比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
  
  (四)全面的数据接口
  
  能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件，文本编辑器软件生成的ASCⅡ数据文件， Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt，word，PPT及html格式的文件。
  
  (五)灵活的功能模块组合
  
  SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
  
  (六)针对性强
  
  SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析，大多青睐于SPSS，像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS，因为他们可以通过编程来实现更强大的功能。
  
  三、实例分析――两个独立样本的检验(Test for Two Independent Sample)
  
  例题：为了调查甲、乙两地土壤对种植同一种西瓜有没有影响，从这两个产地分别随机抽取同种的8只和7只西瓜，称重后得重量(市斤)如下：
  
  甲(斤)：、、、、、、、
  
  乙(斤)：、、、、、、
  
  问：根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?
  
  解：建立假设 H0：甲乙两地的西瓜重量没有显著差异;
  
  H1：甲乙两地的西瓜重量有没有显著差异。
  
  然后根据上面给出的数据建立数据文件，注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具体操作过程如下：
  
  第一步：单击Analyze Nonparametric Test 2 Independent Sample，打开Two-Independent-Sample对话框(见图1)。
  
  第二步：选择检验的变量进入检验框中，选择分组变量进入Grouping Variable框中，单击Define Group键，打开Define Group对话框，将分组变量值分别键入两个框中，单击Continue返回主对话框(见图2)：
  
  第三步：在Test Type栏中，确定检验方法。
  
  SPSS中提供了四种检验方式，几种检验方法侧重点不同，但都是先把两样本数据混合排序，再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样，所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。
  
  第四步：选择输出的结果形式及缺失值处理方式;
  
  第五步：单击OK，得输出结果。
  
  所以，以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。
  
  参考文献
  
  [1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.
  
  [2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).
  
  [3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).
  
  试谈SPSS软件在考试数据统计分析中的应用
  
  摘要： SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析，介绍了使用SPSS进行统计分析的一般方法和步骤，文中的方法对考试研究人员具有一定的指导意义。
  
  关键词： SPSS软件考试数据统计分析操作步骤
  
  1. 引言
  
  一份好的试卷须有好的测量指标来表明它的优良程度，试题有难度和区分度指标，试卷有效度和信度指标，这些是评价考试最主要的测量指标，但是仅有这些指标不足以反映一份试卷的实际测量效果，考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代，考试成绩统计主要依靠人工阅卷，考试数据无法电子化存储，对考试数据分析统计难以实现。随着计算机的普及和信息化的推广，各种分析数据的软件应运而生，这些软件中汇集了统计学和测量学的分析工具，使得应用电子信息技术分析统计考试成绩数据成为可能，这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中，SPSS是应用最多、影响最广泛的分析工具之一。在本文中，我们以SPSS软件为工具，对教育招生考试成绩的数据进行统计分析，分析主要着重于考试数据的相关性、假设检验等几个方面。
  
  2. SPSS分析软件简介
  
  “SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”，中文名称为“社会科学统计软件包”，它是世界著名的统计分析软件之一，在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包，它集数据整理、分析于一身，主要功能包括数据管理、统计分析、图表分析、输出管理等，该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。
  
  下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析，介绍使用SPSS进行统计分析的一般方法和步骤。
  
  3. 相关性分析
  
  教育考试中，考试结果的信度，试题的区分度，每个题目得分与试卷总分的关系，以及题目之间的关系，等等，都是考试研究的重要内容，最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中，Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。
  
  Pearson相关系数法计算公式：
  
  式中x为第i个考生第j题的得分，y为第i个考生第k题的得分，为第j题的平均分，为第k题的平均分，n为测试样本量。该公式既可以计算两个连续变量之间的相关性，又可以计算一个双歧变量与一个连续变量之间的相关性。
  
  Spearman相关系数法计算公式：
  
  r=1-(2)
  
  式中D为两个变量的秩序之差，n为样本容量。
  
  Cronbach a信度系数法计算公式：
  
  α= 1-(3)
  
  式中n为试题数，s为第i题的标准差，s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。
  
  对于给定的一组考生成绩数据，利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性，以及各个题目之间的相关性。我们以Pearson相关系数分析为例，利用SPSS软件进行统计分析。
  
  数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷)，数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。
  
  我们以SPSS 版本的软件为例，介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例)：
  
  (1)将考试数据导入SPSS软件，在SPSS数据窗口中，顺序点击【Analyze】→【Correlate】→【Bivariate...】，系统弹出变量相关系数设置对话框。
  
  (2)在该对话框中，将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中，在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中，选取“Pearson”复选框。
  
  (3)在该对话框的“Test of Significance”设置区域，可以点选“Two-tailed”选项或者“One-tailed”，我们采用系统默认值。
  
  (4)对话框中的其它选项取软件系统的默认值，点击【OK】，开始相关系数计算，系统弹出新的窗体输出运算的结果。本次输出的情况如下：
  
  上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中，但题目T4和题目T5之间的相关程度远高于其它几个题目，我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系，这是我们通过分析获取的重要信息，该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性，这在大规模考试中是不应该出现的，需要在以后的命题考试中加以改进。
  
  Spearman相关系数分析方法和上述分析方法类似，只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框，程序就会按Pearson相关系数法进行统计分析，如果同时选中“Spearman”和“Pearson”复选框，程序将会同时计算按两种分析方法统计分析的数据，并会以不同的图表进行显示，而Cronbach a信度系数法计算方法与上述方法略有不同，其操作步骤如下：
  
  (1)在SPSS数据窗口中，顺序点击【Analyze】→【Scale】→【Reliability Analysis...】，系统弹出“Reliability Analysis”信度分析设置对话框。
  
  (2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中，在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数)，点击“Statistics”选择项可以进行更为详细的参数设置，我们采用系统的默认值即可。
  
  (3)参数设置完毕之后，点击【OK】，软件开始相关系数计算并输出运算结果。
  
  4. 选择题的选项分析
  
  在目前的教育招生考试中选择题是一种较常见的题型，考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2]，对选择题干扰项的设计及其施测后的实际效果关注甚少，事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设，对试卷中常见的选择题选择项进行统计分析。
  
  教育考试的单项选择项一般设置为4个，其中仅有1个选择项是正确的。命题人员在设计选择项时，应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测，对考生作答的分布情况作出预估。考试结束后，研究人员应该对实测的情况与命题教师预测的情况进行对比分析，以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性，因此可以尝试使用χ检验假设进行分析。
  
  我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理，设变量E是命题者对某道试题的期望值，E=nP，n为样本容量，P为期望的相对频率，引入以下统计量：∑(O-E)/E，其中O为观察频数。
  
  本文为全文原貌未安装PDF浏览器用户请先下载安装原版全文
  
  我们需要进行的假设检验是：零假设H：选项的实测分布与期望分布相同;非零假设H：选项的实测分布与期望分布不同。
  
  检验假设的思想：拟合度检验的统计量在确定的某种显著性水平下如果零假设是真，则检验统计量∑(O-E)/E呈近似χ分布，其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合，就不排除零假设，否则就排除零假设;最后对检验假设的结果进行解释。
  
  数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本，利用SPSS进行统计分析。
  
  SPSS数据统计分析的步骤如下：
  
  (1)将考试数据导入SPSS软件，依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】，弹出“Chi-Square Tests”对话框。
  
  (2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中，本例中题目的序号为t7。
  
  (3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框，具体操作方法是选中单选框“Values”，输入具体的期望数值，点击“Add”按钮，依次重复上述的步骤直至所有的选项的期望值输入完毕。
  
  (4)点击【OK】，输出软件运算结果。
  
  我们需要进行的假设检验，H：选项的实测分布与期望分布相同;H：选项的实测分布与期望分布不同。
  
  假设检验的显著性水平为α=，χ=∑(O-E)/E，自由度为df=4-1=3，查χ分布表或利用相关软件可得P=，由于P>α，因此不能拒绝零假设，即选项的实测分布与期望分布相同。因此，检验结果在显著性水平时，没有足够的证据拒绝零假设，即可认为本题选项的实测分布与期望分布相同，也就是说本题的实际测试效果与命题教师预测的效果是一致的，命题教师准确地估计了考生的实际水平，这是分析获得的很重要的结论。
  
  5. 结语
  
  SPSS软件在考试数据统计分析中应用广泛，但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面，本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析，介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看，软件操作步骤和统计分析过程十分简单、快捷，对于测量学和统计学基础不太好的数据分析统计人员来说，只要遵循一定的操作步骤，就可以进行分析。
  
  参考文献：
  
  [1]王孝玲.教育测量(修订版)[M].上海：华东师范大学出版社，2006.
  
  [2]雷新勇.大规模教育考试：命题与评价[M].上海：华东师范大学出版社，2006.
  
  [3]李伟明，冯伯麟，余仁胜.考试的统计分析方法[M].北京：高等教育出版社，1990.
  
  [4]雷新勇.考试数据的统计分析和解释[M].上海：华东师范大学出版社，2007.
  
  猜你喜欢：
  
  1. 统计学数据分析论文
  
  2. spss统计分析实习心得
  
  3. 统计学学年论文
  
  4. 统计学分析论文
197 评论
都亲上了

11小时前发布
- 在统计学中，统计模型是指当有些过程无法用理论分析方法导出其模型，但可通过试验或直接由工业过程测定数据，经过数理统计法求得各变量之间的函数关系。下文是我为大家整理的关于统计模型论文的范文，欢迎大家阅读参考!
  
  统计套利模型的理论综述与应用分析
  
  【摘要】统计套利模型是基于数量经济学和统计学建立起来的，在对历史数据分析的基础之上，估计相关变量的概率分布，并结合基本面数据对未来收益进行预测，发现套利机会进行交易。统计套利这种分析时间序列的统计学特性，使其具有很大的理论意义和实践意义。在实践方面广泛应用于个对冲基金获取收益，理论方面主要表现在资本有效性检验以及开放式基金评级，本文就统计套利的基本原理、交易策略、应用方向进行介绍。
  
  【关键词】统计套利成对交易应用分析
  
  一、统计套利模型的原理简介
  
  统计套利模型是基于两个或两个以上具有较高相关性的股票或者其他证券，通过一定的方法验证股价波动在一段时间内保持这种良好的相关性，那么一旦两者之间出现了背离的走势，而且这种价格的背离在未来预计会得到纠正，从而可以产生套利机会。在统计套利实践中，当两者之间出现背离，那么可以买进表现价格被低估的、卖出价格高估的股票，在未来两者之间的价格背离得到纠正时，进行相反的平仓操作。统计套利原理得以实现的前提是均值回复，即存在均值区间(在实践中一般表现为资产价格的时间序列是平稳的，且其序列图波动在一定的范围之内)，价格的背离是短期的，随着实践的推移，资产价格将会回复到它的均值区间。如果时间序列是平稳的，则可以构造统计套利交易的信号发现机制，该信号机制将会显示是否资产价格已经偏离了长期均值从而存在套利的机会在某种意义上存在着共同点的两个证券(比如同行业的股票)，其市场价格之间存在着良好的相关性，价格往往表现为同向变化，从而价格的差值或价格的比值往往围绕着某一固定值进行波动。
  
  二、统计套利模型交易策略与数据的处理
  
  统计套利具体操作策略有很多，一般来说主要有成对/一篮子交易，多因素模型等，目前应用比较广泛的策略主要是成对交易策略。成对策略，通常也叫利差交易，即通过对同一行业的或者股价具有长期稳定均衡关系的股票的一个多头头寸和一个空头头寸进行匹配，使交易者维持对市场的中性头寸。这种策略比较适合主动管理的基金。
  
  成对交易策略的实施主要有两个步骤：一是对股票对的选取。海通证券分析师周健在绝对收益策略研究―统计套利一文中指出，应当结合基本面与行业进行选股，这样才能保证策略收益，有效降低风险。比如银行，房地产，煤电行业等。理论上可以通过统计学中的聚类分析方法进行分类，然后在进行协整检验，这样的成功的几率会大一些。第二是对股票价格序列自身及相互之间的相关性进行检验。目前常用的就是协整理论以及随机游走模型。
  
  运用协整理论判定股票价格序列存在的相关性，需要首先对股票价格序列进行平稳性检验，常用的检验方法是图示法和单位根检验法，图示法即对所选各个时间序列变量及一阶差分作时序图，从图中观察变量的时序图出现一定的趋势册可能是非平稳性序列，而经过一阶差分后的时序图表现出随机性，则序列可能是平稳的。但是图示法判断序列是否存在具有很大的主观性。理论上检验序列平稳性及阶输通过单位根检验来确定，单位根检验的方法很多，一般有DF，ADF检验和Phillips的非参数检验(PP检验)一般用的较多的方法是ADF检验。
  
  检验后如果序列本身或者一阶差分后是平稳的，我们就可以对不同的股票序列进行协整检验，协整检验的方法主要有EG两步法，即首先对需要检验的变量进行普通的线性回归，得到一阶残差，再对残差序列进行单位根检验，如果存在单位根，那么变量是不具有协整关系的，如果不存在单位根，则序列是平稳的。EG检验比较适合两个序列之间的协整检验。除EG检验法之外，还有Johansen检验，Gregory hansan法，自回归滞后模型法等。其中johansen检验比较适合三个以上序列之间协整关系的检验。通过协整检验，可以判定股票价格序列之间的相关性，从而进行成对交易。
  
  Christian L. Dunis和Gianluigi Giorgioni(2010)用高频数据代替日交易数据进行套利，并同时比较了具有协整关系的股票对和没有协整关系股票对进行套利的立即收益率，结果显示，股票间价格协整关系越高，进行统计套利的机会越多，潜在收益率也越高。
  
  根据随机游走模型我们可以检验股票价格波动是否具有“记忆性”，也就是说是否存在可预测的成分。一般可以分为两种情况：短期可预测性分析及长期可预测性分析。在短期可预测性分析中，检验标准主要针对的是随机游走过程的第三种情况，即不相关增量的研究，可以采用的检验工具是自相关检验和方差比检验。在序列自相关检验中，常用到的统计量是自相关系数和鲍克斯-皮尔斯 Q统计量，当这两个统计量在一定的置信度下，显著大于其临界水平时，说明该序列自相关，也就是存在一定的可预测性。方差比检验遵循的事实是：随机游走的股价对数收益的方差随着时期线性增长，这些期间内增量是可以度量的。这样，在k期内计算的收益方差应该近似等于k倍的单期收益的方差，如果股价的波动是随机游走的，则方差比接近于1;当存在正的自相关时，方差比大于1;当存在负的自相关是，方差比小于1。进行长期可预测性分析，由于时间跨度较大的时候，采用方差比进行检验的作用不是很明显，所以可以采用R/S分析，用Hurst指数度量其长期可预测性，Hurst指数是通过下列方程的回归系数估计得到的：
  
  Ln[(R/S)N]=C+H*LnN
  
  R/S 是重标极差，N为观察次数，H为Hurst指数，C为常数。当H>时说，说明这些股票可能具有长期记忆性，但是还不能判定这个序列是随机游走或者是具有持续性的分形时间序列，还需要对其进行显著性检验。
  
  无论是采用协整检验还是通过随机游走判断，其目的都是要找到一种短期或者长期内的一种均衡关系，这样我们的统计套利策略才能够得到有效的实施。
  
  进行统计套利的数据一般是采用交易日收盘价数据，但是最近研究发现，采用高频数据(如5分钟，10分钟，15分钟，20分钟收盘价交易数据)市场中存在更多的统计套利机会。日交易数据我们选择前复权收盘价，而且如果两只股票价格价差比较大，需要先进性对数化处理。Christian L. Dunis和Gianluigi Giorgioni(2010)分别使用15分钟收盘价，20分钟收盘价，30分以及一个小时收盘价为样本进行统计套利分析，结果显示，使用高频数据进行统计套利所取得收益更高。而且海通证券金融分析师在绝对收益策略系列研究中，用沪深300指数为样本作为统计套利配对交易的标的股票池，使用高频数据计算累计收益率比使用日交易数据高将近5个百分点。
  
  三、统计套利模型的应用的拓展―检验资本市场的有效性
  
  Fama(1969)提出的有效市场假说，其经济含义是:市场能够对信息作出迅速合理的反应,使得市场价格能够充分反映所有可以获得的信息,从而使资产的价格不可用当前的信息进行预测,以至于任何人都无法持续地获得超额利润.通过检验统计套利机会存在与否就可以验证资本市场是有效的的，弱有效的，或者是无效的市场。徐玉莲(2005)通过运用统计套利对中国资本市场效率进行实证研究，首先得出结论：统计套利机会的存在与资本市场效率是不相容的。以此为理论依据，对中国股票市场中的价格惯性、价格反转及价值反转投资策略是否存在统计套利机会进行检验，结果发现我国股票市场尚未达到弱有效性。吴振翔，陈敏(2007)曾经利用这种方法对我国A股市场的弱有效性加以检验，采用惯性和反转两种投资策略发现我国A股若有效性不成立。另外我国学者吴振翔，魏先华等通过对Hogan的统计套利模型进行修正，提出了基于统计套利模型对开放式基金评级的方法。
  
  四、结论
  
  统计套利模型的应用目前主要表现在两个方面：1.作为一种有效的交易策略，进行套利。2.通过检测统计套利机会的存在，验证资本市场或者某个市场的有效性。由于统计套利策略的实施有赖于做空机制的建立，随着我股指期货和融资融券业务的推出和完善，相信在我国会有比较广泛的应用与发展。
  
  参考文献
  
  [1] . Burgess：A computational Methodolology for Modelling the Dynamics of statistical arbitrage, London business school,PhD Thesis,1999.
  
  [2]方昊.统计套利的理论模式及应用分析―基于中国封闭式基金市场的检验.统计与决策,2005,6月(下).
  
  [3]马理,卢烨婷.沪深 300 股指期货期现套利的可行性研究―基于统计套利模型的实证.财贸研究,2011,1.
  
  [4]吴桥林.基于沪深 300 股指期货的套利策略研究[D].中国优秀硕士学位论文.2009.
  
  [5]吴振翔,陈敏.中国股票市场弱有效性的统计套利检验[J].系统工程理论与实践.2007,2月.
  
  关于半参统计模型的估计研究
  
  【摘要】随着数据模型技术的迅速发展，现有的数据模型已经无法满足实践中遇到的一些测量问题，严重的限制了现代科学技术在数据模型上应用和发展，所以基于这种背景之下，学者们针对数据模型测量实验提出了新的理论和方法，并研制出了半参数模型数据应用。半参数模型数据是基于参数模型和非参数模型之上的一种新的测量数据模型，因此它具备参数模型和非参数模型很多共同点。本文将结合数据模型技术，对半参统计模型进行详细的探究与讨论。
  
  【关键词】半参数模型完善误差测量值纵向数据
  
  本文以半参数模型为例，对参数、非参数分量的估计值和观测值等内容进行讨论，并运用三次样条函数插值法得出非参数分量的推估表达式。另外，为了解决纵向数据下半参数模型的参数部分和非参数部分的估计问题，在误差为鞅差序列情形下，对半参数数据模型、渐近正态性、强相合性进行研究和分析。另外，本文初步讨论了平衡参数的选取问题，并充分说明了泛最小二乘估计方法以及相关结论，同时对半参数模型的迭代法进行了相关讨论和研究。
  
  一、概论
  
  在日常生活当中，人们所采用的参数数据模型构造相对简单，所以操作起来比较容易;但在测量数据的实际使用过程中存在着相关大的误差，例如在测量相对微小的物体，或者是对动态物体进行测量时。而建立半参数数据模型可以很好的解决和缓解这一问题：它不但能够消除或是降低测量中出现的误差，同时也不会将无法实现参数化的系统误差进行勾和。系统误差非常影响观测值的各种信息，如果能改善，就能使其实现更快、更及时、更准确的误差识别和提取过程;这样不仅可以提高参数估计的精确度，也对相关科学研究进行了有效补充。
  
  举例来说，在模拟算例及坐标变换GPS定位重力测量等实际应用方面，体现了这种模型具有一定成功性及实用性;这主要是因为半参数数据模型同当前所使用的数据模型存在着一致性，可以很好的满足现在的实际需要。而新建立的半参数模型以及它的参数部分和非参数部分的估计，也可以解决一些污染数据的估计问题。这种半参数模型，不仅研究了纵向数据下其自身的t型估计，同时对一些含光滑项的半参数数据模型进行了详细的阐述。另外，基于对称和不对称这两种情况，可以在一个线性约束条件下对参数估计以及假设进行检验，这主要是因为对观测值产生影响的因素除了包含这个线性关系以外，还受到某种特定因素的干扰，所以不能将其归入误差行列。另外，基于自变量测量存在一定误差，经常会导致在计算过程汇总，丢失很多重要信息。
  
  二、半参数回归模型及其估计方法
  
  这种模型是由西方著名学者Stone在上世纪70年代所提出的，在80年代逐渐发展并成熟起来。目前，这种参数模型已经在医学以及生物学还有经济学等诸多领域中广泛使用开来。
  
  半参数回归模型介于非参数回归模型和参数回归模型之间，其内容不仅囊括了线性部分，同时包含一些非参数部分，应该说这种模型成功的将两者的优点结合在一起。这种模型所涉及到的参数部分，主要是函数关系，也就是我们常说的对变量所呈现出来的大势走向进行有效把握和解释;而非参数部分则主要是值函数关系中不明确的那一部分，换句话就是对变量进行局部调整。因此，该模型能够很好的利用数据中所呈现出来的信息，这一点是参数回归模型还有非参数归回模型所无法比拟的优势，所以说半参数模型往往拥有更强、更准确的解释能力。
  
  从其用途上来说，这种回归模型是当前经常使用的一种统计模型。其形式为：
  
  三、纵向数据、线性函数和光滑性函数的作用
  
  纵向数据其优点就是可以提供许多条件，从而引起人们的高度重视。当前纵向数据例子也非常多。但从其本质上讲，纵向数据其实是指对同一个个体，在不同时间以及不同地点之上，在重复观察之下所得到一种序列数据。但由于个体间都存在着一定的差别，从而导致在对纵向数据进行求方差时会出现一定偏差。在对纵向数据进行观察时，其观察值是相对独立的，因此其特点就是可以能够将截然不同两种数据和时间序列有效的结合在一起。即可以分析出来在个体上随着时间变化而发生的趋势，同时又能看出总体的变化形势。在当前很多纵向数据的研究中，不仅保留了其优点，并在此基础之上进行发展，实现了纵向数据中的局部线性拟合。这主要是人们希望可以建立输出变量和协变量以及时间效应的关系。可由于时间效应相对比较复杂，所以很难进行参数化的建模。
  
  另外，虽然线性模型的估计已经取得大量的成果，但半参数模型估计至今为止还是空白页。线性模型的估计不仅仅是为了解决秩亏或病态的问题，还能在百病态的矩阵时，提供了处理线性、非线性及半参数模型等方法。首先，对观测条件较为接近的两个观测数据作为对照，可以削弱非参数的影响。从而将半参数模型变成线性模型，然后，按线性模型处理，得到参数的估计。而多数的情况下其线性系数将随着另一个变量而变化，但是这种线性系数随着时间的变化而变化，根本求不出在同一个模型中，所有时间段上的样本，亦很难使用一个或几个实函数来进行相关描述。在对测量数据处理时，如果将它看作为随机变量，往往只能达到估计的作用，要想在经典的线性模型中引入另一个变量的非线性函数，即模型中含有本质的非线性部分，就必须使用半参数线性模型。
  
  另外就是指由各个部分组成的形态，研究对象是非线性系统中产生的不光滑和不可微的几何形体，对应的定量参数是维数，分形上统计模型的研究是当前国际非线性研究的重大前沿课题之一。因此，第一种途径是将非参数分量参数化的估计方法，也称之为参数化估计法，是关于半参数模型的早期工作，就是对函数空间附施加一定的限制，主要指光滑性。一些研究者认为半参数模型中的非参数分量也是非线性的，而且在大多数情形下所表现出来的往往是不光滑和不可微的。所以同样的数据，同样的检验方法，也可以使用立方光滑样条函数来研究半参数模型。
  
  四、线性模型的泛最小二乘法与最小二乘法的抗差
  
  (一)最小二乘法出现于18世纪末期
  
  在当时科学研究中常常提出这样的问题：怎样从多个未知参数观测值集合中求出参数的最佳估值。尽管当时对于整体误差的范数，泛最小二乘法不如最小二乘法，但是当时使用最多的还是最小二乘法，其目的也就是为了估计参数。最小二乘法，在经过一段时间的研究和应用之后，逐步发展成为一整套比较完善的理论体系。现阶段不仅可以清楚地知道数据所服从的模型，同时在纵向数据半参数建模中，辅助以迭代加权法。这对补偿最小二乘法对非参数分量估计是非常有效，而且只要观测值很精确，那么该法对非参数分量估计更为可靠。例如在物理大地测量时，很早就使用用最小二乘配置法，并得到重力异常最佳估计值。不过在使用补偿最小二乘法来研究重力异常时，我们还应在兼顾着整体误差比较小的同时，考虑参数估计量的真实性。并在比较了迭代加权偏样条的基础上，研究最小二乘法在当前使用过程中存在的一些不足。应该说，该方法只强调了整体误差要实现最小，而忽略了对参数分量估计时出现的误差。所以在实际操作过程中，需要特别注意。
  
  (二)半参模型在GPS定位中的应用和差分
  
  半参模型在GPS相位观测中，其系统误差是影响高精度定位的主要因素，由于在解算之前模型存在一定误差，所以需及时观测误差中的粗差。GPS使用中，通过广播卫星来计算目标点在实际地理坐标系中具体坐标。这样就可以在操作过程中，发现并恢复整周未知数，由于观测值在卫星和观测站之间，是通过求双差来削弱或者是减少对卫星和接收机等系统误差的影响，因此难于用参数表达。但是在平差计算中，差分法虽然可以将观测方程的数目明显减少，但由于种种原因，依然无法取得令人满意的结果。但是如果选择使用半参数模型中的参数来表达系统误差，则能得到较好的效果。这主要是因为半参数模型是一种广义的线性回归模型，对于有着光滑项的半参数模型，在既定附加的条件之下，能够提供一个线性函数的估计方法，从而将测值中的粗差消除掉。
  
  另外这种方法除了在GPS测量中使用之外，还可应用于光波测距仪以及变形监测等一些参数模型当中。在重力测量中的应用在很多情形下，尤其是数学界的理论研究，我们总是假定S是随机变量实际上，这种假设是合理的，近几年，我们对这种线性模型的研究取得了一些不错的成果，而且因其形式相对简洁，又有较高适用性，所以这种模型在诸多领域中发挥着重要作用。
  
  通过模拟的算例及坐标变换GPS定位重力测量等实际应用，说明了该法的成功性及实用性，从理论上说明了流行的自然样条估计方法，其实质是补偿最小二乘方法的特例，在今后将会有广阔的发展空间。另外文章中提到的分形理论的研究对象应是非线性系统中产生的不光滑和不可微的几何形体，而且分形已经在断裂力学、地震学等中有着广泛的应用，因此应被推广使用到研究半参数模型中来，不仅能够更及时，更加准确的进行误差的识别和提取，同时可以提高参数估计的精确度，是对当前半参数模型研究的有力补充。
  
  五、总结
  
  文章所讲的半参数模型包括了参数、非参数分量的估计值和观测值等内容，并且用了三次样条函数插值法得到了非参数分量的推估表达式。另外，为了解决纵向数据前提下，半参数模型的参数部分和非参数部分的估计问题，在误差为鞅差序列情形下，对半参数数据模型、渐近正态性、强相合性进行研究和分析。同时介绍了最小二乘估计法。另外初步讨论了平衡参数的选取问题，还充分说明了泛最小二乘估计方法以及有关结论。在对半参数模型的迭代法进行了相关讨论和研究的基础之上，为迭代法提供了详细的理论说明，为实际应用提供了理论依据。
  
  参考文献
  
  [1]胡宏昌.误差为AR(1)情形的半参数回归模型拟极大似然估计的存在性[J].湖北师范学院学报(自然科学版)，2009(03).
  
  [2]钱伟民，李静茹.纵向污染数据半参数回归模型中的强相合估计[J].同济大学学报(自然科学版)，2009(08).
  
  [3]樊明智，王芬玲，郭辉.纵向数据半参数回归模型的最小二乘局部线性估计[J].数理统计与管理，2009(02).
  
  [4]崔恒建，王强.变系数结构关系EV模型的参数估计[J].北京师范大学学报(自然科学版).2005(06).
  
  [5]钱伟民，柴根象.纵向数据混合效应模型的统计分析[J].数学年刊A辑(中文版).2009(04)
  
  [6]孙孝前，尤进红.纵向数据半参数建模中的迭代加权偏样条最小二乘估计[J].中国科学(A辑：数学)，2009(05).
  
  [7]张三国，陈希孺.EV多项式模型的估计[J].中国科学(A辑)，2009(10).
  
  [8]任哲，陈明华.污染数据回归分析中参数的最小一乘估计[J].应用概率统计，2009(03).
  
  [9]张三国，陈希孺.有重复观测时EV模型修正极大似然估计的相合性[J].中国科学(A辑).2009(06).
  
  [10]崔恒建，李勇，秦怀振.非线性半参数EV四归模型的估计理论[J].科学通报，2009(23).
  
  [11]罗中明.响应变量随机缺失下变系数模型的统计推断[D].中南大学，2011.
  
  [12]刘超男.两参数指数威布尔分布的参数Bayes估计及可靠性分析[D].中南大学，2008.
  
  [13]郭艳.湖南省税收收入预测模型及其实证检验与经济分析[D].中南大学，2009.
  
  [14]桑红芳.几类分布的参数估计的损失函数和风险函数的Bayes推断[D].中南大学，2009.
  
  [15]朱琳.服从几类可靠性分布的无失效数据的bayes分析[D].中南大学，2009.
  
  [16]黄芙蓉.指数族非线性模型和具有AR(1)误差线性模型的统计分析[D].南京理工大学，2009.
  
  猜你喜欢：
  
  1. 统计学分析论文
  
  2. 统计方面论文优秀范文参考
  
  3. 统计优秀论文范文
  
  4. 统计学的论文参考范例
194 评论

相关问题

热门问题