统计学是一门涉及范围非常广的学科,它是通过搜索、整理以及分析数据等手段,来尽可能精确地推测研究对象的本质,甚至是预测研究对象未来的一门综合性的学科,几乎覆盖了自然科学和社会科学的各个方面。下文是我为大家搜集整理的关于统计学方面论文的内容,欢迎大家阅读参考!
关于统计学方面论文篇1
试谈统计学在会计专业中的教学创新
统计学这一学科是各个学校内管理类专业以及经济类专业的一门重要课程。它主要是研究数据之间的内在规律,进而对数据进行合理的整理与搜集。由于它有较强的使用价值,所以在各行各业中都得到了广泛的应用,在工业以及商业中,它用来控制程序,对一些重要的决策提供数据讲解;在生产领域中,它用来进行产品开发,管理财务等;在第一产业方面,它可以通过计算各种农业产品的实际需求量,来对生产进行正确合理的指导。等等。它在会计专业中的作用更是非常可观,做出了不可估量的巨大贡献。本文就针对统计学在会计专业中的教学创新进行了详细的探讨与研究。
1.统计学在会计专业中的教学的现状
教材缺乏指导性和专业性。现今的统计学教材中,拥有很多的有关数理统计的公式,以及一些相关的推理过程,这就使得教材无法吸引学生的兴趣,可读性非常差,不能真正体现出统计学这一学科在实际生活中使用价值。教材中一些较常规的统计知识已经被减化甚至是删除,这就使部分学生的统计学基础无法达到要求,部分企业并不很重视统计工作,算上工资的原因,一些会计人员甚至要一身兼很多职,还要收集数据,又要设计统计
表格。
2.统计学在会计专业教学中的创新教学
2.1自主探究教学
审计学是统计学中非常重要的部分,由于在这一部分中拥有许多结论性的知识,但是只由教师口头上的分析与讲解,学生并不能很好的掌握其中的知识,这就需要教师进行一定的引导,帮助学生自主探索,让学生在自主探索的过程中发现结论,这样,有助于学生更好地掌握知识。审计抽样是指从被审计的总体中,抽出一定数量的样本,对样本进行合理的统计,再由样本推断出总体的基本特征。教师在实际的教学过程中,就可以让学生在自主探索,这样有助于他们对审计抽样的过程更加了解。
举一个例子,在审计抽样的教学时,教师可以先为学生大至讲解一下抽样审计的过程,再将某一公司的第一季度的各种产品的销售总量,以及商品的种类为学生展示出来,让学生自己运用审计抽样的方式,对公司整年的销售进行估计。在学生面对众多数据的时候,就会逐渐理解抽样审计的过程,在学生计算与统计的过程中,就会自觉地运用很多种统计的方式,最后,当学生计算完之后,由学生讲解自己运用到的统计方式,以及最后所估计的总体特征,再由其他学生进行点评,等到学生都发完言,教师就可以做一个总结,再将这节课需要注意的地方进行强调,这种让学生自主探索的教学方式能够大大提高学生对于课堂的自主性,发散学生的思维,有助于他们对课程有更深的理解。
2.2统计报表的强化练习
在统计学中,统计报表可以说是各种统计分析的基础和前提,为了使学生在今后的统计数据的过程中,更加顺利,教师就应该强化统计报表的练习,帮助学生打下良好的基础。在这就需要教材中对统计报表知识的增加与重视,有关统计报表知识越多,学生才会更加重视这部分知识,同时,教师还要在学习方法上进行改革与创新,使学生在意识到统计报表重要的同时,还能够全身心的投入到统计报表的学习当中,只有学生充分的重视,才会使学生对知识掌握得更加深刻,在今后的生活中,才能够更加顺利的运用知识。因此,教师在教学的过程中要加强统计报表的练习,全面提高学生的能力,为学生打下坚实的基础。
2.3引导学生学以致用
众所周知,学习知识就是为了能够在实际的生活中合理的运用,同时,由于统计学的有很强的实用价值,这就使得教学中的实践尤为重要。教师应该设置一些教学活动,引导学生进行实践,在实践的过程中,教师就能够了解到学生对知识的掌握程度,它也能够使学生对自己的学习状况有一个充足的认识。在教学中引导学生实践,还能够使学生对所学的知识学以致用,起到巩固的强化的作用。
举一个例子,在实际的教学当中,例如在学习数理统计的时候,教师就可以组织学生运用计算机软件进行操作,由于现今是高科技社会,电脑在人们的生活中占有非常重要的地位,所以,为了使学生对统计学在现实生活中能够更加合理的进行运用,教师就可以让学生将自己近几个月的学习成绩运用Excel表格记录下来,再通过表格进行数据的分析与总结,这种与多媒体相互联系的教学能够高效的提高学生上课的兴趣,进而就能够大大的提升课堂的效率,这种教学方式还有助于学生在今后的工作过程中更加顺利的运用计算机软件,为今后的顺利工作打下良好的基础,打造学生更好的未来。
结束语:通过研究,可以得知统计学在实际的教学过程中,应该充分考虑学科自身的特点,注重挖掘统计思想,将思想传递给学生,塑造学生的思维能力,塑造他们的统计能力,要培养学生的实际操作能力,让学生能够在实际的生活当中合理的运用知识。教师也要加强与学生之间的交流,深入的与学生沟通,对传统的教学方式要进行合理的改革,适当加入一些有关统计报表的练习,引导学生自主探索,进而提高教学效率,加强学生的能力。
关于统计学方面论文篇2
论经济统计学如何适应新核算体系的改革
一、前言
我国的国民经济统计学当中,国民经济核算的内容是其必然包括的,而在这个过程中,会涉及到大量的国民统计学以及国民经济的核算关系的内容。国民经济统计学与国民经济核算之间的关系,主要有两个方面,首先,站在五大核算系统的角度上来看,国民经济核算属于国民经济统计学的内容,相关学者认为国民经济核算体系的宗旨是及宏观统计之大成。其次,国民经济统计学必须要建立在国民经济核算的基础上,否则将会无法很好的满足国民经济管理对统计的要求。
二、现代方法的统计化问题
对于国民经济的统计,主要是能够引入各种现代化的统计方法,在各个学术领域吸收相关的知识,以此来促进国民经济统计学的发展,并且以此来使其更好的适应现代化的经济统计学的要求[1]。对于现代化方式的选择,不能够仅仅是模仿现代化的方式,必须要能够结合实际的情况,进行研究,在国民经济统计学中,必须要重视应用理论的研究,这能够很好的利用现代化的方法将经济统计中的问题阐明,如此一来,现代方法也就属于统计化的内容了。
要想使统计工作更好的完成就离不开对相应的统计指标的利用,但是目前对于指标的问题,其规定还不够明确,无法对其进行完整的探讨分析。指标是客观社会经济现象的一种反映,但是客观的现象是不断的变化的,因此,其指标也是不断变化的,所以,对于统计学的发展与研究,一定要能够对各项指标进行完整的确立,同时也要进行全面的解释,以此来满足国民经济统计的工作。
三、经济统计学的内容设计
(一)以社会再生产的环节来设计局限性
经济统计学,主要是按照再生产的基本环节进行内容的组织与安排的,首先是对相应的社会产品进行生产统计,然后是对社会产品的流通性进行统计,尤其是要对其的分配以及使用进行明确的统计[2]。但是这种方式却存在一定的局限性,其中主要的困难是难以对各个环节中的界限进行明确,以至于在价格方面以及金融统计的内容方面,无法对其进行定位,仅仅是按照再生产的环节进行安排,那么很多的内容是无法归纳到相应的学科体系中,这样只能将其归纳到相关的综合统计分析中,但是随着社会的不断发展,会导致这一模块中的内容越加的复杂与庞大。
(二)以国民经济核算系统位置的设计需要深究
近年来,很多的学者都是对国民经济核算的五大系统进行研究,并且以此来对经济统计学的内容进行设计[3]。首先是对国名经济的总量进行核算,其中包括资金流量、国际收支核算以及资产负债核算等,这样的安排会导致现代化的内容逐渐增多,但却也十分简单明了,能够满足宏观调控对于经济统计的要求。与此同时,这种核算方式也存在一定的缺陷,主要表现在无法容纳一些国民经济中的动态统计内容。
(三)将国民经济运行过程与统计认识过程相互结合
要能够将国民经济运行过程与统计认识过程相互结合,根据近年来宏观经济管理对于统计的要求,要把其中的动态统计、结构统计以及相关的国际经济比较统计等内容进行全面的补充,将其相互结合,对于国民经济统计学来说,必须要能在量化的基础上反映出国民经济运行全过程的高度,对统计方式进行研究,不能够仅仅是局限于再生产的四大环节。
对于国民经济运行全过程的统计研究,必须要对其中的内容进行全面的认识,其中主要是包含了国民自愿的统计、国民经济总量的统计、国民经济过程的统计、国民经济动态的统计、结构的统计、国民经济关系的统计、国民经济效益的统计以及国民经济核算体系等方面。对于这些方面的研究,必须要坚持先存量统计,后流量统计的形式,在流量的统计中,主要是按照总量的指标进行统计,但是对于指标的统计,要能够遵循着先总量统计、然后再进行分部的统计,最后进行动态统计以及结构统计。通过国民经济核算体系,人们能够迅速掌握到国民经济运行的概论。
(四)结构设计是动态的以及相对的
通过相关学者对于经济统计的不断研究,可以发现,在经济统计的内容上,属于一个相对优化的问题,很多的专著中都是主要讲经济的存量统计,并且能够在进行经济存量统计时候,将其中的存量以及流量的关系进行全面的阐述[5]。一些学者则是先讲流通统计或者是分配统计,很多学者的阐述都是不相同的,并且内容的安排不是有序的,必须要能够根据教材的内容进行一些设计。
四、国民经济统计学中的内容
首先,是国民经济资源的统计,其中主要是包含了劳动力资源的统计、自然资源的统计以及国民财产资源的统计等,在国民经济运行的时候,必须要具备相应的资源,这样才能够保证正常的生产活动,各项生产以及生活服务才能够得到有序的展开。其次,是对于国民经济总量的统计,主要是在一定的时期之中,通过对经济运行总量进行统计,能够使人们充分的掌握到相关的国民经济水平以及国民经济发展的规模。其中国民经济的发展主要包含了生产、流通、分配以及使用的环节。在这个过程中,其中社会生产是主要的基础,生产成果则是国民经济统计学的核心内容。然后,对于国民经济的过程进行统计,主要是指能够在完整的国民经济的运行过程中,将一些若干项目运行的子过程进行统计,对其进行分析,只有这样才能够更好的对国民经济进行一个全面的了解。
另外,是国民经济的动态统计,主要是对国民经济的发展数量进行科学的分析以及预测,尤其是对其中的动态指标进行分析。对于国民经济结构的统计也要进行分析,主要是对国民经济的内部组成进行分析。最后,还包含了国民经济关系的分析、国民经济效益的分析以及国民经济的核算分析等方面。
五、结语
国民经济的统计必须要能够对国民经济核算体系的结构进行完整的说明,随着社会的不断发展,国民经济核算体系在不断的完善,因此必须要对其进行全面的分析,要能够不断的对其进行研究,从而选择出适当的方式使其能够适应新核算体系的改革。
猜你喜欢:
1. 关于统计学的论文
2. 浅谈统计学专业相关论文
3. 浅谈统计学论文论文
4. 关于统计学的论文
5. 统计学论文范文
统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!
浅谈统计分析与决策
[摘要] 统计分析与决策二者有联系又有区别。统计要参与决策,必须搞好统计分析。搞好统计分析,需要解决选题、分析、撰写 报告 三个问题。
[关键词] 统计分析 分析方法 决策
统计工作的全过程分为四个阶段,即统计设计,统计调查,统计整理,统计分析。其中,统计分析是统计工作的最后一个阶段,是出统计成果的阶段。现在倡导统计要参与决策,这是不是说统计工作还要增加一个决策阶段呢?如果不是,那么,统计分析与决策是什么关系呢?
狭义的说,统计分析与决策是有区别的。统计分析是以统计数字为基础,以统计方法为手段,对社会经济情况进行科学的分析和综合研究,以认识其本质和规律的过程。而决策则是为了达到某一预定目标,运用逻辑方法和统计方法,对两种或两种以上可能采取的方案进行比较、分析、研究,以做出合理的、科学的抉择的行为过程。假若把统计分析与决策比作医生看病,统计分析就是对病情的诊断,决策就是开处方,“诊断”和“处方”是有区别的。
广义的讲,统计分析与决策是密不可分的。一方面,统计分析贯穿于决策过程之中。一个决策过程大体上可分为下列三个大步骤:第一,诊断问题所在,确定决策目标;第二,探索和拟定各种可能的备选方案;第三,从各种备选方案中选出最合适的方案。从这三大步骤看,尽管要用到多种方法和手段,但哪一步也离不开统计分析,第一步就是通过统计分析,诊断问题所在,并在分析的基础上确定决策目标;第二步拟定备选方案,要经过“轮廊设想”和“细部设计”这个阶段对轮廊设想的方案要做初步筛选,对每一方案要充实具体内容,“筛选”和“充实”都要经过统计分析;第三步选择最佳方案,首先要对各个备选方案进行评价、论证,这又需要统计分析。因此可以说,没有统计分析,也就没有科学决策。另一方面,从某种意义上讲,决策是统计分析的结果。一般来说,统计分析报告是提出问题、分析问题、指出解决问题的办法,其实,决策方案也就是解决问题实现决策目标的办法,只不过比“今后意见”“几条 措施 ”之类的办法更全面、更详细、更科学罢了。医生诊断是为了正确处方,治病救人,不能只诊断不处方。统计分析是为了发现问题,解决问题,推动社会经济的顺利发展;也不能只提出问题,而不寻找解决问题的办法。从这个意义上讲,统计分析也就包括预测和决策。我们不能为统计而统计,也不能为分析而分析。统计应该参与决策,为了决策科学化,必须搞好统计分析。
搞好统计分析,需要解决选题、分析、撰写报告三个问题。
一、统计分析选题
所谓选题,就是在复杂的社会经济现象中,确定统计分析的内容和范围。进行统计分析,选题很重要。成功的选题是成功的分析的前提。
怎样选好题呢?选好题标准有两条:―是分析对象有意义,二是适合决策层和群众需要。关键是抓住党和国家的方针政策和企业的经济效益。
统计分析课题是很广泛的。工业统计分析课题如:计划执行情况分析、工业净产值统计分析、工业产品销售统计分析、工业原材料供应和消耗统计分析、工业能源消耗统计分析、工业生产设备统计分析、工业劳动与工资统计分析、成本利润统计分析、综合经济效益统计分析等。商品流通企业统计分析课题如:市场供求状况分析、市场占有率分析、主要商品经济寿命周期分析、市场商品价格分析、计划执行情况分析、购销合同执行情况分析、商品购进质量分析、商品销售动态分析、商品销售构成分析、商品库存分析、企业经济效益分析等。对于以上内容,可根据不同的时间、地点、条件,按两条选题标准适当选择。
统计分析有专题分析与综合分析之分。在一定的总体范围内,研究总体的各个方面及其相互关系,或研究总体的主要方面的统计分析,属于综合分析;只研究其中某一方面,或某一部分的统计分析,属于专题分析。两者各有不同的特点,都是必要的,但专题分析宜多,综合分析宜少。
二、统计分析方法
统计分析的关键是分析,怎样进行统计分析呢?统计分析有两个特点:一是以统计数字为基础,二是以统计方法为手段。因此,统计分析在选题之后,就要根据分析的需要,搜集整理有关数字资料及具体情况,在充分占有材料的基础上,灵活运用统计方法进行分析。
统计分析方法很多。统计学原理中除了有关统计调查、统计整理的内容外,综合指标、统计指数、时间数列、抽样推断等内容全部是统计分析方法。从方法角度上讲,统计分析就是统计学原理的运用。
统计方法与人们的认识过程是相适应的。人们的认识分感性认识和理性认识两个阶段。感性认识阶段所认识的是事物的现象,可采用统计调查和统计整理。理性认识阶段所认识的是事物的本质和规律,这个阶段要经过形成概念、进行判断和推理等思维活动。与此相适应,要分别采用不同的统计分析方法。
形成概念一般用描述性的综合指标法,即总量指标、相对指标和平均指标,以说明现象的规模大小、水平高低、速度快慢、内部结构以及比例关系等。判断推理就是要判断事物的性质,分析事物变化的原因,找出事物发展的规律。这一般要用分组分析法、动态分析法、因素分析法、相关回归分析法、平衡分析法等。
对统计学原理中的各种统计分析方法要熟练地掌握,灵活地运用。怎样灵活运用呢?这里有个技巧问题。技巧就是定性分析与定量分析巧妙结合。
所谓定性分析是指对事物的性质和影响事物发展变化的因素进行分析。定量分析就是分析事物的规模、水平、速度、结构、比例,以及各个因素对事物总体变化的影响方向和影响程度。定性分析与定量分析巧妙结合有两层含义,一是二者不可偏废,二是二者密不可分,
没有定性分析,定量分析就没有方向。没有定量分析,定性分析就不准确。结合的目的是在质与量的辩证统一中探寻事物的内在联系。
从根本上讲,统计分析就是完成从感性认识到理性认识,从现象到本质的飞跃。完成了这―飞跃,才是高质量的统计分析。有些统计分析质量不高,往往就是没有完成这一飞跃,仍然停留在表面现象上。
三、统计分析报告的撰写
统计分析报告是统计的最终产品。如果说统计数字的准确性是统计的生命,那么,统计分析报告的质量则关系到统计作用的发挥。对高质量的统计分析报告的要求,可以概括为五个字,就是“准、快、新、深、活”。
准:就是实事求是地反映客观实际。做到数字准确,情况准确,论点准确。
快:就是在决策层决策之前,不失时机地及时提供分析报告。
新:就是不断创新。要求不断开拓新领域,钻研新课题,反映新情况和新问题。
深:就是要在充分占有材料的基础上,提高分析的深度,使认识不只停留在反映现象上,而要揭示事物的本质和规律,并且用观点统帅材料,用材料说明观点,做到材料和观点的统一。
活:就是文字生动活泼,形式灵活多样。资料要多样化和生动具体,要有群众语言,要通俗易懂,文字要精精炼。
统计分析报告是在统计分析的基础上撰写出来的。没有好的分析,不可能写出好的报告。经过分析阶段,弄清了事实,判明了性质,探索出规律,得出了结论,在此基础上就可以撰写统计分析报告。但分析得好,并不等于报告写得好,这里还有个撰写的技巧问题,那就是准确地表述事实,透彻地阐明本质,深刻地揭示规律,恰当地提出建议。
1.准确地表述事实
每一篇统计分析报告,都需要表述所分析的现象,即说明“是什么”。准确地表述事实,才能给读者一个明确的概念。为此,须注意如下几点:(1)数字要真实;(2)运用数字要适当,不要堆砌数字,搞数字文字化;(3)语言要素准确。
2.透彻地阐明本质
现象只说明事物的各个片面,本质才说明事物的整体。撰写统计分析报告,必须深刻地揭示事物的本质,它是统计认识事物的正确程度和深度的反映。如果不能深刻地阐明事物的本质,那只能是现象罗列,没有多大价值。
阐明事物的本质,也就是阐明事物的基本性质。事物的性质是由事物内部矛盾的主要方面决定的。例如,某企业利润增加,是靠涨价,还是靠降低成本?经过分析,认识到利润增加主要是靠降低成本,这是矛盾的主要方面,这就反映出事物的性质。因此,在报告中就应阐明降低成本在提高经济效益中的重要作用。再如某企业,本质问题是钢材浪费严重,在报告中就应揭示浪费的若干方面和严重程度。
3.深刻地揭示规律
规律是事物内部固有的、本质的、必然联系。成本高低与产量多少有联系,经过推理,这种联系是事物内部固有的、本质的必然联系,反映了事物发展变化的规律性,而且存在一定的回归关系。而回归方程反映这种关系,所以在统计分析报告中,要利用回归方程揭示这种必然联系及其回归关系。
4.恰当地提出建议
认识世界的目的是为了改造世界。经过统计分析,透过现象认识到事物的本质和规律,还必须提出解决问题的建议,如“今后意见”、“几点建议”、“决策方案”等等。怎样才算恰当地建议呢?恰当的建议要符合三个条件:(1)符合分析目的;(2)合乎客观规律;(3)切实可行。
以上四点,一般可以作为分析报告的结构和顺序,但不能千篇一律。
统计分析报告是统计分析结果的反映。既要注意提高写作水平,更要努力锻炼分析问题和解决问题的能力。
试谈统计分析方法应用
【摘要】统计分析方法应用于各个领域,解决了很多工业、农业、经济、医学等领域的实际问题,本文分析多元统计分析方法的主要应用和构建多元统计方法检验体系的必要性,针对性的提出了需要引起注意的共性问题,具有很强的现实意义。
【关键词】统计分析方法;应用;检验体系;共性问题;现实意义前言
随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。
二、多元统计分析方法的主要应用
统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。
聚类分析
它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与 其它 类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定 市场营销 战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过 市场调查 ,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。
判别分析
判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。
主成分分析
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。
因子分析
因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。
三、构建多元统计分析方法检验体系的必要性
(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量
多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。
(二)多元统计分析统计检验体系的基础理论
多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。
(三)关于统计检验体系
将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:
a.主成分分析统计检验体系
b.因子分析统计检验体裂引
c.系统聚类分析统计检验体系
d.判别分析统计检验体裂
e.对应分析统计检验体系
f.典型相关分析统计检验体系
四、多元统计分析方法应用中需要注意的几个共性问题
1.关于原始数据变量的总体分布问题。
对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。
样本容量问题。
进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。
原始变量之间的相关性以及非线性关系问题。
多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。
数据处理问题。
多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。
五、结束语
在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。
【参考文献】
[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.
[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.
[3]郭志刚.社会科学分析方法一SPSS软件应用[M].,中国人民大学出版社,1999.
[4]傅德印.主成分分析中的统计检验问题 [J].统计 教育 ,2007(9):4—7.
从统计学的发展趋势谈统计教育的改革 摘要:要培养出新型的21世纪的人才,统计教育必须高瞻远瞩。本文从统计学的发展趋势谈了统计教育急需改革的几个方面。 关键词: 统计学; 发展趋势; 统计教育改革 随着国家创新体系的建立,统计创新工程已经提上议事日程,统计创新包括两个方面,一是统计实践的创新;二是统计教育的创新。创新的基础在于教育,没有统计教育的创新,就谈不上统计实践的创新。准确把握统计学的发展方向与发展形势,培养适应新世纪社会经济发展需要的人才,是统计教育工作者必须面对的问题,本文从统计学的基本发展趋势谈一谈统计教育急需改革的几个方面。 一、统计学的基本发展趋势 纵观统计学的发展状况,与整个科学的发展趋势相似,统计学也在走与其他科学结合交融的发展道路。归纳起来,有两个基本结合趋势。 (一)统计学与实质性学科结合的趋势 统计学是一门通用方法论的科学,是一种定量认识问题的工具。但作为一种工具,它必须有其用武之地。否则,统计方法就成为无源之水,无用之器。统计方法只有与具体的实质性学科相结合,才能够发挥出其强大的数量分析功效。并且,从统计方法的形成历史看,现代统计方法基本上来自于一些实质性学科的研究活动,例如,最小平方法与正态分布理论源于天文观察误差分析,相关与回归源于生物学研究,主成分分析与因子分析源于教育学与心理学的研究。抽样调查方法源于政府统计调查资料的搜集。历史上一些著名的统计学家同时也是生物学家或经济学家等。同时,有不少生物学家、天文学家、经济学家、社会学家、人口学家、教育学家等都在从事统计理论与方法的研究。他们在应用过程中对统计方法进行创新与改进。另外,从学科体系看,统计学与实质性学科之间的关系绝对不是并列的,而是相交的,如果将实质性学科看作是纵向的学科,那么统计学就是一门横向的学科,统计方法与相应的实质性学科相结合,才产生了相应的统计学分支,如统计学与经济学相结合产生了经济统计,与教育学相结合产生了教育统计,与生物学相结合产生了生物统计等,而这些分支学科都具有"双重"属性:一方面是统计学的分支,另一方面也是相应实质性学科的分支,所以经济统计学、经济计量学不仅属于统计学,同时属于经济学,生物统计学不仅是统计学的分支,也是生物学的分支等。这些分支学科的存在主要不是为了发展统计方法,而是为了解决实质性学科研究中的有关定量分析问题,统计方法是在这一应用过程中得以完善与发展的。因此,统计学与各门实质性学科的紧密结合,不仅是历史的传统更是统计学发展的必然模式。实质性学科为统计学的应用提供了基地,为统计学的发展提供了契机。21世纪的统计学依然会采取这种发展模式,且更加注重应用研究。 这个趋势说明:统计方法的学习必须与具体的实质性学科知识学习相结合。必须以实质性学科为依据,因此,财经类统计专业的学生必须学好有关经济类与管理类的课程,只有这样,所学的统计方法才有用武之地。统计的工具属性才能够得以充分体现。 (二)统计学与计算机科学结合的趋势 纵观统计数据处理手段发展历史,经历了手工、机械、机电、电子等数个阶段,数据处理手段的每一次飞跃,都给统计实践带来革命性的发展。上个世纪40年代第一台电子计算机的诞生,给统计学方法的广泛应用创造了条件。20年代发展起来的多元统计方法虽然对于处理多变量的种类数据问题具有很大的优越性,但由于计算工作量大,使得这些有效的统计分析方法一开始并没有能够在实践中很好推广开来。而电子计算机技术的诞生与发展,使得复杂的数据处理工作变得非常容易,那些计算繁杂的统计方法的推广与应用,由于相应统计软件的开发与商品化而变得更加方便与迅速,非统计专业的理论工作者可以直接凭借商品化统计分析软件来处理各类现实问题的多变量数据分析,而无需对有关统计方法的复杂理论背景进行研究。计算机运行能力的提高,使得大规模统计调查数据的处理更加准确、充分与快捷。目前企业经营管理中建立的决策支持系统(DSS)更加离不开统计模型。最近国外兴起的数据挖掘(Datamining,又译"数据掏金")技术更是计算机专家与统计学家共同关注的领域。随着计算机应用的越来越广泛,每年都要积累大量的数据,大量信息在给人们带来方便的同时也带来了一系列问题:信息过量,难以消化;信息真假,难以辨识;信息安全,难以保证;信息形式不一致,难以统一处理;于是人们开始提出一个新的口号"要学会抛弃信息"。人们考虑"如何才能不被信息淹没,而是从中及时发现有用的知识,提高信息利用率?"面对这一挑战,数据挖掘和知识发现(DMKD)技术应运而生,并显示出强大的生命力。数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘是一门交叉学科,它把人们对数据的应用从低层的简单查询,提升到从数据中挖掘知识,提供决策支持。在这种需求牵引下,汇聚了不同领域的研究者,尤其是数据库技术、人工智能技术、统计、可视化技术、并行计算等方面的学者和工程技术人员,投身到数据挖掘这一新兴的研究领域,形成新的技术热点。虽然统计学家与计算机专家关心Datamining的视角不完全相同,但可以说,Datamining与DSS一样,使得统计方法与计算机技术的结合达到了一个更高的层次。 因此,统计学越来越离不开计算机技术,而计算机技术应用的深入,也同样离不开统计方法的发展与完善。这个趋势说明:充分利用现代计算技术,通过计算机软件将统计方法中复杂难懂的计算过程屏障起来,让用户直接看到统计输出结果与有关解释,从而使统计方法的普及变得非常容易。所以,对于财经类统计专业的学生来说,一方面要学好统计方法,但另一方面更加要学会利用商品化统计软件包解决实践中的统计数量分析问题,学好计算机信息系统开发的基本思想与基本程序设计,能够将具体单位的统计模型通过编程来实现,以建立起统计决策支持系统。 所以统计与实质性学科相结合,与计算机、与信息相结合,这是发展的趋势。了解这一点,再来看我们目前教育中的问题就更加明显了,所以一些课程要改革,教学方式也要改革。以下谈一谈统计教育需要改革的几个方面。
采纳哦
SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考!
统计分析软件SPSS的特点和应用分析
【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。
【关键词】统计分析软件;SPSS;独立样本;非参数检验
一、前言
统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件,目前在各专业 毕业 论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的 爱好 者。本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。
二、SPSS软件的特点
(一)操作简便
SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
(二)编程方便
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计 方法 的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
(三)功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
(四)全面的数据接口
能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件, Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt,word,PPT及html格式的文件。
(五)灵活的功能模块组合
SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
(六)针对性强
SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。
三、实例分析――两个独立样本的检验(Test for Two Independent Sample)
例题:为了调查甲、乙两地土壤对 种植 同一种西瓜有没有影响,从这两个产地分别随机抽取同种的8只和7只西瓜,称重后得重量(市斤)如下:
甲(斤):9.31、9.57、10.21、8.86、8.52、10.53、9.21、9.14
乙(斤):9.98、8.46、8.92、10.14、10.17、11.04、9.43
问:根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?
解:建立假设 H0:甲乙两地的西瓜重量没有显著差异;
H1:甲乙两地的西瓜重量有没有显著差异。
然后根据上面给出的数据建立数据文件,注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具 体操 作过程如下:
第一步:单击Analyze Nonparametric Test 2 Independent Sample,打开Two-Independent-Sample对话框(见图1)。
第二步:选择检验的变量进入检验框中,选择分组变量进入Grouping Variable框中,单击Define Group键,打开Define Group对话框,将分组变量值分别键入两个框中,单击Continue返回主对话框(见图2):
第三步:在Test Type栏中,确定检验方法。
SPSS中提供了四种检验方式,几种检验方法侧重点不同,但都是先把两样本数据混合排序,再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样,所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。
第四步:选择输出的结果形式及缺失值处理方式;
第五步:单击OK,得输出结果。
所以,以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。
参考文献
[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.
[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).
[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).
试谈SPSS软件在考试数据统计分析中的应用
摘要: SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤,文中的方法对考试研究人员具有一定的指导意义。
关键词: SPSS软件 考试数据 统计分析 操作步骤
1. 引言
一份好的试卷须有好的测量指标来表明它的优良程度,试题有难度和区分度指标,试卷有效度和信度指标,这些是评价考试最主要的测量指标,但是仅有这些指标不足以反映一份试卷的实际测量效果,考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代,考试成绩统计主要依靠人工阅卷,考试数据无法电子化存储,对考试数据分析统计难以实现。随着计算机的普及和信息化的推广,各种分析数据的软件应运而生,这些软件中汇集了统计学和测量学的分析工具,使得应用电子信息技术分析统计考试成绩数据成为可能,这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中,SPSS是应用最多、影响最广泛的分析工具之一。在本文中,我们以SPSS软件为工具,对 教育 招生考试成绩的数据进行统计分析,分析主要着重于考试数据的相关性、假设检验等几个方面。
2. SPSS分析软件简介
“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”,中文名称为“社会科学统计软件包”,它是世界著名的统计分析软件之一,在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包,它集数据整理、分析于一身,主要功能包括数据管理、统计分析、图表分析、输出管理等,该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。
下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析,介绍使用SPSS进行统计分析的一般方法和步骤。
3. 相关性分析
教育考试中,考试结果的信度,试题的区分度,每个题目得分与试卷总分的关系,以及题目之间的关系,等等,都是考试研究的重要内容,最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中,Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。
Pearson相关系数法计算公式:
式中x为第i个考生第j题的得分,y为第i个考生第k题的得分,为第j题的平均分,为第k题的平均分,n为测试样本量。该公式既可以计算两个连续变量之间的相关性,又可以计算一个双歧变量与一个连续变量之间的相关性。
Spearman相关系数法计算公式:
r=1-(2)
式中D为两个变量的秩序之差,n为样本容量。
Cronbach a信度系数法计算公式:
α= 1-(3)
式中n为试题数,s为第i题的标准差,s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。
对于给定的一组考生成绩数据,利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性,以及各个题目之间的相关性。我们以Pearson相关系数分析为例,利用SPSS软件进行统计分析。
数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷),数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。
我们以SPSS 13.0版本的软件为例,介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例):
(1)将考试数据导入SPSS软件,在SPSS数据窗口中,顺序点击【Analyze】→【Correlate】→【Bivariate...】,系统弹出变量相关系数设置对话框。
(2)在该对话框中,将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中,在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中,选取“Pearson”复选框。
(3)在该对话框的“Test of Significance”设置区域,可以点选“Two-tailed”选项或者“One-tailed”,我们采用系统默认值。
(4)对话框中的 其它 选项取软件系统的默认值,点击【OK】,开始相关系数计算,系统弹出新的窗体输出运算的结果。本次输出的情况如下:
上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中,但题目T4和题目T5之间的相关程度远高于其它几个题目,我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系,这是我们通过分析获取的重要信息,该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性,这在大规模考试中是不应该出现的,需要在以后的命题考试中加以改进。
Spearman相关系数分析方法和上述分析方法类似,只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框,程序就会按Pearson相关系数法进行统计分析,如果同时选中“Spearman”和“Pearson”复选框,程序将会同时计算按两种分析方法统计分析的数据,并会以不同的图表进行显示,而Cronbach a信度系数法计算方法与上述方法略有不同,其操作步骤如下:
(1)在SPSS数据窗口中,顺序点击【Analyze】→【Scale】→【Reliability Analysis...】,系统弹出“Reliability Analysis”信度分析设置对话框。
(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中,在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数),点击“Statistics”选择项可以进行更为详细的参数设置,我们采用系统的默认值即可。
(3)参数设置完毕之后,点击【OK】,软件开始相关系数计算并输出运算结果。
4. 选择题的选项分析
在目前的教育招生考试中选择题是一种较常见的题型,考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2],对选择题干扰项的设计及其施测后的实际效果关注甚少,事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设,对试卷中常见的选择题选择项进行统计分析。
教育考试的单项选择项一般设置为4个,其中仅有1个选择项是正确的。命题人员在设计选择项时,应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测,对考生作答的分布情况作出预估。考试结束后,研究人员应该对实测的情况与命题教师预测的情况进行对比分析,以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性,因此可以尝试使用χ检验假设进行分析。
我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理,设变量E是命题者对某道试题的期望值,E=nP,n为样本容量,P为期望的相对频率,引入以下统计量:∑(O-E)/E,其中O为观察频数。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
我们需要进行的假设检验是:零假设H:选项的实测分布与期望分布相同;非零假设H:选项的实测分布与期望分布不同。
检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真,则检验统计量∑(O-E)/E呈近似χ分布,其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合,就不排除零假设,否则就排除零假设;最后对检验假设的结果进行解释。
数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本,利用SPSS进行统计分析。
SPSS数据统计分析的步骤如下:
(1)将考试数据导入SPSS软件,依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】,弹出“Chi-Square Tests”对话框。
(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中,本例中题目的序号为t7。
(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框,具体操作方法是选中单选框“Values”,输入具体的期望数值,点击“Add”按钮,依次重复上述的步骤直至所有的选项的期望值输入完毕。
(4)点击【OK】,输出软件运算结果。
我们需要进行的假设检验,H:选项的实测分布与期望分布相同;H:选项的实测分布与期望分布不同。
假设检验的显著性水平为α=0.05,χ=∑(O-E)/E,自由度为df=4-1=3,查χ分布表或利用相关软件可得P=0.0626,由于P>α,因此不能拒绝零假设,即选项的实测分布与期望分布相同。因此,检验结果在0.05显著性水平时,没有足够的证据拒绝零假设,即可认为本题选项的实测分布与期望分布相同,也就是说本题的实际测试效果与命题教师预测的效果是一致的,命题教师准确地估计了考生的实际水平,这是分析获得的很重要的结论。
5. 结语
SPSS软件在考试数据统计分析中应用广泛,但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面,本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看,软件操作步骤和统计分析过程十分简单、快捷,对于测量学和统计学基础不太好的数据分析统计人员来说,只要遵循一定的操作步骤,就可以进行分析。
参考文献:
[1]王孝玲.教育测量(修订版)[M].上海:华东师范大学出版社,2006.
[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006.
[3]李伟明,冯伯麟,余仁胜.考试的统计分析方法[M].北京:高等教育出版社,1990.
[4]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007.
猜你喜欢:
1. 统计学数据分析论文
2. spss统计分析实习心得
3. 统计学学年论文
4. 统计学分析论文
统计学是一门抽象难懂的学科,非统计学专业毕业人员一般很难做到精通。下文是我为大家整理的关于统计类论文投稿的范文,欢迎大家阅读参考!
医学统计学方法应用的错误解析
一、引 言
医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。
二、医学论文统计学方法应用概况
医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。
(一)材料与方法部分
正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,
方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的FBAT1.7.3版本。
(二)论文结果部分
论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。
结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。
关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。
1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取0.05与0.01作为检验显著性,对于结果的计算要求具体的P值,如P=0.23或P=0.02。
2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P<0.05,表明差异具有统计学意义。P值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,P值也可能很大;当样本量大时,数据之间的差别即使很小,P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。
变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。
三、医学论文统计学方法应用的常见错误分析
(一)“材料与方法”中的统计学方法应用的常见错误
“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。
(二)“结果”统计学方法应用的常见错误
1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。
2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。
3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为6.7 ±2.4 和1.2 ±0.6 ( P = 0.000 1) 。按空腹血糖值低于7.7mmol/L的疗效判定有效率,研究组和对照组的有效率分别为75.6%和12.4% ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效(24.4%)。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 0.015或P = 0.321等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。
四、小 结
提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。
参考文献:
[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).
[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).
[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).
统计学专业毕业现状分析与对策研究
本科毕业论文是高等学校人才培养计划的重要组成部分,是本科教学过程中最后一个重要的教学实践环节,是学士学位授予的一个重要依据。[1,2]然而,相较于其他教学环节,毕业论文没有受到足够的重视,从而导致该环节存在着一些问题。[3]本文将以中央民族大学统计学专业毕业论文为例,在分析其现状的基础上,找到问题并提出相应的建议。
中央民族大学统计学本科专业设置于2003年,目前已有六届毕业生。经过学院和学校层面的努力,统计学专业作为新办专业取得了较快发展,所培养的学生具有较好的专业能力和综合素质,近四成学生继续读研深造,就业的学生大都在专业对口的工作岗位上,就业率一直在85%左右。
本科毕业论文环节在培养方案中是6个学分。学生在第七学期开始选择指导教师以确定毕业论文题目。经过前6个学期的系统理论学习,统计学专业学生已基本掌握了统计学的基础理论和基本方法,具备了正确的统计思想和较强的统计软件应用能力,以及运用所学的理论和方法解决实际问题、文献检索和资料查询等综合能力。本科毕业论文的写作就是统计学专业学生将上述基础和能力进一步深化与升华的重要过程,从而培养学生的创新能力和实践能力,使学生的知识、技能和素质得到进一步的充实和提高,同时也是衡量学校教学质量和办学水平的重要指标。因此对如何提高毕业论文质量进行研究是必要和有意义的。[4]
一、统计学专业毕业论文质量的现状分析
从论文完成情况来看,每届的毕业论文基本都能达到论文教学环节的要求,通过对中央民族大学统计学专业2007~2011年四届毕业生的毕业论文进行分析,发现毕业论文及格率为99.18%。
从毕业论文研究的类型来看,主要分为两大类:理论研究型论文和实证型论文,理论研究型论文表现为总结和论述现有统计理论问题,表述理论研究的成果,或应用理论对现实问题进行分析、说明,并提出自己的思考;实证型论文主要表现为针对某一特定的实际目的或目标,运用所学统计的理论和方法,对经济、管理、金融、医学、生物、工程、环境等领域进行统计调查、统计信息管理、数量分析等。
从论文知识点范围的分析来看,学生论文绝大多数是统计专业问题,极少数是其他数学分支的问题。从中央民族大学历届统计学专业学生的毕业论文情况分析,发现毕业论文中研究其他数学分支的问题占总数的6.50%,主要包括:一是其他科目的应用研究(数学分析、常微分方程、运筹学及空间解析几何等),占总数的1.63%。二是数学专业教育和数学思维的研究,占总数的4.87%。研究统计学专业问题的毕业论文占绝大部分,比例为93.50%,选题内容广泛且多为社会热点问题,涉及经济、社会、医疗卫生、教育发展、旅游、基础设施建设等多领域,由于受学校人文环境影响,很大比例的学生对少数民族地区的经济、社会、民生等问题进行了统计分析,约占总学生人数的30.08%。所使用的分析方法主要集中于抽样调查、回归分析、多元统计方法、聚类分析、判别分析等常用统计方法。
此外,统计分析显示学生成绩普遍偏高,统计学专业学生的毕业论文,尤其是实证类论文,存在着可以大量使用背景介绍和统计软件分析结果的特点,因此,一些论文没有创新性和学术含量,但具有较大的篇幅,与理学院其他专业的毕业论文成绩比较,其平均成绩相对较高,约80.42分。
二、统计学专业毕业论文存在的问题
毕业论文的质量问题关系到本科人才的培养规格和目标,直接体现了学生本科阶段的学习成果,是衡量教学水平、学生毕业与学位资格认证的重要依据。通过对论文和考评结果的具体分析,发现学生的毕业论文在创新性、理论深度及论文写作常识多方面存在问题。具体表现为:
1.创新性不够
学生的毕业论文表现为理论性研究非常少,大都是实证型论文,并且多是简单的统计方法应用,缺少创新性研究和思考。从中央民族大学历届统计学专业学生的毕业论文来看,理论研究型论文只占4.89%,与实证型论文的比例为1︰19.45,比例悬殊,体现了学生在毕业论文大的选题过程中,避重就轻,缺乏创新的特点。如每年都有一定数量的学生选择“我国人均GDP的预测”这类针对某经济指标进行预测的题目,论文的主要内容就是利用ARMA、灰色预测或者趋势外推方法等一种或多种方法对时间序列数据做简单建模和分析,论文没有对指标本身的意义以及国内国际的社会经济形势进行综合分析。这种方法简单套用性质的论文占有很大的比重。
2.选题过大、内容空泛,缺乏深入研究,存在抄袭、拼凑现象
有些学生在选择研究课题时,往往不能根据自身的专业知识结构特点和社会实践情况进行准确定位,只是一味的盲目的选择一些过大过空的社会热点问题,因此难以看到所要研究的问题的本质。如有的学生针对CPI做研究,没有深入了解问题的实质,只是收集了一些文献,很难提出自己的观点或研究角度,造成了材料堆积且过于散乱,论文变成了一些材料的简单拼凑。有些论文针对某一社会经济问题进行研究,论文的主题只是针对现有数据利用简单的统计方法进行分析,对数据的质量和可靠性以及方法的适用性不做针对性讨论,对所得的结论也不结合社会经济现实情况进行分析,导致论文质量不高。
3.相对前沿的分析方法利用较少
前沿的分析方法利用较少,通过毕业 论文的 写作, 统计分析能力没有实质性提升。学生论文使用的统计方法主要集中于回归分析、聚类分析、判别分析、相关性分析等,其中回归分析方法占有非常大的比例,约41.46%,其他各统计方法使用的比例分别为:聚类分析为5.69%,判别分析为7.32%,相关性分析为14.63%,多元统计方法为2.44%,时间序列分析为3.25%,极少有学生使用教科书外的相对前沿的分析方法。
4.论文写作上存在结构不合理、没有相关研究介绍、创新点表述不清、参考文献不会正确标注等问题
从学生的毕业论文来看,论文写作不规范,专业性差。主要存在论文形式不规范、结构不合理、题目含糊、有些论文杂乱无章、口语化严重、可读性差等问题。
三、存在问题的原因分析
针对上述问题,统计学系通过对论文进行详细审查以及 组织指导教师和学生座谈,发现毕业论文出现以上问题的主要原因包括以下几方面:
1.学生对论文不够重视
部分学生由于忙于考研学习而无暇顾及毕业论文的研究,还有部分学生由于忙于外出找 工作、 实习而无心认真撰写论文。论文撰写所需的必要时间难以得到保障,因此学生应付了事,从而无法保证论文的深度。此外,还有部分学生认为毕业论文只是一个教学环节,与考研的好坏无关,存在只要写了论文,教师都会让自己通过的侥幸 心理,在思想上没有引起足够的重视。
2.缺乏指导教师的针对性指导
指导教师所带毕业生人数过多,使得导师的工作量呈现超负荷状态,无法保证每个学生毕业论文的质量,从而致使部分学生的论文规范性较差,没有对存在的问题反复修改,使得学生论文存在诸多问题。
3.学生的专业训练还不够
大部分本科生没有经历过论文的写作训练,写作水平较低,不了解学术论文的规范性及其格式,不知如何从科研的角度构思文章、组织材料、安排结构,使得相当一部分学生的毕业论文表达的观点不够准确清楚,论据亦不能很好地支持论点。另外,一些同学为了完成任务,直接将在 网络中搜索到的资料不假思索的拼凑在一起,使得内容不成体系,观点混乱。
四、提高毕业论文质量的建议和 实践
1.加强毕业论文重要性的宣传,提高学生的重视度
加强对毕业论文重要性的认识有助于提高本科生毕业论文的质量。通过讲座、课堂传授等形式,让学生意识到毕业论文的实践性和综合性是任何教学环节都不能替代的,是提高发现问题、分析问题、解决问题能力的有效途径,更是进行个人综合素质提高的必不可少的重要环节,[4]从而使学生在思想上认识到毕业论文的重要性,投入更多精力进行毕业论文设计。
2.选题和教师的科研项目相结合,提高论文的创新性
在选择课题时,为了能充分发挥学生的主观能动性,可以让学生根据自身的特点,与指导教师协商,结合导师的研究方向制定课题方案。统计学专业的教师一般除了 申请国家自然科学基金和国家 社会科学基金这类对理论性和创新性要求较高的项目以外,很多教师还主持或参加有相应的 应用研究类项目。应用类项目大都需要实地调研(以及问卷涉及和数据分析)或者大量的数据分析和建模。引导学生参加这类项目来设计和完成自己的本科毕业论文,能够激发学生的科研热情和创新潜力。此外,鼓励和引导一些成绩较好,如让具备保研资格的学生参加教师的科研讨论班或者课题组,选择一些具有一定难度的理论问题进行研究,可以使学生了解本学科的 发展方向和最新动态。最近两年,越来越多的学生,特别是具备了保研资格的学生,在大四上学期就能投入到项目和毕业论文的写作中。
3.重视平时实践教学环节,培养学生的实践能力、发现问题以及解决问题的能力
为了提高学生的学习兴趣以及对问题的分析、解决能力,广泛开展了丰富多彩的社会实践活动,使学生尽可能早地接触与本专业有关的实际工作,切身 体会到如何将理论与实际相结合,了解本学科的实际业务,从而提高自主学习能力,加强专业知识的把握。结合学校的实际情况,积极鼓励学生在大二和大三阶段参加校级和国家级的全国大学生数学建模竞赛,申请“中央民族大学本科生研究训练 计划项目”、“北京市大学生科学研究计划项目”和“国家大学生创新性试验计划项目”。项目的申请和实施以及研究 报告的写作,对学生来说都是一个很好的锻炼。目前,统计学专业本科生的参与率在70%以上。此外,建立专业实习基地可以提高学生利用专业知识分析和解决实际问题的能力。这些环节的设计和实施都有力地保障了学生本科毕业论文的水平和质量。
4.加强学生科技论文写作训练
加强平时课堂上大作业的规范化,潜移默化培养学生科技论文的写作能力。通过平时的实践活动,如学生数学建模以及大学生创新实践等各类实践性项目来提高学生的 论文 写作能力。
5.实施激励措施,激发学生的兴趣和主动性
针对那些参与实际课题的学生,学院鼓励指导教师根据学生的完成情况以劳务费的形式给予其奖励,另外积极鼓励毕业论文质量优秀的学生进行投稿 发表。此外,还需对答辩程序和评分标准进行规范化,建立优秀毕业论文指导教师和优秀毕业论文奖励制度,以形成积极的导向作用,充分调动指导教师和学生的积极性。
6.加强教师责任心,建立完善的机制
加强学生毕业论文的过程 管理,从开题到中期检查严格执行,指导教师严格把关。为了保证学生与教师之间的沟通,学校可以通过建立师生信息反馈机制改善师生分离状态,为师生提供便利的沟通渠道,同时设置适当的教师激励制度,中央民族大学目前对教师指导本科毕业论文有额外的课时补贴。
世界银行关于中国GDP数据的调整及其存在的问题
(内容提要:论文深入研究了世行调整中国GDP数据的原因、方法和结果,系统地阐述了90年代初以来中国统计体系和价格体制改革所取得的巨大进步,以事实为依据,利用大量翔实的资料,对世行的调整方法进行了逐项剖析,揭示出其存在的问题,阐明了这种调整方法已经不符合中国目前的实际情况、世行不应再调整中国GDP数据的基本观点。
本文发表在《经济研究》1999年第6期。)
90年代初,世界银行派代表团对中国统计体系进行考察之后,发表了一篇考察报告:《转换中的中国统计体系》。报告认为,中国统计体系虽然进行了深入的改革,但其在基本概念、调查范围、调查方法等方面仍存在着很大缺陷:基本概念仍深深扎根于传统的物质产品平衡表体系(MPS),调查范围仍主要限于物质生产领域,调查方法仍以传统的全面行政报表为主;中国价格体制虽然进行了许多重大改革,但仍保留着传统价格体制的许多本质特征,许多产品的价格仍然处于政府控制之中。这些情况导致中国官方国内生产总值(GDP)总量数据的低估和速度的高估。1994年,世行发表了一篇专题报告:《中国人均GNP》。它以上述考察报告为依据,对中国官方1992年GDP数据进行了较大幅度的向上调整。世行公布的1993-1997年的中国人均GNP数据是在其调整后的中国1992年GDP(注1)总量数据和中国官方公布的经济增长率数据基础上计算出来的。因此,世行公布的中国1992-1997年人均GNP数据远大于中国官方人均GNP(注2)的美元折算数。本文阐述世行关于中国官方1992年GDP数据的调整及其存在的问题。
一、世界银行关于中国官方GDP数据的调整
世界银行对中国官方GDP数据的调整包括三个方面内容:一致性调整、范围调整和估价调整,综合调整比率为34.3%。其中一致性调整和范围调整是关于统计体系的不完善所做的调整,估价调整是关于价格体制的影响所做的调整。
世行关于中国官方GDP数据的调整情况简要概括在表1中:
表1:世界银行关于中国官方GDP数据的调整
调整项目 调整幅度 对GDP的影响(%)
自产自用的粮食 上调20% +0.8
存货增加 下调1/3 -1.6
福利服务 10%企业劳动力从事福利服务 +1.6
亏损补贴 补贴视作政府最终支出 +0.8
一致性调整合计 +1.6
粮食产出 上调10% +0.9
蔬菜产出 上调30% +2.3
农村工业产出 上调10-15% +0.6
农村服务业产出 上调50-60% +6.5
住房服务支出 上调40% +1.5
范围调整合计 11.7
住房服务 179.8% 1.5
全部其他行业 -12.1%-43.0% 16.6
估价调整合计 18.3% 18.3
总计 34.3
注:1、农村工业包括农村煤炭开采业、纺织业、消费品制造业和其他工业
2、农村服务业包括人文服务业、原材料服务业和其他服务业
3、全部其他行业包括粮食作物种植业、其他作物种植业、煤炭开采业、纺织业、消费品制造业、其他工业、人文服务业、原材料供应业、其他服务业
(一)一致性调整
从表1可以看出,世行关于中国官方1992年GDP数据的一致性调整包括以下几个方面:
1、农民自产自用的粮食
世行认为,中国统计体系以低于市场的价格估价农民自己生产自己消费的粮食。它假定对这部分粮食进行一致性估价将使其价值增加20%,这种调整使GDP上升0.8%。
2、存货增加
世行认为,中国对不能销售或不能按计算产出时所采用的价格销售的产出存货增加的计算存在严重的不一致性。它认为,一般来说,如果这些存货结转另一年,并最终被废弃或按大打折扣的价格销售,中国没有对GDP中的存货增加做相应的调整。因此,存货增加大于采用一致性估价所应有的价值量。世行因此将中国的存货增加调低1/3,导致GDP下降1.6%。
3、福利服务
世行认为,中国企业改革的最重要组成部分之一,是将目前企业对职工提供的诸如住房、医疗等福利性服务市场化。这种改革的结果将导致GDP上升。世行假定有10%的劳动力从事相应的服务,并假定这些服务转向市场化。通过投入产出计算,这种假定使GDP 上升1.6%。
4、企业亏损补贴
中国统计规定,企业亏损补贴作为GDP的负项。世行认为,在许多情况下,企业亏损是政府价格政策的结果。从经济观点来看,这种补贴是对以优惠价格提供货物和服务的补偿,统计上应当处理为政府的货物和服务购买和政府对相应接受者的分配,即不应当作为GDP的负项,而应当作为正项包括在政府最终支出中。世行对这种处理方法进行了调整,结果使政府支出增加7%,导致GDP上升0.8%。
综合上述结果,世行将中国官方1992年GDP数据上调了1.6%。
(二)范围调整
从表1可以看出,世行关于中国官方1992年GDP数据的范围调整包括以下几个方面:
1、粮食
世行认为,中国的耕地面积被低估了十分之一到三分之一(与卫星测量的耕地面积相比);同时,样本产量可能被高估了,综合两方面因素,将中国的粮食产出调高10%,导致GDP上升0.9%
2、蔬菜
世行认为,中国蔬菜产出价值的计算没有反映单位面积的蔬菜实物产量随时间和收获周期而变化以及市场力量正在鼓励蔬菜的非旺季生产(此时价格较高)情况,同时,蔬菜耕地面积的测算也是不准确的。考虑以上各方面因素,世行将中国的蔬菜产出价值调高30%,导致GDP上升2.3%。
3、农村工业
世行认为,村及村以下工业的产出被低估,因为相应企业通常没有完整的财务报表和不属于国家统计局直接管理的统计调查系统。农村工业的迅速发展和一定程度的偷漏税情况影响到产出的低估。某些迅速增长的农村工业,如建筑材料工业,高价格和高利润鼓励了产出的低估。利润低的行业,如煤炭开采业,也有低报的刺激,因为煤炭的自由市场价格较高。另外,世行也指出,为了夸大地方官员的政绩,农村工业也出现了高估产出的现象。综合上述因素,世行将中国农村工业产出调高10-15%,导致GDP上升0.6%。
4、农村服务业
世行认为,农村服务业,例如农村卡车和拖拉机运输服务业发展的非常迅速,但是中国没有一套系统的测算方案;农村服务业统计基本上没有包括临时生活和工作在城市的农村人从事的服务活动,例如大量的个体维修店的修理人员、小贩、餐馆老板、理发师和家庭佣人,等等。考虑上述因素,世行将农村服务业产出调高50%-60%,导致GDP上升6.5%。
5、居民住房服务
世行认为,中国居民住房服务既存在范围方面的低估,也存在价格方面的低估。从范围方面讲,城市和农村住房服务统计都不完整。中国的住房服务价值是通过住房面积、造价和折旧率等资料推算出来的,但住房面积资料不完整,城市住房面积调查资料没有包括居住在城市里的农村居民住房面积,农村住房面积调查范围的不完整性更加突出。世行假定国家统计调查网络覆盖了中国所有住房的三分之二到四分之三,进而把中国的住房服务价值调高40%,导致GDP上升1.5%。
综合上述结果,世行将中国官方1992年GDP数据上调了11.7%。
(三)估价调整
世行认为,由于扭曲的价格体制和生产率方面的差异,中国工业的土地和资本回报率远高于其他行业,消费品制造业的回报率最高,服务业和煤炭行业的回报率最低,农业的回报率也比较低,中国进一步的价格改革将改变行业的营利状况。世行试图将各行业的土地和资本回报率调整到全国的平均水平。由于纺织行业在中国对外贸易中很重要,世行在估价调整过程中,保持该行业的价格不变,将住房和其他房地产业的价格提高,纺织业以外的消费者制造业的价格降低。世行利用1987年投入产出表对GDP进行了调整,结果使GDP上调18.3%。
综合上述三个方面的调整结果,世行将中国官方1992年GDP数据上调了34.3%。
二、世界银行关于中国GDP数据调整存在的问题
世行关于中国GDP数据的调整是建立在它对80年代末90年代初中国统计体系和价格体制的了解和判断基础上的。90年代初以来,中国统计体系和价格体制改革取得了巨大进步。就统计体系来说,随着国民经济核算制度的改革,基本概念和基本框架已经基本上实现了向国民经济核算最新国际标准--联合国1993年SNA的转换;统计调查范围已经由传统的物质生产领域扩展到非物质生产领域;全面行政报表的统计调查方法已经被以普查为基础,抽样调查为主体的调查方法体系所取代;开展了多项普查,包括农业普查、工业普查、第三产业普查、基本单位普查,等等;许多专业统计采用了抽样调查方法,例如农产品产量调查、农村和城市住户调查、价格调查,等等。这一系列统计改革,使中国统计体系得到不断完善。就价格体制来说,中国进行了广泛而深入的改革,目前,市场价格已经成为中国价格体系的主体。
具体说来,世行关于中国GDP数据的调整至少存在以下若干方面问题:
(一)一致性调整问题
1、农民自产自用粮食的估价
中国农业统计规定,农民自产自用粮食的价值,按出售的综合平均价格计算,这种综合平均价格综合了国家收购价格与市场价格两种因素。近些年来,中国粮食连续获得丰收,为了保护农民种粮的积极性,国家的粮食收购价格已经高于,而不是低于市场价格,因此,上述综合平均价格不会低于市场价格。世行关于中国统计体系以低于市场的价格估价农民自产自用的粮食的判断,已经不符合中国目前的实际情况。
2、存货增加
80年代末90年代初,受传统的计划经济体制的影响,还有相当一部分企业只考虑生产不考虑市场需求和赢利情况。这些企业生产出来的部分产品可能销售不了,只能被废弃或按大打折扣的价格处理。因此,就当时的情况来说,世行把中国的存货增加调低三分之一,可能是不过分的。但是,自从党的十四大把中国经济体制的改革目标确定为市场经济体制以来,情况发生了很大的变化,市场需求和赢利状况已经逐步成为企业生产决策的主要考虑。因此,企业生产的产品被废弃或按打折扣的价格处理的情况明显减少。所以,世行的调整比率不再适合中国目前的存货产品销售的实际情况。
3、福利服务
近些年来,中国进行的一系列企业制度改革,正在推动企业的福利性服务逐步走向市场化,企业从事福利性服务人员的比例正在逐步下降。因此,至少对于中国目前的企业情况来说,世行假定企业有10%的劳动力从事福利性服务的比例太高了,相应地对GDP的调整比例也就不合适了。
(二)范围调整问题
1、粮食
中国官方统计的耕地面积数据确实低于卫星测量数据,但是,卫星测量出来的耕地面积包括25度以上的坡地、河滩地、轮休地、沟渠和田间道路等等。这些地不能视同正常的耕地。所以,中国官方的耕地面积数据与实际耕地面积之间的差距不像世行估计的那么大。另外,除了农业统计包括粮食产量调查外,农村住户调查还编制农村住户农业生产情况表和农村住户粮食收支平衡表,分别反映农村住户粮食生产情况和年初粮食结存、年内粮食收入、年内粮食支出、年末粮食结存情况。这些不同类型调查能够对粮食产量统计起到校对作用。根据以上情况,中国的粮食产出数据与实际情况应当是比较吻合的,世行将其调高10%,必将导致GDP数据的高估。
2、牧业
世行断定中国统计数据低估了农业产出,事实上,中国的经常性农业统计还存在高估的成分。全国农业普查结果表明,1996年统计年报中的肉类产量高估了22%,猪、牛、羊存栏头数分别高估了20.7%,、21.1%和21.8%。因此农业总产出和农业增加值被高估了。针对这种情况, GDP应当相应地向下调整。这是世行所没有料到的。
3、农村工业
全国第三次工业普查结果表明:由农业部乡镇企业管理部门统计的农村工业总产值数据高估了18000亿元(1995年),占全部农村工业总产值的40%。显然,与世行的判断恰好相反,农村工业产出应当向下调整,而不应当向上调整。
4、农村服务业
世行关于中国农村服务业统计不完善的判断和数据调整对于80年代末、90年代初的中国统计状况来说,是不过分的。但是,中国在1993至1995年开展了首次第三产业普查,对包括农村服务业在内的全部服务行业进行了全面调查,同时,根据普查资料对GDP历史数据进行了较大幅度的调整:
表2:第三产业普查关于服务业增加值和GDP数据的调整比率(%)
年度 GDP 第三产业 运输邮电通信业 商业 非物质服务业
1978 1.0 4.4 0.0 0.0 9.3
1980 1.1 5.2 0.0 0.0 9.6
1985 5.1 20.6 0.0 52.2 11.9
1986 5.3 21.2 0.0 58.1 12.4
1987 5.8 23.0 0.0 62.3 13.2
1988 6.1 23.4 0.0 65.1 10.7
1989 5.7 20.3 0.0 66.7 8.8
1990 4.8 17.2 2.7 67.6 8.5
1991 7.1 24.7 10.4 67.6 13.9
1992 9.3 33.1 9.5 88.7 21.7
1993 10.0 32.0 11.7 73.4 24.8
注:本表根据《中国统计年鉴,1994》和《中国统计年鉴,1995》计算。
事实上,这种调整已经大大超过世行对农村服务业的调整。例如,世行对农村服务业数据的调整导致1992年 GDP数据上升6.5%,而第三产业普查之后,中国对同年GDP数据的上调比例达9.3%。因此世行对中国农村服务业统计的判断和数据调整已经不再适合中国目前的实际情况。
(三)估价调整问题
90年代初以来,中国确立了建立社会主义市场价格体制的目标模式,价格改革取得了突破性进展,严重扭曲的价格结构得到明显改善。例如,从1990年到1997年,世行认为土地和资本回报率最低的服务业和煤炭工业价格分别上涨了222%和206%,而属于土地和资本回报率最高的消费品制造业的食品工业和纺织工业价格仅分别上涨96.8%和60.3%。特别重要的是,目前,市场机制在中国货物和服务价格形成中已经起了主导作用。货物的价格基本上由市场决定,除部分服务业,如居民福利性住房服务业仍偏离市场价格外,绝大多数服务业的价格也由市场决定。即使那些偏离市场价格的服务业也正在迅速向市场价格过渡。例如,随着住房制度的改革,住房服务将市场化,福利性住房服务不久将不复存在。
另外,有关部门在对33种具有代表性的商品进行国内外价格比较时发现,1998年11月,国内价格高于国际价格的有22种,占69%,其中包括小麦、玉米、大豆、豆油等农产品,硫酸、盐酸、尿素等化工产品,汽油、柴油等能源产品,铝锭、生铁等冶金产品,等等。
总之,在中国的价格形成机制、价格规模和价格结构发生重大变化的情况下,如果世行仍然依据1987年投入产出表对各行业进行价格方面的调整,也势必导致GDP数据的高估。
注1: 由于中国官方GDP和GNP数据差距不大,世界银行在计算中国官方人均GNP时是以中国官方GDP数据,而不是以GNP数据为基础。由于同样的原因,本文对GDP和GNP不加区别。
注2:中国官方人均GNP是按人民币计算的。
参考文献——
1.Document of the World Bank No.13580-CHA:China GNP per Capita,December15,1994.
2.世界银行文件:《转换中的中国统计体系》,国家统计局内部翻译件。
3.国家统计局1998年制定:《国家统计报表制度》。
4.国家统计局1998年制定:《农村住户调查方案》。
5.国家统计局编:《中国统计年鉴》(1994,1995 ,1997,1998) ,中国统计出版社 1994、1995、1997和1998年出版。
6.许宪春著:《中国国民经济核算体系改革与发展》,经济科学出版社1997年出版。
7.《价格监测与分析》1998年第22期
摘要:本文用模特卡罗模拟方法研究了样本容量在54以下的DW统计量的分布特征,并给出小样本DW检验临界值表。同时用DW检验提出了一个判别最小二乘估计中是否存在虚假回归的有效方法。关键词:模特卡罗模拟,DW分布,非平稳性,协整
Distribution of Small Sample DW Statistic
Zhang Xiaotong1 Zhao Chuxiao2
(1. Institute of International Economics, Nankai University, Tianjin 300071)
(2. Management School, Tianjin University, Tianjin 300072)
Abstract In this paper we investigated the DW distribution with sample size under 54 by Monte Carlo simulation method and gave a critical table for small sample DW test. Based on that we proposed a method for recognizing spurious regression in ordinary least squares estimation.Keywords: Monte Carlo simulation, DW distribution, nonstationary, cointegration
1.概述
八十年代以来,Engle-Granger (1987), Engle-Yoo (1987) 和Sargan-Bhargava (1983)都曾提及用DW统计量检验非平稳变量间的协整性问题。在Sargan-Bhargava (1983)中还专门给出一个DW协整检验用表。但在这些论文中均未对小样本DW统计量的分布特征给与研究。
本文采用蒙特卡罗模拟方法对小样本DW统计量的分布特征进行了充分、详细的研究。样本容量分别取为10,20,30,40和50。变量的设定分为三种情形:一. 所涉及的两个变量都取自I(1)过程;二. 所涉及的两个变量中一个取自I(1)过程,一个取自I(0)过程;三. 所涉及的两个变量都取自I(0)过程。
在有些国家以年为单位的时间序列的最大可观测值个数并不是很大,所以对小样本DW统计量分布特征的研究有着非常重要的理论与现实意义。
本文结构如下。第二节推导两个I(1)变量进行最小二乘回归后,由残差计算的DW统计量的极限分布表达式,第三节介绍蒙特卡罗模拟结果及其分析,第四节给出实例,第五节给出结论。
2.DW统计量的极限分布
给定如下随机数据生成系统,
yt = yt-1 + ut , y1 = 0, (1)
xt = xt-1 + vt , x1 = 0, (2)
其中ut, vt ~ I(0), E(ut) = E(vt) = 0; E(ui uj) = 0, i ¹ j," i, j。则yt和xt为相互独立的两个I(1)过程。
建立如下回归模型:
yt = b0 + b1xt + wt . (3)
当对上式进行最小二乘估计时,会产生虚假回归问题。用随机误差wt的最小二乘估计值 构造DW统计量,
(4)
因为当T ® µ 时, 必然接近于零,上式中分子为Op(1),而分母T -1sw2也是Op(1),所以DW统计量是Op(T -1)的。当T ® µ 时,有
DW Þ 0.
即当用两个I(1)变量进行如模型(3)形式的回归时,DW统计量的极限分布为零。
3.小样本DW分布的蒙特卡罗模拟及其结果分析
当样本为有限样本,特别是小样本时,DW统计量的分布与其极限分布有着很大不同。由于上述条件下的DW统计量的分布无法用解析的方法求解,本文用蒙特卡罗模拟方法对DW统计量的小样本分布特征进行了研究。
以模型(3)为基础,除了以yt,xt ~ I(1)为条件对DW分布(记为DW(1,1))进行模拟外,还分别以yt ~ I(1),xt ~ I(0) 和yt,xt ~ I(0)为条件进行了模拟(分别记为DW(1,0) 和DW(0,0))。
由于DW(0,0)就是通常意义的DW统计量,所以只模拟样本容量T = 10, 40两种情形。对于DW(1,1)和DW(1,0),分别取T = 10, 20, 30, 40和50进行了模拟。在每个样本容量条件下各模拟1000次。所得结果见表一。
首先见表一的第三部分,先分析DW(0,0) 的分布特征。由于DW(0,0) 就是通常意义的DW统计量,所以模拟结果表明,一. DW(0,0)分布的均值为2,不受样本容量大小的影响;二.分布是对称的,相应JB值(表中最后一列)说明小样本DW(0,0)统计量的分布与正态分布相当近似。三. 随着样本容量的增大,分布的标准差逐步减小。
见表一的第一、二部分。小样本DW(1,1)和DW(1,0)统计量有着相似的分布特征。一. 分布均为右偏态,分布左侧有端点,端点为零;二. 随着样本容量的增大,DW(1,1)和DW(1,0)分布的右偏倚程度越来越大,分布均值逐步相左移动,90、95、99百分位数也逐步向左移动,同时分布的标准差逐步减小,分布的峰值越来越大,DW取值向零集中;三. 在样本容量相同的条件下,DW(1,0)分布总是位于DW(1,1)分布的左侧,即DW(1,0)分布的均值、百分位数以及方差都比DW(1,1)分布的相应量小。T = 50模拟1000次的DW(1,1)和DW(1,0)分布的结果分别见图一和图二。
表一 DW分布的蒙特卡罗模拟结果
类 型 样本容量 百 分 位 数 均 值 标准差 偏 度 JB统计量
1 90 95 99
10 0.22 2.18 2.45 2.81 1.28 0.62 0.50 48.74
DW(1,1) 20 0.11 1.28 1.49 1.80 0.75 0.39 0.68 77.61
30 0.09 0.90 1.04 1.39 0.51 0.29 1.07 293.73
40 0.06 0.77 0.88 1.16 0.41 0.25 1.06 250.10
50 0.05 0.59 0.71 0.98 0.33 0.20 1.16 341.31
10 0.18 1.73 2.02 2.38 0.98 0.53 0.73 89.59
20 0.09 1.02 1.21 1.59 0.56 0.34 1.22 369.61
DW(1,0) 30 0.06 0.70 0.83 1.18 0.38 0.24 1.27 430.43
40 0.04 0.54 0.66 0.91 0.30 0.19 1.25 383.68
50 0.04 0.45 0.54 0.71 0.24 0.15 1.12 261.84
DW(0,0) 10 1.31 2.75 2.97 3.24 2.02 0.57 0.00 7.17
40 0.72 2.41 2.53 2.70 2.00 0.31 0.03 4.06
注:1. DW(1,1)表示由两个I(1)变量进行回归,计算得到的DW值
2. DW(1,0)表示由一个I(1)变量和一个I(0)变量进行回归,计算得到的DW值。
3. DW(0,0)表示由两个I(0)变量进行回归,计算得到的DW值。
4. 在每个样本容量条件下各模拟1000次。
图一 T = 50模拟1000次的DW(1,1)分布直方图 图二 T = 50模拟1000次的DW(1,0)分布直方图
在相同样本容量条件下,DW(1,0)分布之所以位于DW(1,1)分布左侧,可作如下解释。随着T ® µ,DW(1,0)和DW(1,1)的分布都趋近于零。由于DW(1,0)来自于一个I(1) 变量和一个I(0)变量之间的回归,所以残差序列wt ~ I(1)。由于DW(1,1)来自于两个I(1)变量之间的回归,一般来说残差序列wt&nb
1、统计范围
GDDS将国民经济活动划分为五大经济部门:实际部门、财政部门、金融部门、对外部门和社会人口部门。对每一部门各选定一组能够反映其活动实绩和政策以及可以帮助理解经济发展和结构变化的最为重要的数据类别。系统提出了五大部门综合框架和相关的数据类别以及指标编制和公布的目标,鼓励以适当的、反映成员国需要和能力的频率和及时性来开发和公布指标。选定的数据类别和指标分为规定的和受鼓励的两类。
规定的数据类别包括:(1)来自综合框架中的核心部分,如实际部门的国民帐户总量、财政部门的中央政府预算总量、金融部门的广义货币和信贷总量、对外部门的国际收支总量;(2)追踪分析统计类目,如实际部门的各种生产指数、财政部门的中央政府财政收支和债务统计、金融部门的中央银行分析帐户、对外部门的国际储备和商品贸易统计;(3)与该部门相关的统计指标,如实际部门的劳动市场和价格指数统计;(4)社会人口数据,包括人口、保健、教育、卫生等方面统计。
除规定的数据类别以外,GDDS鼓励成员国发布更多的统计信息,以增强成员国经济实绩和政策的透明度。如实际部门列出储蓄、国民总收入指标,财政部门列出利息支付和偿债预计数据等。
GDDS认为,系统所包括的大多数数据类别都是由各国官方机构编制的。将私人部门编制的数据包括进去将更有助于观察经济的全貌,并使各国数据的范围更加一致。但是,将一些由私人机构编制的数据包括在系统内会增加工作的复杂性,比如由官方转发这些数据隐含着对这些数据质量的认可,官方必须对在公众获得、数据完整性和数据质量方面的责任做出调整。
2、公布频率
公布频率是指统计数据编制发布的时间间隔。某项统计数据的公布频率需要根据调查、编制的工作难度和使用者的需要来决定。系统鼓励改进数据的公布频率。GDDS对列出的数据类别的公布频率作了统一规定。例如, GDDS要求国民帐户、国际收支平衡表按年公布,广义货币概览按月公布,汇率则每日公布。
3、公布及时性
公布及时性是指统计数据公布的速度。统计数据公布的及时性受多种因素制约,如资料整理和计算手续的繁简、数据公布的形式等。GDDS规定了间隔的最长时限,如按季度统计的GDP数据规定在下一季度内发布,按月度统计的生产指数规定在6周至3个月内公布。
GDDS将选定的数据类别分为规定性和鼓励性两类,目的是给予参加国公布统计数据一定的灵活性。鼓励性一类是要成员国争取发布的,条件不具备的可以暂不发布。有些数据类别下构成要素后面注明“视具体情况”,即成员国认为该项统计不符合本国实际的,可以不编制发布。GDDS规定的发布周期和发布及时性也列出一些灵活处理和变通的办法。
GDDS有关数据方面的内容及要求如下:
GDDS的数据规范
A、综合框架
核心框架
范围、分类和分析框架
受鼓励的扩展
频率
及时性
国民帐户
编制和公布全套的名义和实际国民帐户总量和平衡项目,得出国内生产总值、国民总收入、可支配总收入、消费、储蓄、资本形成、净贷款、净借款。编制和公布有关的部门帐户以及国家和部门的资产负债表
年度
10-14个月
中央政府操作
编制和公布交易和债务的综合数据,需强调:1)包括所有的中央政府单位;2)使用适当的分析框架;3)建立一整套详细的分类标准(税收和非税收收入、经常性和资本性支出、国内及国外融资),并适当细分(根据债务持有人、债务工具和币种)。
广义政府或公共部门操作数据,在那些地方政府或公共企业操作具有重要分析或政策意义的国家尤其鼓励。
年度
6-9个月
广义货币概览
编制和公布综合的数据,需强调:1)包括所有的存款公司(银行机构);2)使用适当的分析框架;3)建立对外资产和负债、按部门分类的国内信贷以及货币(流动性)和非货币债务构成的分类标准。
月度
2-3个月
国际收支
编制和公布综合的国际收支主要总量数据和平衡项目,包括:货物和服务的进口和出口、贸易差额、收入和转移、经常项目差额、储备和其他金融交易、总余额,并适当进行细分。
国际投资头寸和总体经济外债数据(如果这些数据具有重要的分析和政策意义)
年度
6-9个月
GDDS的数据规范
B、数据类别和指标
数据类别
核心指标
受鼓励的总量及构成
频率
及时性
实际部门
国民帐户总量
国内生产总值(名义和实际)
国民总收入、资本形成、储蓄
年度(鼓励季度)
6-9个月
生产指数
制造业或工业
初级产品、农业或其他指标
视具体情况
月度
视具体情况
所有指标都为6周-3个月
价格指数
消费者价格指数
生产者价格指数
月度
1-2个月
劳动力市场指标
就业、失业,工资/收入,视具体情况
年度
6-9个月
财政部门
核心指标
受鼓励的指标
频率
及时性
中央政府预算总量
收入、支出、差额和融资,视具体情况进行细分(根据债务持有人、债务工具和币种)
利息支付
季度
1个季度
中央政府债务
内债和外债,视具体情况适当细分(按币种、期限、债务持有人和债务工具)
政府担保债务
年度(鼓励季度)
1-2个季度
金融部门
核心指标
受鼓励的指标
频率
及时性
广义货币和信贷总量
净对外头寸、国内信贷、广义或狭义货币
月度
1-3个月
中央银行总量
储备货币
月度
1-2个月
利率
短期和长期政府债券利率,政策可变利率
货币或银行间市场利率及一套存贷款利率
月度
高频率(如月度)
股票市场
股票价格指数,视具体情况
月度
对外部门
核心指标
受鼓励的指标
频率
及时性
国际收支总量
货物和服务的进口和出口、经常帐户差额、储备、总差额
总体经济的外债和偿债数据,视具体情况
年度(十分鼓励季度)
6个月
国际储备
以美元标价的官方储备总额
与储备有关的负债
月度
1-4周
商品贸易
总进口和总出口
较长时间的主要商品的分类
月度
8周-3个月
汇率
即期汇率
每日
高频率(如月度)
社会-人口数据
核心指标
频率
人口
人口;人口增长率;城市人口;农业人口;人口性别;人口的年龄构成
各国公布频率会各不相同;及时性
保健
每个医生照顾人口数;预期寿命;婴儿/儿童/产妇死亡率
也不尽相同
教育
成年人文盲率、学生-教师比率、小学/中学入学率
贫困状况
获得洁净水的情况、卫生;每个房间居住的人数;收入分配;最低收入标准以下的家庭数
二、公布数据的质量
GDDS从两个方面的内容来评估公布的统计数据质量,即:提供统计数据的文字说明和提供统计数据的交叉检验。
统计数据质量是个难以界定、因而不易评估的概念。为了便于检查,GDDS选定两条规则作为评估统计数据质量的标准。一是参加国提供数据编制方法和数据来源方面的资料。资料可以采取多种形式,包括公布数据时所附的概括性说明、单独出版物和可从编制者得到的有关说明。同时也鼓励成员国准备并公布重要的关于数据质量特征的说明(例如,数据可能存在的误差类型、不同时期数据之所以不可比的原因、数据调查的范围或调查数据的样本误差等)。二是提供统计类目核心指标的细项内容、及与其相关的统计数据的核对方法,以及支持数据交叉复核并保证合理性的统计框架。为了支持和鼓励使用者对数据进行核对和检验,规定在统计框架内公布有关总量数据的分项,公布有关数据的比较和核对。统计框架包括核算等式和统计关系。比较核对主要针对那些跨越不同框架的数据,例如,作为国民帐户一部分的进出口和作为国际收支一部分的进出口的交叉核对。
与数据质量密不可分的是制定和公布改进数据的计划。所准备和公布的改进计划应包含所有数据不全的部门。统计当局应表明下述立场中的一个:(1)针对已发现不全的改进计划;(2)最近实施的改进措施;或(3)国家认定不
四、公众获取
GDDS规定要提前公布数据发布日期,并向各方同时发送。
官方统计数据的公布是统计数据作为一项公共产品的基本特征之一,及时和机会均等地获得统计数据是公众的基本要求。GDDS对此制定了两项规划:一是参加国要预先公布各项统计的发布日历表。预先公布统计发布日程表既可方便使用者安排利用数据,又可显示统计工作管理完善和表明数据编制的透明度。GDDS规定对于以年度为频率公布的综合框架和指标,时间表表明不迟于某个既定时间;对于公布频率更高的数据,则可确定一个日期范围,如3-5天。鼓励成员国向公众公布发布最新信息的机构或个人的名称或地址。二是统计发布必须同时发送所有有关各方。由于数据是有价值的商品,因此GDDS规定应向所有有关方同时发布统计数据,以体现公平的原则。发布时可先提供概括性数据,然后再提供详细的数据,当局应至少提供一个公众知道并可以进入的地方,数据一经发布,公众就可以公平地获得。
数据可从网上搜索,统计年鉴及各大数据库都有,再通过统计软件作分析,例如相关分析和回归分析,这种论文偏理论型。
推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定)。
对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及数据挖掘。
为了实际的理由,我们选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所搜集的样本叫做资料。
资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。
1,专业研究的培养目标和方向,包括一般的经济统计数据和统计类专业方向,培养了良好的数学素养和数学和经济学,掌握基本理论和统计方法,并能熟练地使用数据的计算机分析,本次调查可以从事企业,事业单位和经济,管理,统计,管理,定量分析,如开发,应用和管理,或在科研,教育等部门从事高级专门人才的科研和教学工作。毕业生可继续攻读统计和数学与应用数学,信息与计算科学,概率与统计,统计,工学,管理学等相关学科,跨学科的硕士研究生,和其他学科。
2,课程设置主要课程:数学分析,高等代数,解析几何,概率论与数理统计,C语言编程,微分方程,数据结构,动态数据处理,随机过程,网络与通信,统计决策和分析,统计计算和软件,多元统计分析。
教学根据社会的实际需要,重点建立社会经济统计资料,或者金融和保险统计,或生物医学的统计数据,或一些工业统计课程等方面,指导学生参加,以形成自己的专业方向特点。
3,科学和经济学的学术/四年制本科学士学位/学士学位。
4,毕业生应获得以下几方面的知识和能力
4.1具有坚实的数学基础,受到更严格的科学思维训练;.
4.2掌握的统计数据。的基本理论,基本知识,基本方法和计算机技能;有收集的数据,以设计问卷调查数据和处理的基本能力;.
4.3了解社会经济统计数据,医学统计学,生物统计学统计或行业相关的自然科学基础知识,社会科学,工程和技术的领域,具有统计学理论的应用分析和解决在初始容量领域的实际问题;.
4.4了解统计理论的发展和前景,方法;.
4.5理学士,应该能够熟练使用各种统计软件包,有较强的统计计算能力;经济学学士,应该有一个坚实的经济基础,熟悉国家经济发展的方针,政策和统计法律,法规,并进行利用信息和管理的综合分析能力;.
4.6主数据查询,文献检索及运用现代信息技术获取相关信息的基本方法;有一定的科学研究和实际工作能力。
的数学,统计学,经济学,管理学
6.主要课程数学基础课(分析,代数,几何),概率论,数理统计5.主科目,运筹学基于计算机的,随机过程,而实用回归分析,时间序列分析,多变量统计分析,采样,非参数统计,根据应用方向的统计预测和决策和风险管理,以及选择的基本课程(例如作为经济统计方向选择的社会调查方法,经济和社会统计,国民经济核算,会计等)
中国编辑本段|回到顶部7.主要实践性教学环节
包括学术论文,社会调查,生产实习,毕业论文,1020周的总体安排。 点击看详细8.相近专业与应用数学,信息与计算科学