统计学是一门抽象难懂的学科,非统计学专业毕业人员一般很难做到精通。下文是我为大家整理的关于统计类论文投稿的范文,欢迎大家阅读参考!
医学统计学方法应用的错误解析
一、引 言
医学由于其研究的复杂性和系统性,常需要应用严谨的统计学方法,由于有些作者对医学科研的统计学理论和方法的应用缺乏深刻了解,在医学论文中错误应用统计学方法的现象时有发生。统计学方法应用的错误直接导致统计结果的错误。例如统计学图表、统计学指标、统计学的显著性检验等。因此,正确应用统计学方法,并将所获得的结果进行正确的描述有助于单篇论著的质量提高,现将医学论文中统计学方法应用及其常见结果的错误解析如下。
二、医学论文统计学方法应用概况
医学论文的摘要是全文的高度浓缩[1],主要由目的、方法、结果、结论组成。一般要求要写明主要的统计学方法、统计学研究结果和P值。一篇医学论文的质量往往通过摘要的统计学结果部分就能判断。统计学方法的选择和结果的表达直接影响单篇论著的科研水平。
(一)材料与方法部分
正文中,材料与方法部分必须对统计学方法的选择、应用、统计学显著性的设定进行明确说明。通过对统计学方法的描述,读者应该清楚论著的统计学设计思路。材料部分要清楚说明样本或病例的来源、入组和排除标准、样本量大小、研究组和对照组的设定条件、回顾性或者前瞻性研究、调查或者实验性研究、其他与研究有关的一般资料情况,其目的是表明统计学方法应用的合理性和可靠性,他人作相关研究时具备可重复性。方法部分应详细叙述研究组和对照组的不同处理过程、观察的具体指标、采用的测量技术,要具备可比较性和科学性,
方法部分还要专门介绍统计分析方法及其采用的统计软件。不同的数据处理要采用不同的方法,必须清楚的说明计数或者计量资料、两组或者多组比较、不同处理因素的关联性研究。常用的有两组间计量资料的t检验,多组间计量资料的F检验,计数资料的卡方检验,不同因素之间的相关分析和回归分析。有些遗传学研究方法还有专门的统计学方法,要在这里简要说明并给出参考文献,还要简单叙述统计方法的原理。统计学软件要清楚的说明软件的名称和版本号,如基于家系资料研究的版本。
(二)论文结果部分
论文结果部分要显示应用统计学方法得到的统计量[2],所采用的统计学指标较多时,往往分开叙述。分组比较多时还要借助统计图表来准确表达统计结果。对于数据的精确度,除了与测量仪器的精密程度有关外,还与样本本身的均数有关,所得值的单位一般采用紧邻均数除以三为原则。均数和标准差的有效位数要和原始数据一致。标准差或标准误差有时需要增加一个位数,百分比一般保留一个小数。在统计软件中,分析结果往往精确度比较高,一般要采用四舍五入的方法使其靠近实验的实际情况,否则还会降低论文的可信度和可读性。
结果部分的统计表采用统一的“三线”表,表题中要注明均数、标准差等数据类型。表格中的数值要按照行和列进行顺序放置,要求整齐美观,不能出现错行现象。要明确标注观察的例数,得到的检验统计量。统计图可以直观的表达研究结果,如回归和相关分析的散点图可以显示个体值的散布情况。曲线图表达个体均值在不同组别随时间变化的情况或者不同条件下重复测量的结果。误差条图由均数加减标准误绘出,描述的是67%的置信区间,不是95%,提倡在误差条图采用95%的置信区间。
关于统计量,一般采用均数与标准差两个指标,均数不宜单独使用。使用均数的时候要明确变异指标标准差或者精确性指标标准误。关于百分比,分母的确定必须要符合逻辑,过小的样本会导致分母过小而出现百分比过大的情况。百分率的比较要写清两者中不同的变化,可以采用卡方检验。
1.假设检验的结果中,常见只写P值的情况,有时候会误导读者,也会隐藏计算失误的情况,因此写出具体的统计值,如F值、t值,可以增强可信度。对于率、相关系数、均数这类描述统计量,要清楚写明进行过统计学检验并将结果列出。P值一般取与作为检验显著性,对于结果的计算要求具体的P值,如P=或P=。
2.在对论文进行讨论时,作为统计学方法产生的结果往往要作为作者的主要观点支持其科学假设,对统计结果的正确解释至关重要。P值很大表明两组间没有差别属于大概率事件,P值很小表明两组间没有差别的概率很小。当P<,表明差异具有统计学意义。P值与观察的样本量的大小有关联,当样本量小的时候,数据之间的差别即使很大,P值也可能很大;当样本量大时,数据之间的差别即使很小,P值也可能显示有显著性差异。相关系数统计学意义的显著性也与相关系数的大小没有绝对的关联,有统计学意义的样本相关系数可能很小。因此,有统计学差异的描述并不一定意味着两组间差别很大,错判的危险性很大,显著性的检验为定性的结果,结合统计量大小方可判断是否具有专业意义。
变量间虚假的相关关系与变量随时间变化而变化相关,统计学意义的关联并不表示变量间一定存在因果关系。因果关系的确定要根据专业知识和采用的研究方法的不同来考量。使用回归方程进行分析,当两变量间具有显著性关系,但是从自变量推测因变量仍然不会很精确。相关或回归系数不能预测推测结果的精确程度,而只是预测一个可信区间。诊断性检验应用于人群发病率很低的疾病,灵敏度、特异度的高低对于明确疾病诊断并不能很肯定。“假阳性率”与“假阴性率”根据实际的需要不同要求并不一致,在疾病患病率很低时,出现假阳性也是正常的,要确诊疾病必须要与临床症状体征相结合。因此,这两个率的计算方法必须交待清楚。
三、医学论文统计学方法应用的常见错误分析
(一)“材料与方法”中的统计学方法应用的常见错误
“材料与方法”中统计学方法常见的问题主要为:对样本的选择或者研究对象的来源和分组描述很少或者过于简单。例如,临床入组病例分组只采用简单的随机分组,未描述随机分组的方法,未描述是否双盲双模拟,未设置空白对照组,分组后对性别、年龄、文化程度的描述未进行统计学检验,对于特殊的统计学方法没有详细交代;动物实验分组的随机化原则描述过于简单,没有具体说清完全随机、配对或分层随机分组等;统计分析方法没有任何说明采用的分析软件,有的只说明采用的分析软件而不交代在软件中采用的统计方法;没有说明原因的情况下出现样本量过于小等情况。
(二)“结果”统计学方法应用的常见错误
1.应用正确的统计学方法出现的结果表达并不一定正确。例如前文所述数据的精确度要求。医学论文常见错误中包括均数、标准差、标准误等统计学指标与原始数据应保留的小数位数不同;对于率、例数、比值、比值比、相对危险度等统计学指标保留的小数点位数过多;罕见疾病的发病率、患病率、现患率等指标没有选择好基数,导致结果没有整数位;相关系数、回归系数等指标保留的小数位数过多或者过少;常用的一些检验统计量,如F值、t值保留的位数不符合要求。
2.对统计学指标进行分析和计算时,一般采用计数资料和计量资料进行区分。计量资料常用三线表,在近似服从正态分布的前提下采用均数、标准差进行说明,如果不符合正态分布时,可以采用加对数或其他的处理方式使其近似正态分布,否则只能采用中位数和四分位数间距等指标进行描述。医学论文中常见未对数据进行正态分布检验的计算,影响统计结果的真实性和可信度。对于率、构成比等常用的计数资料指标,常见样本量过小的问题,采用率进行描述会影响统计结果的可靠性,采用绝对数进行说明会显得客观一些。还有一些文献将构成比误用为率,也是不可取的。
3.在判断临床疗效之一指标时,两组平均疗效有差别并不意味着两组的每一个个体都有效或无效,必须通过计算有效率进行计算。如比较某药物治疗糖尿病的疗效,服药一周后,研究组和对照组的对血糖降低值分别为 ± 和 ± ( P = 1) 。按空腹血糖值低于的疗效判定有效率,研究组和对照组的有效率分别为和 ,尽管平均疗效相差较多,但也要注意到该药物对部分患者无效()。对假设检验结果的统计学分析结果,P 值的表达提倡报告精确P值,如P = 或P = 等。目前的统计学分析软件均可自动计算精确的P 值。例如常用的SAS,SPSS等,只要提供原始数据,就可以计算出t值、F值和相应的自由度,并可获得精确的P值。
四、小 结
提高医学论文中统计学方法的使用质量是编辑部值得重视的一项长期而又艰巨的工作[3],医学论文中统计方法应用和统计结果的表达正确与否,不仅体现了论文的科学性和严谨性,而且对于提高期刊整体的学术质量,促进医学科学的发展和传播也有着重要作用[4]。
参考文献:
[1] 李敬文,吕相征,薛爱华.医学期刊评论性文章摘要的添加对期刊被引频次的影响[J].编辑学报,2011(23).
[2] 陈长生.生物医学论文中统计结果的表达及解释[J].细胞与分子免疫学杂志,2008(24).
[3] 潘明志.新时期复合型医学科技期刊编辑应具备的素质和能力[J].中国科技期刊研究,2011 (22).
统计学专业毕业现状分析与对策研究
本科毕业论文是高等学校人才培养计划的重要组成部分,是本科教学过程中最后一个重要的教学实践环节,是学士学位授予的一个重要依据。[1,2]然而,相较于其他教学环节,毕业论文没有受到足够的重视,从而导致该环节存在着一些问题。[3]本文将以中央民族大学统计学专业毕业论文为例,在分析其现状的基础上,找到问题并提出相应的建议。
中央民族大学统计学本科专业设置于2003年,目前已有六届毕业生。经过学院和学校层面的努力,统计学专业作为新办专业取得了较快发展,所培养的学生具有较好的专业能力和综合素质,近四成学生继续读研深造,就业的学生大都在专业对口的工作岗位上,就业率一直在85%左右。
本科毕业论文环节在培养方案中是6个学分。学生在第七学期开始选择指导教师以确定毕业论文题目。经过前6个学期的系统理论学习,统计学专业学生已基本掌握了统计学的基础理论和基本方法,具备了正确的统计思想和较强的统计软件应用能力,以及运用所学的理论和方法解决实际问题、文献检索和资料查询等综合能力。本科毕业论文的写作就是统计学专业学生将上述基础和能力进一步深化与升华的重要过程,从而培养学生的创新能力和实践能力,使学生的知识、技能和素质得到进一步的充实和提高,同时也是衡量学校教学质量和办学水平的重要指标。因此对如何提高毕业论文质量进行研究是必要和有意义的。[4]
一、统计学专业毕业论文质量的现状分析
从论文完成情况来看,每届的毕业论文基本都能达到论文教学环节的要求,通过对中央民族大学统计学专业2007~2011年四届毕业生的毕业论文进行分析,发现毕业论文及格率为。
从毕业论文研究的类型来看,主要分为两大类:理论研究型论文和实证型论文,理论研究型论文表现为总结和论述现有统计理论问题,表述理论研究的成果,或应用理论对现实问题进行分析、说明,并提出自己的思考;实证型论文主要表现为针对某一特定的实际目的或目标,运用所学统计的理论和方法,对经济、管理、金融、医学、生物、工程、环境等领域进行统计调查、统计信息管理、数量分析等。
从论文知识点范围的分析来看,学生论文绝大多数是统计专业问题,极少数是其他数学分支的问题。从中央民族大学历届统计学专业学生的毕业论文情况分析,发现毕业论文中研究其他数学分支的问题占总数的,主要包括:一是其他科目的应用研究(数学分析、常微分方程、运筹学及空间解析几何等),占总数的。二是数学专业教育和数学思维的研究,占总数的。研究统计学专业问题的毕业论文占绝大部分,比例为,选题内容广泛且多为社会热点问题,涉及经济、社会、医疗卫生、教育发展、旅游、基础设施建设等多领域,由于受学校人文环境影响,很大比例的学生对少数民族地区的经济、社会、民生等问题进行了统计分析,约占总学生人数的。所使用的分析方法主要集中于抽样调查、回归分析、多元统计方法、聚类分析、判别分析等常用统计方法。
此外,统计分析显示学生成绩普遍偏高,统计学专业学生的毕业论文,尤其是实证类论文,存在着可以大量使用背景介绍和统计软件分析结果的特点,因此,一些论文没有创新性和学术含量,但具有较大的篇幅,与理学院其他专业的毕业论文成绩比较,其平均成绩相对较高,约分。
二、统计学专业毕业论文存在的问题
毕业论文的质量问题关系到本科人才的培养规格和目标,直接体现了学生本科阶段的学习成果,是衡量教学水平、学生毕业与学位资格认证的重要依据。通过对论文和考评结果的具体分析,发现学生的毕业论文在创新性、理论深度及论文写作常识多方面存在问题。具体表现为:
1.创新性不够
学生的毕业论文表现为理论性研究非常少,大都是实证型论文,并且多是简单的统计方法应用,缺少创新性研究和思考。从中央民族大学历届统计学专业学生的毕业论文来看,理论研究型论文只占,与实证型论文的比例为1︰,比例悬殊,体现了学生在毕业论文大的选题过程中,避重就轻,缺乏创新的特点。如每年都有一定数量的学生选择“我国人均GDP的预测”这类针对某经济指标进行预测的题目,论文的主要内容就是利用ARMA、灰色预测或者趋势外推方法等一种或多种方法对时间序列数据做简单建模和分析,论文没有对指标本身的意义以及国内国际的社会经济形势进行综合分析。这种方法简单套用性质的论文占有很大的比重。
2.选题过大、内容空泛,缺乏深入研究,存在抄袭、拼凑现象
有些学生在选择研究课题时,往往不能根据自身的专业知识结构特点和社会实践情况进行准确定位,只是一味的盲目的选择一些过大过空的社会热点问题,因此难以看到所要研究的问题的本质。如有的学生针对CPI做研究,没有深入了解问题的实质,只是收集了一些文献,很难提出自己的观点或研究角度,造成了材料堆积且过于散乱,论文变成了一些材料的简单拼凑。有些论文针对某一社会经济问题进行研究,论文的主题只是针对现有数据利用简单的统计方法进行分析,对数据的质量和可靠性以及方法的适用性不做针对性讨论,对所得的结论也不结合社会经济现实情况进行分析,导致论文质量不高。
3.相对前沿的分析方法利用较少
前沿的分析方法利用较少,通过毕业 论文的 写作, 统计分析能力没有实质性提升。学生论文使用的统计方法主要集中于回归分析、聚类分析、判别分析、相关性分析等,其中回归分析方法占有非常大的比例,约,其他各统计方法使用的比例分别为:聚类分析为,判别分析为,相关性分析为,多元统计方法为,时间序列分析为,极少有学生使用教科书外的相对前沿的分析方法。
4.论文写作上存在结构不合理、没有相关研究介绍、创新点表述不清、参考文献不会正确标注等问题
从学生的毕业论文来看,论文写作不规范,专业性差。主要存在论文形式不规范、结构不合理、题目含糊、有些论文杂乱无章、口语化严重、可读性差等问题。
三、存在问题的原因分析
针对上述问题,统计学系通过对论文进行详细审查以及 组织指导教师和学生座谈,发现毕业论文出现以上问题的主要原因包括以下几方面:
1.学生对论文不够重视
部分学生由于忙于考研学习而无暇顾及毕业论文的研究,还有部分学生由于忙于外出找 工作、 实习而无心认真撰写论文。论文撰写所需的必要时间难以得到保障,因此学生应付了事,从而无法保证论文的深度。此外,还有部分学生认为毕业论文只是一个教学环节,与考研的好坏无关,存在只要写了论文,教师都会让自己通过的侥幸 心理,在思想上没有引起足够的重视。
2.缺乏指导教师的针对性指导
指导教师所带毕业生人数过多,使得导师的工作量呈现超负荷状态,无法保证每个学生毕业论文的质量,从而致使部分学生的论文规范性较差,没有对存在的问题反复修改,使得学生论文存在诸多问题。
3.学生的专业训练还不够
大部分本科生没有经历过论文的写作训练,写作水平较低,不了解学术论文的规范性及其格式,不知如何从科研的角度构思文章、组织材料、安排结构,使得相当一部分学生的毕业论文表达的观点不够准确清楚,论据亦不能很好地支持论点。另外,一些同学为了完成任务,直接将在 网络中搜索到的资料不假思索的拼凑在一起,使得内容不成体系,观点混乱。
四、提高毕业论文质量的建议和 实践
1.加强毕业论文重要性的宣传,提高学生的重视度
加强对毕业论文重要性的认识有助于提高本科生毕业论文的质量。通过讲座、课堂传授等形式,让学生意识到毕业论文的实践性和综合性是任何教学环节都不能替代的,是提高发现问题、分析问题、解决问题能力的有效途径,更是进行个人综合素质提高的必不可少的重要环节,[4]从而使学生在思想上认识到毕业论文的重要性,投入更多精力进行毕业论文设计。
2.选题和教师的科研项目相结合,提高论文的创新性
在选择课题时,为了能充分发挥学生的主观能动性,可以让学生根据自身的特点,与指导教师协商,结合导师的研究方向制定课题方案。统计学专业的教师一般除了 申请国家自然科学基金和国家 社会科学基金这类对理论性和创新性要求较高的项目以外,很多教师还主持或参加有相应的 应用研究类项目。应用类项目大都需要实地调研(以及问卷涉及和数据分析)或者大量的数据分析和建模。引导学生参加这类项目来设计和完成自己的本科毕业论文,能够激发学生的科研热情和创新潜力。此外,鼓励和引导一些成绩较好,如让具备保研资格的学生参加教师的科研讨论班或者课题组,选择一些具有一定难度的理论问题进行研究,可以使学生了解本学科的 发展方向和最新动态。最近两年,越来越多的学生,特别是具备了保研资格的学生,在大四上学期就能投入到项目和毕业论文的写作中。
3.重视平时实践教学环节,培养学生的实践能力、发现问题以及解决问题的能力
为了提高学生的学习兴趣以及对问题的分析、解决能力,广泛开展了丰富多彩的社会实践活动,使学生尽可能早地接触与本专业有关的实际工作,切身 体会到如何将理论与实际相结合,了解本学科的实际业务,从而提高自主学习能力,加强专业知识的把握。结合学校的实际情况,积极鼓励学生在大二和大三阶段参加校级和国家级的全国大学生数学建模竞赛,申请“中央民族大学本科生研究训练 计划项目”、“北京市大学生科学研究计划项目”和“国家大学生创新性试验计划项目”。项目的申请和实施以及研究 报告的写作,对学生来说都是一个很好的锻炼。目前,统计学专业本科生的参与率在70%以上。此外,建立专业实习基地可以提高学生利用专业知识分析和解决实际问题的能力。这些环节的设计和实施都有力地保障了学生本科毕业论文的水平和质量。
4.加强学生科技论文写作训练
加强平时课堂上大作业的规范化,潜移默化培养学生科技论文的写作能力。通过平时的实践活动,如学生数学建模以及大学生创新实践等各类实践性项目来提高学生的 论文 写作能力。
5.实施激励措施,激发学生的兴趣和主动性
针对那些参与实际课题的学生,学院鼓励指导教师根据学生的完成情况以劳务费的形式给予其奖励,另外积极鼓励毕业论文质量优秀的学生进行投稿 发表。此外,还需对答辩程序和评分标准进行规范化,建立优秀毕业论文指导教师和优秀毕业论文奖励制度,以形成积极的导向作用,充分调动指导教师和学生的积极性。
6.加强教师责任心,建立完善的机制
加强学生毕业论文的过程 管理,从开题到中期检查严格执行,指导教师严格把关。为了保证学生与教师之间的沟通,学校可以通过建立师生信息反馈机制改善师生分离状态,为师生提供便利的沟通渠道,同时设置适当的教师激励制度,中央民族大学目前对教师指导本科毕业论文有额外的课时补贴。
统计方法在企业中的实践研究论文
【摘要】统计方法在企业发展史上占有重要地位。文章分析了企业对统计方法的应用需求,并就如何提高其在企业经营有效实施进行了探讨。
【关键词】统计方法;实践应用;应用需求
20世纪80年代,美国通用、福特和施乐等大公司,开始在市场分析、产品开发与设计、工艺设计、生产控制与营销策略方面应用统计技术,结果使得其产品成本下降,产品质量和市场占有率提高,给公司带来非常好的经济效益。90年代后,美国波音公司调整其质量管理政策,其重要方面是增加统计控制方法和以质量改进为核心的管理概念。
一、企业对统计方法的应用需求
(一)统计方法的作用
在偶然中寻求必然是应用统计技术的核心。所谓统计技术,就是通过有效收集、整理与产品质量有关的数据信息,运用数理统计推断的原理,以部分(样本)推测全体(总体)的特性。通过测量、描述、分析产品特性的变化,形成数学模型,从而对产品过程进行监控,对质量变异提前预防,为降低产品缺陷和预防不合格的产生,特别是为质量改进指明方向。
正如恩格斯所说,任何偶然性存在的场合,都受客观规律所支配,问题是如何发现并利用这些规律。统计方法作为一种为决策提供依据的工具,可以帮助企业进行数据分析,了解产品质量状态的分布情况,找出问题、缺陷及原因,有针对性地采取措施,提高产品和服务的质量。原始数据不经过整理和分析,只是一堆“资料”,而有用的信息往往蕴藏在大量的数据之中,所以数据的应用是统计技术的前提,统计技术是整理和分析数据的工具。
统计方法可应用在设计阶段的市场预测、可行性分析、方案设计、初试样试制、小批量生产等;应用在生产阶段的工艺设计、过程控制、能力研究和质量改进;应用在销售阶段的营销策略研究、预期销售额的测算、顾客回报率的评价、安全性评价和风险分析等。统计过程控制(SPC)是进行质量分析、质量控制和质量改进的科学方法。可以说,企业持续的产品生命周期的改进,是通过实施SPC得以实现的。
应该指出,统计方法是一种能使企业管理体系增值的资源,它是一种素质和思维方法。统计技术是一种投资少、简单易行、挖掘企业潜力、提高企业经济效益的技术。统计方法可应用在产品生命周期的所有阶段,应用的越早越有效。SPC能对产品生命周期的各个阶段进行监控、判断质量变异并及时告警。在控制和验证过程能力和产品特性时,统计方法的使用能起到帮助过程改进、向决策程序提供输入的重要作用。如果企业能认真地实施统计技术,而不是应付差事,就一定会给企业带来效益,从而避免徒劳无益。
(二)企业对统计方法的应用需求
企业应用统计方法有两个前提:一是在管理体系中明确统计方法应用的地位和指导作用,在其运行过程中必须有统计技术的要素;二是实施统计技术的程序必须具有可操作性,而不是一个道具。企业统计方法的应用需求主要在以下几个方面:
1.与设计开发控制结合。产品质量由设计来保证,设计阶段是产品质量的源头,提高设计质量可使产品质量持续满足其技术要求,并在满足顾客需求方面产生飞跃和创新。实验设计在统计界被誉为“提高设计质量的高速公路”,将正交设计法和均匀设计法交叉使用,可减少实验次数,降低实验成本。
2.与生产过程控制结合。重点是在特殊过程、关键过程的主要工艺参数和质量指标中应用统计方法。统计方法在控制和验证过程能力和产品特性时,有助于过程改进。控制图可用来监控生产过程,假设检验可用来验证工艺装备的有效程度。http://
3.与检验过程控制结合。产品实物质量的提高是质量管理的有效标志之一,抽样方法体现了检验过程控制的有效程度。
4.与纠正、改进和预防措施结合。统计方法应用的核心在于分析、判断和推测。企业质量管理体系的运行强调质量改进,统计技术对产品过程进行特殊分析的结果,可作为过程改进和决策程序的输入,从而形成产品故障报告、分析、纠正措施系统(FRACAS)的闭环管理。
二、统计方法在企业中的实践应用
(一)概率论分析方法在企业中的实践应用
在市场经济条件下,商业企业的经营和销售情况一般不是由经营者主观愿望所决定,完全是个随机过程。它包括很多不可控的具体问题:如在某单位时间内有多少位顾客光顾该商场;在已经进入该商场的顾客中又有多少人真正实施购物行为;每位顾客在这次购物活动中总共购买多少货币的商品等问题,需要用概率论分析方法来解决。因此,概率论在商业企业中有广泛的应用。这里重点选择商业企业面临的几类典型的问题来说明其应用。
1.进货问题。例如,某商场每星期四进货,以备星期五、六、日三天销售,根据多周统计,这三天的销售数量彼此独立且分布已知。则三天销售总量这个随机变量可以取哪些值可利用概率论知识来解决。同样可解决如果进货X件,不够卖的概率及进货Y件够卖的概率。
2.资源配置问题。例如,某商场一个柜台有四名售货员,每名售货员平均一小时内只用秤15分钟,则该店配置几台称较为合理,可以利用随机变量服从二项分布、事件的独立性及小概率原理来解决资源配置问题。
3.利润问题。例如,某商业企业经销某一种商品,每周进货量X与顾客对该商品的需求量Y是两个相互独立的随机变量,且都服从区间[10,20]上的均匀分布。商店每售出一单位商品可得利润1000元;若需求量超过进货量,该商业企业可从其他商业企业调货供应,这时每单位商品获利5000元,则计算此商品经销商经销该种商品每周所获得的平均利润,就需要通过计算连续型二元随机变量的数学期望来解决。
(二)数理统计分析方法在企业中的实践应用
数理统计分析方法同样在商业企业中有着广泛的应用。因此,这里也重点选择商业企业面临的几类典型的问题来说明其应用。
1.产品市场占有率问题。例如,某市四家大型电器商场的手机销售情况抽样表明,在一周内总计销售了2000部的手机,其中某品牌手机占214部,则可用数理统计中的参数区间估计理论与方法,以95%的把握程度判断出该品牌手机的市场占有率在~之间。
2.调整措施效果的显著性问题。例如,某超市为增加销售,对销售方式、管理人员等进行了一系列调整,调整后随机抽查了9天的日销售额,计算的平均日销售额为60万元。根据统计,调整前平均日销售额为52万元,假定日销售额服从正态分布,则调整措施效果是否显著,不能直观地认为调整后日销售额达到60万元措施就显著,而是需要用假设检验的思想和方法来做进一步的判断。
3.产品的质量检验问题。例如,某市质检局接到投诉后,对某金商销售的产品进行质量调查。先从其出售标志18K的项链中抽出9件进行检查,检验标准值是18K,且标准差不得超过。检验结果为9件项链的平均值为17,方差为,假定项链的含金量服从正态分布,则检测结果能否认定金商出售的产品存在质量问题,同样也需要用假设检验的思想和方法来做判断。
三、如何提高企业实施统计方法的有效性
美国质量专家朱兰博士在《质量控制手册》中专门阐述了统计方法,并列举了十八种最基本的统计技术。国际标准ISO/TR10017和ISO/TR13425作为统计方法与统计技术的使用指南,阐述了企业实施统计方法的基本要求。
企业在直接控制产品实物质量上,可应用以下四种统计技术:1.频数图(直方图),它可大体显示质量特性的平均值、分散程度以及规格要求的比较状态;2.控制图,它可用作过程(工序)的分析、调整和控制;3.抽样验收方案;4.公差分析、回归分析和方差分析,这些方法从数理统计原理出发,可用于工程设计和工序质量的特性分析。
一般来说,人们比较重视事物间的确定关系,不太注意事物间的不确定关系(相关关系),从而使我们失掉了很多改进机会。企业应用统计技术的地方很多,凡有数据的地方都能应用,包括一些定性的结果经两次量化后也能应用。但企业要真正使统计方法的应用切实有效,应注意以下几个方面:
1.好的管理基础是关键。统计方法的应用是一项系统工程,一个管理基础差的企业,统计方法的应用只能流于形式。对于科研院所的产品,一般包括研究报告、试验报告、硬件或流程性材料。研究所的科研项目都有预定的研究周期,由项目课题组承担,研究室是有一定专业范围的常设机构。在科研过程中,如何应用统计方法,应由项目课题组根据需求来确定,不能强求一致。
2.企业应用统计方法的组织保证。统计方法贯穿企业质量管理的`全过程,应列入企业发展的总体规划,并由质量综合管理部门归口,具体统计技术的应用可由质量管理部门会同相关职能部门组织实施。
3.提高统计方法培训的有效性首先要开展统计方法应用的意识教育,然后针对产品的实际需求开展专题教育培训。如果认识上有偏差,容易造成误用、错用或形式主义。将培训计划列入教育计划,将其考核作为企业质量管理,特别是内部质量审核的关键项目之一非常必要。要通过培训,使员工树立正确的统计思想,认识到统计方法的生命所在。波动存在于任何过程,波动存在于万物之中,波动的原因有正常原因和异常原因,正常原因完全可以控制在一定的波动范围内。理解并区分正常原因和异常原因,将有助于正确认识产品的质量存在适当公差和允许公差是合理的和必要的,通过人、机、料、法、环的质量控制,来实现质量的稳定是完全可能的,这一思想也是不断改进产品质量的理论基础。一种统计技术在企业一经选用,即要求应用人员掌握正确的使用方法,包括数据收集、数据处理、统计结果评价以及正确使用统计结果等。
4.统计方法的应用必须注重产品分析和使用条件,应用统计方法不是孤立的行为,更不能随便套用,或为了使用而使用。一定要将统计方法融入到确定、控制、验证过程能力、产品特性以及市场调研等分析活动中去。
5.企业应用统计方法的基础是质量记录的真实性。产品过程分析的基础是质量信息和数据的真实可靠。如果输入的基础数据不正确,将导致数据结果发生偏差,再好的统计方法也无从谈起,毋须赘言,统计方法的应用与质量记录的真实性息息相关。
6.有计划地进行统计技术的推广和验证,面对众多的统计方法,企业首先应选择与解决“关键问题”或控制“关键特性”有关的统计技术作为试点和推广的重点,并按实施过程的轻重缓急程度,制定一份推广统计技术的计划。该计划应取得最高管理者的支持和承诺,动员全员参与和获得必要的工程和技术资源。
四、结语
企业统计方法的应用必须坚持以事实为依据、用数据说话的原则,把统计技术的应用与专业技术紧密结合,在考虑统计项目实施时,应从理论和事实层面上注重分析和使用条件,认真权衡各种关联因素。
如果企业没有按照质量管理体系中统计技术要素的要求,进行全员正规化的、有重点的统计方法的培训,没有使质量管理体系中的统计技术要素按照程序文件有效地运行,则说明企业在质量管理的重要环节上处于失控状态,同时也说明企业的质量管理体系在适应性和有效性上存在着很大问题。
在提倡科学化管理的今天,无论是管理决策还是质量监督,统计学方法在其中的作用都应得到足够的重视。
【参考文献】
[1]傅治梁.分析诊断企业产品实力的统计方法[J].统计与决策,2000,(7).
[2]唐兆霞.论统计方法在企业组合证券投资中的应用[J].黑龙江财专学报,2003.
[3]龙永红.概率论与数理统计[M].高等教育出版社,2003.
[4]刘振江.工程质量控制的统计分析方法[J].黑龙江交通科技,2006,(8).
统计学是一门实质性的社会科学,既研究社会生活的客观规律,也研究统计方法。下文是我为大家整理的关于统计相关论文的范文,欢迎大家阅读参考!
浅谈概率在统计学中的应用
摘 要:概率是研究随机现象的数学学科,其理论严谨、 应用广泛、 发展迅速。目前,概率的理论与方法已广泛应用于 统计学中,主要是从正态分布、小概率事件两方面介绍了概率在统计学中的一些应用。
关键词:随机现象;事件;样本;母体;正态分布;小概率原理
统计学主要分为描述性统计学和推断性统计学。给定一组数据统计学可以摘要并且描述这些数据,这个用法称为描述性统计学。另外,观察者以数据的形式建立起一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称为应用统计学。另外,还有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。
同一仪器多次测量同一物体的重量,所得的结果彼此总是略有差异,这是由于诸如测量仪器受大气影响,观察者身体或 心理上的变化等等偶然因素引起的。同样的,同一门炮向同一目标发射多发同种炮弹,弹落点也不一样,因为炮弹制造时的种种偶然因素对炮弹质量也会有影响。此外,炮筒位置的误差,天气条件的微小变化等等都影响弹落点。再如从某生产线上用同一种工艺生产出来的灯泡寿命也是有差异的等等。
总之所举这些现象的一个共同点是:在基本条件不变的情况下,经过一系列试验或观察会得到不同的结果。换句话说,就个别的试验结果或观察结果而言,它会时而出现这种结果,时而出现那种结果,呈现出一种偶然性。这种现象称为随机现象。对于随机现象通常关心的是在试验或观察中某个结果是否出现,这种结果称为随机事件,简称事件。为了实际的理由选择研究团体的子集代替研究母体的每一笔资料,这个子集称作样本。推论统计学被用来将资料中的数据模型化,计算它的几率并且做出对于母体的推论,这个推论可能以对或错的答案呈现(假设检验)出对未来观察的预测,关联性的预测,或是将关系模式化(回归)。
随机现象有其偶然性的一面,也有其必然性的一面。这种必然性表现为大量试验中随机事件出现的频率的稳定性,即一个随机事件的频率常在某个固定的常数附近摆动,这种规律我们称之为统计规律性。频率的稳定性说明随机事件发生的可能性的大小是随机事件本身所固有的,不随人们的意志而改变的一种客观属性,因此可以对它进行度量。对于一个随机事件A用一个数p(A)来表示该事件发生的可能性的大小,这个数p(A)就称为随机事件A的概率,因此概率度量了随机事件发生的可能性的大小。
如果样本足以代表母体,那么由样本所做的推论和结论可以引申到整个母体之上,统计学提供了许多方法来估计和修正样本资料过程中的随机性(误差)。要了解随机性的一定几率必须具备基本的数学观念。数理统计是应用数学的分支,它使用几率论来分析并且验证统计的理论基础。
概率在统计学中有着重要的作用,包括总体、抽样研究、统计描述、统计推断、正态分布规律等,正态分布是概率中最重要的一种分布。一方面正态分布是自然界最常见的一种分布,例如测量的误差;炮弹弹落点的分布;人的生理特征的尺寸:身长、体重等;农作物的收获量;工厂产品的尺寸:直径、长度、宽度、高度,都近似服从正态分布。
一般来说若影响某一个数量指标的随机因素很多,而每个因素所起的作用又不太大,则服从正态分布这点可以用概率论的极限定理来加以证明。另一方面正态分布具有许多良好的性质,许多分布可用正态分布来近似,另外一些分布又可由正态分布来导出,因此在理论研究中,正态分布十分重要。如利用正态分布规律统计学校的成绩分布,得出一个阶段的学生总体是否进步,然后寻找原因,得出改进办法。分析一年 经济的发展,预测来年的收入。找出影响发展的主要因素,寻求改进的方法等等。
小概率事件即发生概率很小的事件(p≤),在统计学中有着重要的应用,这样的事件理论上发生的可能性则几乎为零。如买彩票中大奖,就是典型的小概率事件,也许每一期均会有大奖开出(可能性很小),但对于每一个彩民来说,他买一注中大奖的可能性(小概率事件在一次试验中就发生的概率几乎没有。其实,这就是小概率事件在统计学上应用的重要理论依据——小概率原理。)即小概率事件在一次试验中发生的可能性很小,如果真的发生了,根据统计学可怀疑其真实性。
如某接待站在一天内共接待5人单独来访,结果这5人全在周一到访,由此能否推断接待站有规定的接待日?假定没有规定的接待日,一个来访者在五天中任何一天来访都是等可能的用Am(m=1,2,3,4,5,)表示“一周接待了m个人,全都是周一来访”事件,Am的概率如下表示:
事件 A1概率 事件 A2概率
事件 A3概率 事件 A4概率
事件 A5概率
5个人都在周一来访的概率为,大约万分之三。现在概率很小的事件在一次试验中发生了,于是怀疑假定的正确性,从而推断接待站有规定的接待日。
公元1814年,拉普拉斯在他的新作中,记载了一个有趣的统计,世界上男婴与女婴的出生比值是22∶21,即在出生的婴儿中,男婴占,女婴占,可奇怪的是1745-1784年四十年间统计巴黎男婴的出生率时,却得到另一个比是25∶24,男婴占,与前者相差,对于这千分之一点八的微小差异,进行调查研究,发现巴黎人有“重女轻男”的现象,有抛弃男婴的陋习,以至于歪曲了出生率,经过修正出生比依然是22∶21。统计学依据小概率原理作出结论的正确性很高,但也存在犯错误的风险(较低)。
小概率原理在统计上有着非常重要的应用。如假设检验结论的判断,假设检验是用样本信息推测总体的一种统计推断方法,由于抽样误差的存在,样本信息和总体特征间可能不尽相同,所以假设检验实际上就是判断待比较各方的差别是不是由抽样误差造成的。假设检验中p值的大小反映的就是差别由抽样误差造成的概率。在假设检验中就是通过比较p值与检验水准a(通常设为)的大小关系,从而做出差别有无统计学意义。
如果p值小于a统计学则认为差别由抽样误差造成的概率很低,那么根据小概率原理认为,小概率事件在一次抽样中就发生的可能性几乎为零,所以判定差别可能是由于比较各方在本质上的不同导致的。否则认为差别是由抽样误差造成的。在这里检验水准是在假设检验前认为设定的,是研究者能够承受的本次假设检验放弃真错误的概率,也可以理解为是研究者设立的小概率事件的概率。而p值则是通过计算,即在检验假设成立的情况下,差别是由抽样误差造成的概率。
统计在现代化 管理和 社会生活中的地位日益重要,随着社会经济和科学技术的发展统计在现代化国家管理和企业管理中的地位越来越重要,人们的日常生活都离不开统计,统计的影响是这样巨大,故与之密切相关的概率的作用也越来越重要。
浅谈统计学基础教学方法与学生应用能力的培养
摘要:统计学基础知识是一门研究数据的技术性学科,具有综合性,抽象性及应用面广等特点,通过该课程的教学能培养学生运用统计工具,系统的分析问题和解决问题的能力。在中职教学中需结合本学科的特点,不断改进教学方法,提高学生综合应用统计知识的能力。
关键词:统计学教学方法设计能力培养
统计学基础知识是一门研究数据的技术性学科,学科内容中的调查研究和分析处理问题的方法,不仅应用于各项工作中,也用于其他学科研究过程中的数据搜集、整理、分析并得出结论。故统计学具有综合性,抽象性,应用面广等特点,通过该课程的教学能培养学生运用统计工具,系统的分析问题和解决问题的能力。现结合本学科的特点探讨其教学方法和学生应用能力的培养。
一、统计学基础课程教学的特点
统计学基础也是社会经济统计学原理,其学科内容的特点:一是基本概念多,理论讲授上较抽象;二是指标类别多,初学时严格划清各种指标内涵难;三是调查分析方法多,正确理解和选择恰当的调查方法难;四是正确的调查方式、方法指标体系的设置,统计范围的界定与是否得出反映事物的正确结论直接相关;五是科学设置调查事物的指标体系又与弄清反映该事物的客观内在本质的相关指标直接相关。因此,对年龄小,分析能力差的中职学生教学对象来讲,即便从概念上掌握了统计学的原理,如果不结合实际的统计案例资料和采用恰当的教学方法,就很难达到正确应用统计知识解决现实社会经济中问题的目的,甚至会因为错误使用方法,得出对事物评判的错误结论。
二、结合本学科知识的特点采用适当的教学方法,增强应用能力的培养
在教学中,首先通过对教材内容体系的全面分析和教学对象知识结构的分析,以及学生对统计学知识学习的兴趣、理解的深度和掌握应用情况的总结,在教学中的不同环节恰当地实施不同的教学方法。
1、通过学科内容体系导入与工作任务联系,提升学生学习兴趣
在讲授本学科内容时,首先给学生介绍统计学基础教材内容的基本框架:统计学的涵义、研究对象、性质、职能和研究的基本方法。其次是介绍学科知识体系:统计学中的基本概念,统计资料调查整理的方式方法,统计数据的显示与提供,以及提供的统计数字资料运用多种指标法进行分析(总量指标法--反映事物的规模状况,平均指标法--反映事物的集中趋势及一般规律,相对指标法--反映事物的纵向横向比较和事物之间的联系,标准差法--反映事物中总体单位标志值之间的离散趋势和程度,分析事物之间的差异。统计指数法--反映事物中各种直接因素的影响。
时间数列法--反映事物在时间段上的发展变化趋势。抽样调查法--统计专门调查方法中最科学的方法。相关回归分析法--分析事物中的因果关系。)通过内容体系的简单讲解导入,让学生在学习具体理论知识前就对该学科有一个总体感性认识,产生兴趣。带着要通过掌握统计知识去解决实际问题的意识和目的去学习。
2、让学生的学习从理性认识过渡到感性认识,增强应用能力
我在教学中介绍统计学的基本概念和统计调查方法内容时,除对每个知识点进行举例说明外,一部分知识讲完后,给出几个典型的统计调查方案让学生弄清在这些调查方案中所涉及的统计总体、总体范围的界定、总体单位、标志、指标以及采用的哪种调查方式等。这不仅让学生把抽象的统计学概念知识从理性认识过渡到了感性认识,而且通过这些案例还进一步让学生明白了调查方式的选用必须要根据调查对象和要解决的问题适当选取,而不是什么调查目的,什么事物都可以用任何一种调查方式。只有正确选用统计方式、方法去调查分析客观事物才能得出正确的结论,才能具备正确利用统计知识去分析解决问题的能力。
3、综合指标应用与典型资料结合法,提高学生的应用能力在讲授综合指标法时,对每一种指标的理解都是
分别举例说明让学生理解该指标的含义和作用。为了让学生能正确理解和区分每一种指标的作用,在所有指标介绍完后,我选用了国民经济年度统计公报资料作为案例,让学生从统计公报资料中找出学习过的每一种综合指标,如:2007年全国GDP总值,人口数等是总量指标。本年度GDP完成百分比是计划完成相对指标,本年度GDP比上年度增长百分比是动态相对指标。人均GDP是强度相对指标。
GDP构成比例是结构相对指标。五年中平均每年增长的百分比是后面要学习的平均发展速度和平均增长速度的应用。通过这样的案例,学生不仅对各种综合指标法的应用有了正确的理解,而且把各种指标的理解认识变成了应用能力,同时还对后面学习动态数列知识奠定了基础。在教学中很好地起到了巩固理解知识和预习下一教学环节内容的潜在作用。还起到了掌握知识综合性的效果。通过这样一个案例,学生进一步明确,研究一个总体的问题时,可以对问题的不同方面运用多种指标进行分析,弄清事物之间客观存在的关联,这些都必须用一定的统计数据来说话。因此进一步强调了学生学习统计知识的必要性,也让他们认识到统计学知识的科学性和实用性。
4、新旧知识在现实案例中的综合运用,提升学生应用能力
在讲授统计指数的内容时,传授给学生统计指数编制的基本方法的原理,教材中举例的商品价格、商品量、以及职工工资水平指数的编制都仅仅是一种计算基本方法的介绍。要培养学生应用能力还必须结合实际统计指数编制的案例进行讲解,让学生能够将理论知识及其计算方法应用到实际工作中去,所以我特意在理论知识和计算方法讲完后,介绍实际工作中零售物价指数的编制。这个经济指数也是民众普遍关注的问题,与人们生活水平息息相关。
告诉学生,物价指数的编制运用了抽样调查的知识,实际工作中不可能对每一种商品都采价调查,而是分大类商品,在商场和集贸市场分别采价。例如集贸市场的蔬菜价格每周至少要采集三次,每次要采集成交价的三人次,进入零售商品物价指数编制的价格实际上是一个多次简单平均的价格,而每天某种商品的三个价格要简单平均,每周三次的平均价格再简单平均。商场的商品价格如较稳定可用期初和期末的平均。通过这样一个案例,既给学生传授了新知识,又复习巩固了平均指标计算方法的具体应用,不仅日常生活中用,而且在经济研究中应用非常广泛。进一步告诉学生加权平均法和调和平均法在编制物价指数和其他社会经济现象指数中的应用。
5、典型调查案例教学法,培养学生综合应用统计知识,分析解决问题的能力
教学中我把学生应用统计知识,分析问题能力的培养放在抽样技术的教学内容中,抽样技术的基本理论也是抽象的。如,抽样误差,抽样平均误差,抽样的组织方式。针对研究对象的特点,都必须具体问题具体分析,而抽样误差的计算既涉及到平均指标的计算又涉及到标准差的计算,新旧知识的交替如何培养学生应用新旧知识计算、分析问题,解决问题是教学的难点。
为了突破这个难点,我在教学中利用了一个草席质量抽样调查的案例,这个案例体现了从制定调查方案中的调查方式的确定,采用主要标志划类,简单随机抽样原则,到调查实施的步骤:草席宽度分类,登记原验级等级,编顺序号,确定抽样总体,计算全级总体标准差,决定抽样数目,设计计算表格,决定样本号,现场调查中的统一验级标准。
验级过程:由5人分别验级,级数的最后确定采用众数办法,5人验级中的3人验级标准为准。以上这些都具有前面介绍的抽样调查方式的代表性,而又用到了平均指标和众数的方法。同时,在计算草席平均等级时,还用到了品质标志值平均指标的计算,即将等级品质标志值过渡成数量标志来计算该批不同尺寸草席的平均等级,再计算抽样指标与原验级指标之间的误差。
这样一个复杂的抽样调查过程和指标的计算结果,更清晰的告诉学生要说明和解决的问题:由于收购草席时,验级人员在判断标准上的误差带来了草席等级误差与价格的差异。而由于误差的存在,根据此抽样调查结果计算出的整个库存草席的总价值与实际价值的差异巨大。对导致这样的结果,进一步结合政策市场以及人为等多种因素进行分析,查找了原因并提出了切实可行的解决方案,促使了草席的收购价实相符。
通过以上几方面的教学方法设计,能让学生对统计学有更全面的认识,对学科基础内容有一个总体框架性把握,让那些学生在学习时感觉模糊的概念和繁杂的理论通过这几个教学环节的反复巩固和练习也逐步变得清晰,并大大提高了其综合应用统计知识的能力。
在网站流量统计分析报告中,给出的网站页面浏览数一般是在一个统计时期内的网页浏览总数,以及每天平均网页浏览数。仅从网页浏览总数或者每天的平均网页浏览数中实际上发现不了对网络营销分析有很大价值的信息。网站访问统计分析的基础是网站流量统计数据,其实可以统计的信息不仅仅是用户浏览的网页数量等“流量指标”,还包含更多用户访问网站的各种行为记录,网站访问统计的主要指标可以分为三类:1、网站流量指标;2、用户行为指标;3、用户浏览网站的方式。在进行深度网站统计分析时,除了自己网站的访问数据之外,通常还需要了解网站所在领域的状况,尤其是主要竞争者网站的访问统计信息,因此就需要获得竞争者网站的访问统计数据,这样才能进行全面的网站访问统计分析。在进行网站访问量统计分析时,页面浏览数(或称页面下载数、网页显示数)是必不可少的一项指标,实际工作中对这项指标的对比分析中经常会出现一些容易造成混淆的地方,因此在研究网站流量统计分析有关问题时, 有必要对网页浏览数的真实意义做一些讨论。 在一定统计周期内所有访问者浏览的页面数量。如果一个访问者浏览同一网页三次,那么网页浏览数就计算为三个。页面浏览数常作为网站流量统计的主要指标。不过,页面浏览数本身也有很多疑问,因为一个页面所包含的信息可能有很大差别,一个简单的页面也许只有几行文字,或者仅仅是一个用户登录框,而一个复杂的页面可能包含几十幅图片和几十屏的文字,同样的内容,在不同的网站往往页面数不同,这取决于设计人员的偏好等因素。例如一篇6000字左右的文章在普通网站通常都放在一个网页上,而在有些专业网站则很可能需要5个页面,对于用户来说,获取同样的信息,网站统计报告中记录的页面浏览数是1,而别的网站则是5个。作者在网络常用术语中也介绍过,由于页面浏览实际上并不能准确测量,因此现在IAB推荐采用的最接近页面浏览的概念是“页面显示”。无论怎么称呼,实际上也很难获得统一的标准,因此页面浏览指标对同一个网站进行评估有价值,而在不同网站之间比较时说服力就会大为降低。 这是一个平均数,即在一定时间内全部页面浏览数与所有访问者相除的结果,即一个用户浏览的网页数量。这一指标表明了访问者对网站内容或者产品信息感兴趣的程度,也就是常说的网站“粘性”。比如,如果大多数访问者的页面浏览数仅为一个网页,表明用户对网站显然没有多大兴趣,这样的访问者通常也不会成为有价值的用户。但应注意的是,由于各个网站设计的原则不同,对页面浏览数的定义不统一,同样也会造成每个访问者的页面浏览数指标在不同网站之间的可比性较低。尽管存在统计指标定义无法统一的问题,但在网站统计时仍不得不利用这些相关的指标。一般所说的“网站流量”通常指一个网站的页面浏览数,例如ALEXA全球网站排名系统的综合排名,就是根据网站的独立用户数量和每个用户的页面浏览数两项指标(加权?)相乘来计算的。因此可以看到这样的情况:两个网站相比,A网站的Reach数量(统计指标为百万用户中访问该网站的用户数量,即“Reach”)高于B 网站(假定A网站为100,B网站为60),但B网站每个用户的页面浏览数高于A网站(假定这项指标A网站为1,B网站为2),其结果是,独立用户量小的B网站在综合排名中高于A网站,因为B网站的总流量较高(B网站流量为120,A网站为100)。
网站流量数据统计是网站运营人员重要的一项工作。网站流量数据统计可以通过百度统计、cnzz或者网站iis日志分析。百度统计和cnzz需要将其统计代码加入网站代码中,然后就可以进行每天的统计。网站iis日志可以下载下来,找一个便捷的分析工具进行筛选分析。这里以cnzz为例:在cnzz分站分析中有“流量分析”、“来源分析”、“受访分析”、“访客分析”、“价值透视”等功能,能够清晰的分析统计网站流量数据。
网络流量建模有着广泛的应用。在本文中,我们提出了网络传输点过程(NTPP),这是一种 概率深层机制 ,它可以模拟网络中主机的流量特性,并有效地预测网络流量模式,如负载峰值。现有的随机模型依赖于网络流量本质上的自相似性,因此无法解释流量异常现象。这些异常现象,如短期流量爆发,在某些现代流量条件下非常普遍,例如数据中心流量,从而反驳了自相似性的假设。我们的模型对这种异常具有鲁棒性,因为它使用时间点流程模型有效地利用了突发网络流量的自激特性。 在从网络防御演习(CDX)、网站访问日志、数据中心流量和P2P流量等领域收集的7个不同的数据集上,NTPP在根据几个基线预测网络流量特性(从预测网络流量到检测流量峰值)方面提供了显著的性能提升。我们还演示了我们的模型在缓存场景中的一个应用程序,表明可以使用它来有效地降低缓存丢失率。
对新型网络应用和系统的需求日益增长, 使得网络流量行为更加复杂和不可预测 。例如,在数据中心网络中,流量微爆发源于应用程序[1]的突然流行,而在副本[2]间的信息同步过程中产生的大象流会在骨干网络上造成临时的负载不均衡。另一方面,由于不同的终端用户活动模式[3],诸如多媒体流媒体和视频会议等流量密集型应用导致了蜂窝网络和移动网络上的巨大流量差异。这种流量差异影响最终用户应用程序[4]的体验质量(QoE)。此外,随着基于Internet小型计算机系统接口(iSCSI)的分布式存储[5]和物联网(IoT)应用[6]的大规模地理分布式云存储同步的迅速普及,网络流量变异性成倍增加。各种安全攻击,如分布式拒绝服务攻击(DDoS),加剧了流量模式预测[7]的假阴性问题。 由于应用范围的多样化,短期和长期的流量爆发在各种类型的网络中都很常见;因此,研究人员探索了不同的 基于突发周期性假设 的流量突发预测技术,如 流量矩阵[8]的部分可预测性 、 张量补全方法 [9]等。然而,最近网络流量的高度不均匀性 使这种流量突发周期性的假设失效,并导致了明显的流量差异和多重分形流量变化 ,这需要单独的检测工作。这种交通差异和多重分形的例子包括数据中心或或ISP骨干[11]网中流量的突发峰值(微突发)[10]、多媒体应用的流量(如视频流媒体)[12]、存储同步[13]、恶意或攻击流量(例如物联网设备中的DDoS攻击)[7]。因此,需要开发一个流量事件预测模型,该模型可以捕获诸如流量突发、突发峰值、主机带宽使用的意外跳变等流量差异和多重分形流量变化。 在这项工作中,我们旨在 将差异性和可变性检测集成到网络流量建模中 ,从而为高度异常的网络流量提供统一的模型。为此,我们按照单独的网络主机(例如数据中心服务器或终端用户设备)的传输特性来分解流量预测问题,在此我们着重于总网络带宽的份额每个主机使用的时间,称为给定时间的“优势”。为此,我们提出了网络传输点过程(NTPP),它是一种基于时间点过程机制的深度概率机制。 NTPP首先使用 循环标记时间点过程 (RMTPP)表征主机突发流量产生的事件[14],该过程结合了主机的影响以根据可用带宽转发流量突发。此外,我们使用一组学习来对任意给定时间内对网络中不同主机进行排序的模板进行 排序 ,从而对不同主机之间的争用进行建模,其中主机的排序由其生成的通信量决定。这些模板提供了各种方法来评估一对主机的相对顺序,这些顺序是由它们的争用过程引起的。这些措施,连同底层的包传输过程,确保在整个时间窗口内主机之间的正确排序。为了了解传输动态以及排名的变化,我们将给定主机的观测传输时间的似然性最大化,并结合学习对模板进行排名的其他措施进行统一。这种额外的小工具使我们的模型能够预测意外的峰值,带宽使用量的跳跃,否则很难追踪(实验着重证明了这一点)。 我们根据来自不同域的 七个 真实数据集上的几个最新基准评估了我们的系统,这些数据集可能会显示异常流量。其中四项是从各个组织进行的网络防御演习中获得的,一项是从网站访问日志(1998年世界杯Web服务器)获得的,另一项是从数据中心流量的获得的,另一项是从BitTorrent网络获得的。我们观察到,在预测主机流量方面,NTPP的平均性能比最具竞争力的基准好11%,而在检测主机带宽消耗的突然跳升或峰值时,NTPP的预测精度提高了约25%。我们还使用基于NTPP的模拟器实现了下游缓存应用程序,并且观察到缓存未命中率降低了约10%。 贡献 : (1) 复杂包传输过程建模 :我们设计了NTPP,这是一个多主机网络流量动态的非线性随机模型,能够准确地捕捉到包传输过程中攻击性跳跃和不规则行为的存在。此外,与现有的离散时间流量模型(如[9]、[15])相比,我们使用了时间点过程的连续时间特性。 (2) 主机间的争用建模 :我们的NTPP方案利用了[16]中提出的产品竞争建模思想,将丰富的学习文献与网络流量建模联系起来,对[17]其进行排名。 (3) 预测能力 :NTPP不仅具有理论基础,而且具有实践效果。我们的模型能够比几种最先进的基准更有效地预测分组传输动态。此外,嵌入式鉴别模块有助于实时估计带宽消耗的突然变化,这是一个至关重要的实际挑战,所有基准都无法追踪。 (4) 下游应用 :我们演示了NTPP在下游缓存场景中的应用,突出了它的实用性。现有的原始内容缓存由于突发的流量而存在较高的缓存丢失率,而我们的模型支持的智能内容缓存通过根据不同主机的预测流量为它们保留不同数量的内存空间来实现更好的性能。
从历史上看,大量的工作集中在从各种不同的角度对万维网流量进行建模,使用各种分布模型,如泊松、帕累托、威布尔、马尔科夫和嵌入式马尔科夫、ON-OFF等。随着互联网的发展和各种Web服务的引入,提出了更复杂的模型,如马尔科夫调制泊松过程[19]、马尔科夫调制流体模型[20]、自回归模型[21]、流量矩阵[8]的部分可预测性、张量补全方法[9]等。然而, 这些模型只能捕获特定类型的网络事件,而不能泛化为捕获Internet流量中的不同流量差异和变化 。在另一个独立的线程中,研究人员将互联网流量爆发建模为一种显示自相似性[22]的现象。然而,许多工作23],[24]也质疑“自相似性”的假设,特别是在互联网骨干网中,从多个来源的流量会得到多路复用。 随着大规模数据中心、基于物联网的平台、蜂窝网络和移动网络、信息中心网络等领域的出现,互联网流量的性质发生了巨大变化。因此,出现了各种领域特有的模型,如数据中心[15]的流量微突发预测、流量异常检测[25]、物联网流量表征[26]、互联网社交事件预测[27]等。此外,由于网络流量在不同的差异和变化下具有不同的性质,最近的一些工作探索了基于机器学习的技术来预测流量模式[12]、[28]、[29]中的不同事件、异常和不一致性。然而, 这种预测模型是针对特定的网络系统设计的,缺乏通用性 。
在本节中,我们将制定NTPP,即所提出的模型(参见图1),该模型捕获了网络流量动态的两个主要组成部分—(i)集体包传输机制和(ii)多个主机之间的争用。在一开始,NTPP是由一种基于点过程的深层概率机制驱动的——点过程是一种特殊类型的随机过程,它自然地捕获了连续数据包到达背后的机制。此外,它还包含一个判别模块,该模块包含一系列对函数[17]进行排序的学习,专门设计用于建模主机间争用过程。接下来,我们将从时间点过程的概述开始,详细描述它们,然后描述学习和预测动态的方法。
统计分析是运用统计 方法 与分析对象有关的知识,从定量与定性的结合上进行的研究活动。下文是我为大家整理的关于统计分析论文的 范文 ,欢迎大家阅读参考!
浅谈统计分析与决策
[摘要] 统计分析与决策二者有联系又有区别。统计要参与决策,必须搞好统计分析。搞好统计分析,需要解决选题、分析、撰写 报告 三个问题。
[关键词] 统计分析 分析方法 决策
统计工作的全过程分为四个阶段,即统计设计,统计调查,统计整理,统计分析。其中,统计分析是统计工作的最后一个阶段,是出统计成果的阶段。现在倡导统计要参与决策,这是不是说统计工作还要增加一个决策阶段呢?如果不是,那么,统计分析与决策是什么关系呢?
狭义的说,统计分析与决策是有区别的。统计分析是以统计数字为基础,以统计方法为手段,对社会经济情况进行科学的分析和综合研究,以认识其本质和规律的过程。而决策则是为了达到某一预定目标,运用逻辑方法和统计方法,对两种或两种以上可能采取的方案进行比较、分析、研究,以做出合理的、科学的抉择的行为过程。假若把统计分析与决策比作医生看病,统计分析就是对病情的诊断,决策就是开处方,“诊断”和“处方”是有区别的。
广义的讲,统计分析与决策是密不可分的。一方面,统计分析贯穿于决策过程之中。一个决策过程大体上可分为下列三个大步骤:第一,诊断问题所在,确定决策目标;第二,探索和拟定各种可能的备选方案;第三,从各种备选方案中选出最合适的方案。从这三大步骤看,尽管要用到多种方法和手段,但哪一步也离不开统计分析,第一步就是通过统计分析,诊断问题所在,并在分析的基础上确定决策目标;第二步拟定备选方案,要经过“轮廊设想”和“细部设计”这个阶段对轮廊设想的方案要做初步筛选,对每一方案要充实具体内容,“筛选”和“充实”都要经过统计分析;第三步选择最佳方案,首先要对各个备选方案进行评价、论证,这又需要统计分析。因此可以说,没有统计分析,也就没有科学决策。另一方面,从某种意义上讲,决策是统计分析的结果。一般来说,统计分析报告是提出问题、分析问题、指出解决问题的办法,其实,决策方案也就是解决问题实现决策目标的办法,只不过比“今后意见”“几条 措施 ”之类的办法更全面、更详细、更科学罢了。医生诊断是为了正确处方,治病救人,不能只诊断不处方。统计分析是为了发现问题,解决问题,推动社会经济的顺利发展;也不能只提出问题,而不寻找解决问题的办法。从这个意义上讲,统计分析也就包括预测和决策。我们不能为统计而统计,也不能为分析而分析。统计应该参与决策,为了决策科学化,必须搞好统计分析。
搞好统计分析,需要解决选题、分析、撰写报告三个问题。
一、统计分析选题
所谓选题,就是在复杂的社会经济现象中,确定统计分析的内容和范围。进行统计分析,选题很重要。成功的选题是成功的分析的前提。
怎样选好题呢?选好题标准有两条:―是分析对象有意义,二是适合决策层和群众需要。关键是抓住党和国家的方针政策和企业的经济效益。
统计分析课题是很广泛的。工业统计分析课题如:计划执行情况分析、工业净产值统计分析、工业产品销售统计分析、工业原材料供应和消耗统计分析、工业能源消耗统计分析、工业生产设备统计分析、工业劳动与工资统计分析、成本利润统计分析、综合经济效益统计分析等。商品流通企业统计分析课题如:市场供求状况分析、市场占有率分析、主要商品经济寿命周期分析、市场商品价格分析、计划执行情况分析、购销合同执行情况分析、商品购进质量分析、商品销售动态分析、商品销售构成分析、商品库存分析、企业经济效益分析等。对于以上内容,可根据不同的时间、地点、条件,按两条选题标准适当选择。
统计分析有专题分析与综合分析之分。在一定的总体范围内,研究总体的各个方面及其相互关系,或研究总体的主要方面的统计分析,属于综合分析;只研究其中某一方面,或某一部分的统计分析,属于专题分析。两者各有不同的特点,都是必要的,但专题分析宜多,综合分析宜少。
二、统计分析方法
统计分析的关键是分析,怎样进行统计分析呢?统计分析有两个特点:一是以统计数字为基础,二是以统计方法为手段。因此,统计分析在选题之后,就要根据分析的需要,搜集整理有关数字资料及具体情况,在充分占有材料的基础上,灵活运用统计方法进行分析。
统计分析方法很多。统计学原理中除了有关统计调查、统计整理的内容外,综合指标、统计指数、时间数列、抽样推断等内容全部是统计分析方法。从方法角度上讲,统计分析就是统计学原理的运用。
统计方法与人们的认识过程是相适应的。人们的认识分感性认识和理性认识两个阶段。感性认识阶段所认识的是事物的现象,可采用统计调查和统计整理。理性认识阶段所认识的是事物的本质和规律,这个阶段要经过形成概念、进行判断和推理等思维活动。与此相适应,要分别采用不同的统计分析方法。
形成概念一般用描述性的综合指标法,即总量指标、相对指标和平均指标,以说明现象的规模大小、水平高低、速度快慢、内部结构以及比例关系等。判断推理就是要判断事物的性质,分析事物变化的原因,找出事物发展的规律。这一般要用分组分析法、动态分析法、因素分析法、相关回归分析法、平衡分析法等。
对统计学原理中的各种统计分析方法要熟练地掌握,灵活地运用。怎样灵活运用呢?这里有个技巧问题。技巧就是定性分析与定量分析巧妙结合。
所谓定性分析是指对事物的性质和影响事物发展变化的因素进行分析。定量分析就是分析事物的规模、水平、速度、结构、比例,以及各个因素对事物总体变化的影响方向和影响程度。定性分析与定量分析巧妙结合有两层含义,一是二者不可偏废,二是二者密不可分,
没有定性分析,定量分析就没有方向。没有定量分析,定性分析就不准确。结合的目的是在质与量的辩证统一中探寻事物的内在联系。
从根本上讲,统计分析就是完成从感性认识到理性认识,从现象到本质的飞跃。完成了这―飞跃,才是高质量的统计分析。有些统计分析质量不高,往往就是没有完成这一飞跃,仍然停留在表面现象上。
三、统计分析报告的撰写
统计分析报告是统计的最终产品。如果说统计数字的准确性是统计的生命,那么,统计分析报告的质量则关系到统计作用的发挥。对高质量的统计分析报告的要求,可以概括为五个字,就是“准、快、新、深、活”。
准:就是实事求是地反映客观实际。做到数字准确,情况准确,论点准确。
快:就是在决策层决策之前,不失时机地及时提供分析报告。
新:就是不断创新。要求不断开拓新领域,钻研新课题,反映新情况和新问题。
深:就是要在充分占有材料的基础上,提高分析的深度,使认识不只停留在反映现象上,而要揭示事物的本质和规律,并且用观点统帅材料,用材料说明观点,做到材料和观点的统一。
活:就是文字生动活泼,形式灵活多样。资料要多样化和生动具体,要有群众语言,要通俗易懂,文字要精精炼。
统计分析报告是在统计分析的基础上撰写出来的。没有好的分析,不可能写出好的报告。经过分析阶段,弄清了事实,判明了性质,探索出规律,得出了结论,在此基础上就可以撰写统计分析报告。但分析得好,并不等于报告写得好,这里还有个撰写的技巧问题,那就是准确地表述事实,透彻地阐明本质,深刻地揭示规律,恰当地提出建议。
1.准确地表述事实
每一篇统计分析报告,都需要表述所分析的现象,即说明“是什么”。准确地表述事实,才能给读者一个明确的概念。为此,须注意如下几点:(1)数字要真实;(2)运用数字要适当,不要堆砌数字,搞数字文字化;(3)语言要素准确。
2.透彻地阐明本质
现象只说明事物的各个片面,本质才说明事物的整体。撰写统计分析报告,必须深刻地揭示事物的本质,它是统计认识事物的正确程度和深度的反映。如果不能深刻地阐明事物的本质,那只能是现象罗列,没有多大价值。
阐明事物的本质,也就是阐明事物的基本性质。事物的性质是由事物内部矛盾的主要方面决定的。例如,某企业利润增加,是靠涨价,还是靠降低成本?经过分析,认识到利润增加主要是靠降低成本,这是矛盾的主要方面,这就反映出事物的性质。因此,在报告中就应阐明降低成本在提高经济效益中的重要作用。再如某企业,本质问题是钢材浪费严重,在报告中就应揭示浪费的若干方面和严重程度。
3.深刻地揭示规律
规律是事物内部固有的、本质的、必然联系。成本高低与产量多少有联系,经过推理,这种联系是事物内部固有的、本质的必然联系,反映了事物发展变化的规律性,而且存在一定的回归关系。而回归方程反映这种关系,所以在统计分析报告中,要利用回归方程揭示这种必然联系及其回归关系。
4.恰当地提出建议
认识世界的目的是为了改造世界。经过统计分析,透过现象认识到事物的本质和规律,还必须提出解决问题的建议,如“今后意见”、“几点建议”、“决策方案”等等。怎样才算恰当地建议呢?恰当的建议要符合三个条件:(1)符合分析目的;(2)合乎客观规律;(3)切实可行。
以上四点,一般可以作为分析报告的结构和顺序,但不能千篇一律。
统计分析报告是统计分析结果的反映。既要注意提高写作水平,更要努力锻炼分析问题和解决问题的能力。
试谈统计分析方法应用
【摘要】统计分析方法应用于各个领域,解决了很多工业、农业、经济、医学等领域的实际问题,本文分析多元统计分析方法的主要应用和构建多元统计方法检验体系的必要性,针对性的提出了需要引起注意的共性问题,具有很强的现实意义。
【关键词】统计分析方法;应用;检验体系;共性问题;现实意义前言
随着信息技术的普及和广泛应用,它推动了社会、经济和科学技术的发展,多元统计分析方法的难题得到了攻破,各个领域广泛采用,推动了各行各业经济的快速发展。
二、多元统计分析方法的主要应用
统计方法是科学研究的一种重要工具,其应用颇为广泛。在工业,农业,经济,生物和医学等领域的实际问题中,常常需要处理多个变量的观测数据,因此对多个变量进行综合处理的多元统计分析方法显得尤为重要。随着电子计算机技术的普及,以及社会,经济和科学技术的发展,过去被认为具有数学难度的多元统计分析方法,已越来越广泛地应用于实际。
聚类分析
它是研究分类问题的一种多元统计方法,聚类分析的基本思想是首先将每个样本当作一类,然后根据样本之间的相似程度并类计算新类与 其它 类之间距离,再选择近似者并类每合并一次减少一类,继续这一过程直到所有样本都合并成为一类为止。所以聚类分析依赖于对观测间的接近程度或相似程度的理解,定义不同的距离量度和相似性量度就可以产生不同的聚类结果。企业制定 市场营销 战略时要弄清在同一市场中哪些企业是直接竞争者,哪些是间接竞争者是非常关键的一个环节。要解决这个问题,企业首先可以通过 市场调查 ,获取自己和所有主要竟争者,从而寻找企业在市场中的机会。
判别分析
判别分析是已知研究对象分成若干类型,并取得各种类型的一批已知样品的观测数据、在此基础上根据某些准则建立判别式,然后对未知类型的样品进行判别分析,企业在市场预测中往往根据以往所调查的种种指标,用判别分析方法判断下季度产品是畅销平销或滞销。一般情况下判别分析经常与聚类分析联合起来使用。
主成分分析
主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标,来代替原来指标,同时根据实际需要从中可取几个较少的综台指标,尽可能多反映原来指标的信息,在市场研究中常常利用主成分析方法分析顾客的偏好和当前市场的产品与顾客之间的差别,从而提供给生产企业新产品开发方向的信息。
因子分析
因子分析是主成分分析的推广和应用。它是将错综复杂的随机变量综合为数量较少的随机变量去描述,多个变量之间的相关关系以再现原始指标与因子之间的相互关系。也可以认为因子分析是将指标按原始数据的内在结构分类。例如:对Y个调查区的商业网点数、人口数、金融机构服务数、收入情况等N个指标进行因子分析,如果按照一般的分析方法,我们就需要处理N个指标,并给它们以不同的权重。这样不仅工作量变大而且由干指标之间存在比较高的相关性,会给分析结果带来偏差另外给具有较高相关性的众多指标,从而计算出各个调查区平均综合实力得分以便决定在某个调查区拟建何种类型的销售点。
三、构建多元统计分析方法检验体系的必要性
(一)构建多元统计分析方法检验体系,提高多元统计分析应用质量
多元统计分析方法已经越来越为人们广泛应用,但应用中盲目套用分析方法的情况很多,只关心模型方法的应用。许多教科书也只侧重介绍多元统计分析方法的思想、原理和分析步骤,对多元统计分析方法应用结果的统计检验叙述不多。这就直接影响了多元统计分析方法的应用效果和可信性。因此,本文拟对多元统计分析方法的统计检验问题进行探讨。构建多元统计分析方法检验体系的目的在于进一步丰富和完善多元统计分析方法的内容体系;实践上,使多元统计分析方法的应用更加合理、规范。推动多元统计分析方法应用质量的提高,推动多元统计分析方法获得更广泛的应用。
(二)多元统计分析统计检验体系的基础理论
多元正态分布总体的样本分布,即维希特分布,霍特林分布,威尔克斯分布,多元正态总体均值向量假设检验,包括一个正态总体均值向量假设检验,两个正态总体均值向量假设检验,多个正态总体均值向量假设检验;多元正态总体协方差阵假设检验,包括一个正态总体协方差阵假设检验,多个协差阵相等假设检验。
(三)关于统计检验体系
将上述统计检验体系有机结合在一起,就构成了多元统计分析方法检验体系的基本框架。多元统计分析方法检验体系的构建,用多元统计分析方法,充分发挥多元统计分析方法的应用价值,提高应用质量,我们建议,在应用时,应该按照上述框架进行相应的统计检验。当然。上述统计检验体系还是一个初步的框架,随着多元统计分析方法理论的逐步完善,上述检验体系也需要不断完善,也需要更多的同行关注此类问题并不断加以研究。另一方面,在实际应用中,即便是某种方法根据上述内容都进行了统计检验,由于各种方法自身存在的缺陷或局限性,也还会存在许多应用中考虑不周之处。应该引起注意。但是,因子分析结果还是具有较大主观性。特别是对公共主因子在专业方面实际意义的解释上,仍然保留着一种艺术气息,并没有统一做法,因此很多情况下也是不能令人满意的。总之,我们在应用时,对因子分析的适用性、公因子的估计方法、公因子选取的数目。公因子的实际意义的解释等一系列问题都要引起足够注意。检验体系有如下几个分类:
a.主成分分析统计检验体系
b.因子分析统计检验体裂引
c.系统聚类分析统计检验体系
d.判别分析统计检验体裂
e.对应分析统计检验体系
f.典型相关分析统计检验体系
四、多元统计分析方法应用中需要注意的几个共性问题
1.关于原始数据变量的总体分布问题。
对原始变量的总体分布各种方法各有不同的要求。有的方法对原始数据变量总体分布没有特殊的要求,如主成分分析、聚类分析、对应分析。有的方法在不同情况下,对原始变量分布有不同的要求,如因子分析中,公共因子的估计方法不同,对原始变量分布要求不同,采用极大似然估计方法估计主因子时,是假定原始变量是服从多元正态分布的,因此,应用时要引起重视,如典型相关分析要求原始变量服从正态分布,但在严格意义上,如果变量的分布形式比如高度偏态不会降低其他变量的相关关系,典型相关分析是可以包含这种非正态变量的。
样本容量问题。
进行多元统计分析时,样本容量n达到多少为宜,目前尚没有统一的结论。有的认为样本容量应是变量个数的10~20倍,有的认为样本容量要在100以上比较合适,有的认为进行巴特莱特检验时的样本容量应该大于150方可,也有的认为不必苛求太多的样本容量,如在进行主成分分析和因子分析时当原始变量之间的相关性很小时,即使再扩大样本容量,也难以得到满意效果。
原始变量之间的相关性以及非线性关系问题。
多元统计分析方法中,有的是的要求原始变量中要具有相关性。有的则不要求原始变量具有相关性。如聚类分析中,进行Q型系统聚类分析时对原始数据变量之间的相关性也是有要求的,如选择欧式距离、明氏距离、兰氏距离时,则要求原始变量之间是不相关的。只有对原始数据的相关性进行了处理后,才可以选择使用上述距离。若原始变量存在相关性,则选择马氏距离比较合适。另外原始变量之间的非线性关系也是需要注意的问题。如主成分分析、因子分析以及典型相关分析当基于相关矩阵来进行计算时,这里的相关矩阵实际上是Pearson的积差相关。但是,如果变量之间的关系不是线性的,而是非性相关关系,于是,所进行的分析以及结论也就失去应有的意义了。
数据处理问题。
多元统计分析中涉及多个变量,不同变量往往具有不同的量纲及不同的数量级别。在分析时,具有不同量纲的变量进行线性组合是没有意义的,不同的数量级别的变量之间进行分析时。会导致“以大吃小”,即数量级的变量的影响会被忽略,从而影响了分析结果的合理性。因此。为了消除量纲和数量级别的影响,进行多元统计分析时,必须对原始数据进行处里,最常用的是先作标准化变换处理,然后再作相应的分析。
五、结束语
在统计分析方法的应用中,会涉及到多个变量,因此,必须根据原来有的数量进行处理,然后才能得出相应的分析结论。本文结合多元统计分析方法的理论基础,对相关检验体系和分析体系进行了分析,具有现实的理论指导意义。
【参考文献】
[1]于秀林.多元统计分析[M].北京,中国统计出版社,1999:223—224.
[2]高惠璇.应用多元统计分析[M].北京,北京大学出版社 ,2005:343—366.
[3]郭志刚.社会科学分析方法一SPSS软件应用[M].,中国人民大学出版社,1999.
[4]傅德印.主成分分析中的统计检验问题 [J].统计 教育 ,2007(9):4—7.
社会科学发展的进程中,统计学起了很大的推动作用。没有统计学,就没有现代的社会科学。下面是我为大家整理的统计学 教育 分析论文,供大家参考。
摘要:统计学是一门通用的 方法 论的科学,统计思想方法具有极其广泛的应用性。随着国家创新体系的建立,统计学的教育创新已经成为一个重要的议题。本文对统计学普及教育的创新问题进行一些探讨。
关键词:统计学;普及教育;创新
一、大规模的统计学普及教育势在必行
从世界发达国家的情况来看,都比较重视统计学和统计学教育。2006年6月,中国人民大学举办了“2006统计学国际论坛”,笔者参加了这一论坛,并专门就统计学普及教育问题向美国依利诺依大学何旭明教授了解了美国统计学教育的有关情况。何教授讲:“美国的高等院校几乎都开设《统计方法》选修课,而且学生中选《统计方法》课程的人数要多于选修《微积分》课程的人数,因为他们觉得统计更有用。”另外,从最近的英国、美国、日本以及港、台地区的中学教材来看,统计学与概率都是教学内容的重要组成部分,多数教材每个年级都有统计内容。
在国内,统计学也越来越受到重视。1993年12月,贺铿、袁卫两位教授提出的“大统计”的理念,在统计学界从认识上正趋于统一。1998年9月,教育部在将504个本科专业调整为249个的情况下,统计学从原来的二级学科反而被调整为理学类一级学科。这些都为统计学的发展和统计教育的大规模普及奠定了重要基础。
尽管如此,我国统计学教育与发达国家相比还是存在着很大的差距。我国所有的普通高等学校中,具有统计学专业或开设统计学课程的只有100多所,这与美国有成百上千所学校在提供统计教育的状况相比比例是较低的。从我国中学教材来看,统计的内容约占4%。相对上述国家的教科书来说比例也是较低的。
一个国家应用统计学知识的多少,反映一个国家的发达程度。随着我国社会主义市场经济和各项社会事业的快速发展,随着建设创新型国家战略目标的实施,随着高等教育的大众化进程,统计学提高教育和大规模的普及教育无疑都会得到长足发展。统计学教育也会在普及基础上进一步提高,在提高指导下进一步普及。因此笔者认为,较大规模的统计学普及教育已经势在必行。
二、高等院校是统计学普及教育的突破口
实际上,近年来我国的统计学教育已经开始突破统计学专业教育的界限,在一些理工农医以及社会学等大部分学科和专业中,开设了统计课程;统计知识还列入了中小学教学内容。这是可喜的,但笔者认为统计学普及教育还仅仅是初露端倪,大规模的统计学普及教育还未开始,还有许多工作要做。
目前,我国在一些 财经 类院校开设的基本是社会统计学,在理工类院校开设的基本是数理统计学,都还与“大统计”的理念和作为理学类一级学科的统计学存在着很大距离。中小学虽然在数学教材中加入了一些统计学的基本内容,但一方面比例较少,另一方面,据笔者了解,由于受应试教育和基层学校师资条件的制约,教育质量也还存在不少的问题。很多理科教师在大学仅学过数理统计课程,对抽样和描述统计的内容较生疏,因而感觉新教材内容体系较乱,内容不如老教材讲起来“顺溜”。于是知识可以传授给学生,也可以指导学生完成很多的练习题,但蕴涵在知识背后的统计思想能否也讲出来可能就要打很大的折扣了。
另外,国民的统计意识还不强,对统计学的认识也还不够,据笔者了解,一谈到统计,很多人就联想到统计局,联想到大量的统计数据和统计报表等。这些都说明,统计学的普及教育还任重道远。
大规模普及统计教育是一项浩大的系统工程,需要以强大的人力、物力、财力资源为基础。以人力资源为例,尽管我国有一支素质较高的统计学专家队伍,但由于他们承担着国家政府部门或科学研究机构的重要工作,因此显然不可能有过多的时间和精力从事大规模的普及教育工作。同样,国家目前也还不可能投入大量的物力和财力资源开展统计学的普及教育工作。那么,怎样解决人力、物力、财力的问题,开展大规模的统计学普及教育呢?
笔者认为,要进行全社会的统计学普及教育,首先应该在各类高等院校中普及统计学教育,即把高等院校作为统计学普及教育的突破口,而后推向全社会。各类高校现有专业教师可以承担统计学普及教育的教学工作,在学校教务部门的统一安排下,着力通过开设跨专业选修课的形式开展统计学普及教育。各类高等院校接受过统计学基础教育的成千上万名大学生会走向社会的众多工作岗位,他们会带着统计学的基本思想方法在各个岗位开花结果,同时也为他们进一步提高和继续进行全社会的统计学普及教育打下了基础。因此,把高等院校作为统计学普及教育的突破口是解决人力、物力、财力资源问题的最好方略和最佳途径。
当然,由中国统计教育学会、重点大学和一流专家牵头,以讲座班的形式开展对一般高等院校的师资培训工作,以研讨会的形式定期沟通和交流各高校统计学普及教育的情况和 经验 也是非常必要和重要的。
高等院校作为统计学普及教育的这个突破口一旦打开,全社会普及统计学教育的蓬勃局面也就很快到来了。笔者甚至认为,高等院校统计学普及教育的局面可能会很壮观,会受到学生的欢迎。
三、在高等院校进行统计学普及教育的一些思考
在各类高等院校中进行统计学普及教育实际上是相对现有教育体制来说的一项教育教学改革,是高等院校教学内容创新的一种尝试,需要领导的重视,教务部门的协调等基本条件作为保证。在这里,就有关教学指导思想和实施方法粗略地谈一下基本想法,以求抛砖引玉。
1、基本思想:将抽样技术、描述统计、概率初步、推断统计、非参数统计、 Excel 在统计分析中的应用结合在一起,并溶入案例教学,向学生较系统地介绍入门阶段最基本的统计思想和方法。
2、基本途径:通过在普通高等院校各专业开设《应用统计方法》选修课,解决统计意识的培养和统计方法普及教育问题,选修课一般为54~72学时为宜。
3、基本目标:各专业的学生通过《应用统计方法》的学习,初步树立统计意识,能够用基本的统计方法,借助于最普及的Excel统计分析软件解决工作中和生活中的实际问题。
4、教材选用:可以选用中国人民大学统计学院贾俊平等编著的《统计学》作为教材,也可以根据教学时间和 其它 具体情况,自编教材。
5、师资问题:各高等院校讲授统计学或者概率统计的教师承担统计学普及教育的教学工作,教务部门承担相关的教学管理工作都是没有太大问题的。当然教师很可能需要进行一些再学习,更新知识结构。例如,讲授概率统计的教师很可能需要学习实际的抽样技术和Excel统计分析软件的应用方法等。
6、学习评价:注重理论联系实际,将“学统计”转化为“做统计”,改革传统考试方法,通过撰写统计 报告 进行考核,从而使学生掌握从数据的收集、整理、分析、写出统计报告的全过程,提高教学效果。
在2004年8月教育部颁布的《普通高等院校本科教学工作水平评估方案(试行)》中,实践教学被视为专业建设与教学改革的重要方面,单独列为一项二级指标,强化了实践教学的地位。各类高等院校率先进行统计学教育的普及工作,不但增强了实践教学的环节,而且也为统计学的社会普及教育打开了突破口,是义不容辞的时代使命。同时,通过大规模地进行统计学普及教育,也会提高统计学在国民心目中的地位,提高统计工作者的社会地位,更重要的是可以提高适应社会主义市场经济的与世界发达国家接轨的国民基本科学素质。
参考文献:
[1]胡学锋.美国统计教育之考察[J].统计与决策.
[2]张国荣.在中国统计教育学会第四次会员代表大会开幕式上的讲话[J].统计教育,
[3]马赞军.大学统计学教学模式探讨[J].统计教育.[4]杨大成.统计 教学方法 当改[J].中国统计.
摘要:以上探讨了在建构主义理论指导下统计学课堂教学方法,统计教学是一门艺术,艺无止境。相信当建构主义理论真正走进统计课堂教学时,统计教学会取得更好的教学效果。
关键词:统计学;教育
一、建构主义理论学生“学”的特点
建构主义对学生学习活动的本质进行了科学的分析,认为学生学习有如下特点:
1、学生学习不是从零开始的,而是基于原有知识经验背景的建构。即学生在学习统计课程之前,头脑里并非一片空白。学生通过日常生活的各种 渠道 和自身的实践,对客观世界中各种自然现象已经形成了自己的看法,建构了大量的朴素概念或前学科概念。这些前概念形形色色,共同构成了影响学生学习统计学概念的系统。学生的前概念是极为重要的,它是影响统计学学习的一个决定性的因素。前概念指导或决定着学生的感知过程,还会对学生解决问题的行为和学习过程产生影响。
2、学生学习知识是一个主体建构的过程,要突出学习者的主体作用。学习不仅仅是知识由外到内的转移和传递,而是学习者主动地建构自己的知识经验的过程,即通过新经验与原有知识经验的反复的、双向的相互作用,充实、丰富和改造学习者原有的知识经验。在这种建构过程中,学生一方面对当前信息的理解要以原有的知识经验为基础,超越外部信息本身;另一方面,对原有知识经验的运用又不只是简单地提取和套用,个体同时需要依据新经验对原有经验本身也做出某种调整和改造,即同化和顺应两方面的统一。学生不是被动信息的吸收者,而是主动地建构信息,这种建构不可能由其他人代替。因此,教师不能直接将知识传递给学生,而是要组织、引导,使学生参与到整个学习过程中去。
3、学生学习既是个体建构过程,也是社会建构过程。虽然知识是在个体与环境的相互作用中建构起来的,但社会性的相互作用也很重要,甚至更重要。因为人的高级心理机能的发展是社会性相互作用内化的结果(正如统计的特点具有社会性)。此外,每个学习者都有自己的经验世界,不同的学习者对某种问题可以有不同的假设和推论,学习者可以通过相互沟通和交流,相互争辩和讨论,合作完成一定的任务,共同解决问题,从而形成更丰富、更灵活的理解。同时,学生可以与教师、统计专家等展开充分沟通。这种社会性相互作用可以为知识建构创设一个广泛的学习共同体,从而为知识建构提供丰富的资源和积极的支持。因此,课堂上师生交互和生生交互活动起到了很重要的作用,“学习共同体”的形成以及对课堂社会环境和情境的营建是学生获得学习成效的重要途径。
二、建构主义理论教师“教”的特点
建构主义理论认为教师在课堂中的作用,可以概括为教师是课堂教学的组织者、发现者和中介者。
1、教师是课堂教学的组织者,起主导作用和导向作用。教师应当发挥“导向”的作用和教学组织者的作用,努力调动学生的积极性,帮助他们发现问题,进而去“解决问题”。
2、教师是课堂教学的发现者。教师要高度重视对学生错误的诊断与纠正,并用科学的原理和原则,给予正确的引导与指引。
3、教师是课堂教学的中介者。教师是学生与教育方针及知识的桥梁。教师既要把最新的知识和分析方法提供给学生,也要注意提高学生的综合素质。
从辩证法的角度看,教学是一个不断发展的动态过程,教与学是对立统一的矛盾运动,随着教学活动的变化,矛盾的主要方面,或在教师,或在学生。分开来看,“教”的主体是教师,客体是学生,教师发挥主导作用,学生发挥能动作用;“学”的主体是学生,客体是教师,学生进行认识活动和实践活动,教师则对这些活动施加影响。合起来看,在教学活动这一不断发展、循环往复的全过程中,教师与学生的主体客体地位是相互依存、相互规定,又在一定条件下相互转化的。因此,“基于教师在课堂中组织者、发现者和中介者”的角色作用,教师可以实行“提出问题──探索问题──解决问题”的模式组织课堂教学。
“基于学生为主体,教师为主导”的教学思想,在教学过程中,“学”与“导”的活动、学生与教师之间的关系应该是互动的、融合的,在和谐中不断向前发展。因此,按照“学与导和谐发展”的教学要求,教师在课堂教学中按照“提出问题──探索问题──解决问题”的模式组织课堂教学时,可以采取“诱导试学——引导探学——开导活学”方法组织课堂教学。
(1)设置情境,提出问题,激发学生学习的兴趣和热情
教师引导学生学习首先要从现实的、有兴趣的、富有挑战性的真实问题情境开始。让学生一开始进入学习探索就真切地感受到统计就在自己身边,体验到学习统计的价值,从而激发起学习统计的兴趣,萌发积极主动探索统计理论和方法的求知欲望。教师要通过对课堂的组织,让学生对学习统计产生学习兴趣,“热爱是最好的老师”,兴趣盎然地进入了对统计学知识的探索,学生才能学有所长。(2)探索问题,增强学生主角意识,激励学生积极参与
“基于教师在课堂中组织者、发现者和中介者”的角色作用,课堂教学方式应从根本上改变原有的教师讲、学生听,教师指挥、学生操作的教学现象。学生要在自己生活经验的基础上不断地提出问题,分析问题,对各种信息进行加工转换,对新经验和旧经验进行综合概括,解释有关现象。在教学过程中,教师可以提供一定的支持和引导,设计有思考价值、有意义的问题。学生可以进行小组合作研究探索,教师允许学生从不同的角度去观察分析,允许学生用自己喜欢的方法学习,通过各自想法的交流、碰撞,发现学生有价值的建设性建议及方法 措施 ,及时制止学生运用统计方法计算分析问题时可能出现的偏差,使问题得到正确的解决。
(3)解决问题,培养学生创新能力,提高学生综合素质
在以往统计学教学中,我们关注比较多的是学生能否记住计算公式、方法、意义、应用条件,能否利用这些知识完成所设问题的正确计算。而“基于教师在课堂中组织者、发现者和中介者”的角色作用,教师在课堂中,就应该更加关注学生能否将科学知识与自己的生活经验紧密联系起来,关注学生在灵活应用统计学知识、创造性地解决实际问题时所表现出来的情感、态度和价值观。并通过实践活动,使学生对学习统计产生兴趣,变抽象的科学法则、科学方法为得心应手的工具,从而使学生在解决问题过程中,体验参与学习统计的快乐,享受成功解决实际问题的愉悦。
三、以建构主义理论为指导统计学教法探讨
1、设计课堂教学新模式
统计学课程旨在培养学生能够运用统计学基本理论和定量分析方法,对经济现象进行定性和定量的分析和评价。统计学课程内容基本分为三个模块两个层次。第一模块:研究统计学的一般问题,属于基础理论。第二模块:推断统计的理论与方法,相关与回归分析,属于一般的统计方法及其在社会经济领域的运用。第三模块:时间序列分析与预测,统计指数与因素分析,统计综合评价,属于社会经济统计方法的特有问题,侧重于各种统计分析方法运用。两个层
反映了知识、能力、素质培养的要求。在建构主义学习环境下,教师和学生的地位、作用和传统教学相比已发生很大变化。因而首先教师必须改变传统的教育思想与教育观念,以现代教育思想和学习理论为指导,利用多媒体等现代化技术优势,探索最优的课堂教学模式。课堂教学中应进一步发挥好学生的主体作用,让学生主动地参与到获取知识的过程中去,做到:(1)合理处理好教材,创造性地使用教材,充分展示学习内容的实用意义。(2)教学思路清晰,过程流畅、自然。(3)采用启发式、精讲多练式、答疑式、案例式等教学方法,构建情景逼近式的教学模式,努力提高课堂教学效果。
2、设计课内课外相融共生的大课堂
课堂教学不仅要教会想要传授给学生的知识,还要教会学生在书本之外查阅图书、报刊、杂志、网络等资料,以开阔视野,扩大知识面,吸取精华,为我所用,要教给学生发现问题、分析问题、解决问题的方法。此外,还要通过课内设计的实训教学内容激发学生主动参与的热情,实训教学内容主要包括统计调查方案的编制、调查问卷的设计、统计表统计图的制作、综合指标分析、统计案例分析等内容。统计实训的课内教学采用精讲、示范、多练、答疑的方式;课外教学采用学生自行分散复习和有组织分组制表、制图、社会调查、整理计算分析等方式。
3、实行点、线、面、体相结合的大统计
“点”是指让学生根据某一知识点完成作业、实习。“线”是指让学生针对某一问题进行深入分析。“面”是指让学生把若干知识点联系起来进行综合的分析和实训。“体”是指让学生能就学科体系及相关学科的内容进行深入、全面、综合的分析与应用。在讲授基本理论和基本知识的同时,注重学生基本技能培养、综合能力培养、设计能力的培养。使学生能从高度整体把握统计的思路和统计分析、评价思想。
4、充分发挥学生的主体作用
建构主义理论强调学习者在建构性学习中的积极作用,是要求教师在课堂教学中善于激发学生的好奇心和求知欲,使学生主动积极的学习。教学中应根据统计教学内容和学生特点,选择适当的教学方法,灵活运用适当的教学手段,设置悬念,使学生产生好奇心和强烈的求知欲。统计学教学过程中涉及到特有的概念及科学家,教学中可以适当拓展,开阔学生的视野,影响学生的心智,塑造学生的灵魂,在潜移默化中激发学生学习统计的兴趣;教师的教学语言要准确生动形象,善于设疑,启发学生思维,活跃课堂气氛,使学生充满求知思索的激情;做到理论联系实际,强化学习的动机,激发学生学习统计持久的浓厚的兴趣,激励学生不断提高对自己能力的欲求,不断增强自己的学习信心,不断地在自我实现中超越自我。
5、设置情境,在交互中实现教学目标
学校是社会的一个细胞,是社会的一个重要组成部分。课堂也不单纯是“老师教、学生学”的木讷课堂。课堂中的社会性环境主要包括两方面,一是师生之间的交互,二是学生之间的交互。建构主义认为,每个学习者都有自己的经验世界,不同的学习者可以对某种问题形成不同的假设和推论。师生在课堂上可以通过合作解决问题、小组讨论、意见交流、 辩论 等形式,促进学习者之间的沟通和互动。统计教学要从过去主要关注“人机交互”到关注“人际交互”;从只关注学生与教师、教学信息的交互到关注学生之间的交互以及学生与校外专家、实践工作者的交互;从关注个别化学习到同时关注学习共同体的建立。教学中要充分利用社会性资源,调动学生的学习情趣,拓展学生的知识面,在交互中实现最佳的教学效果。
6、构建科学的考核评价体系
建构主义理论强调学习是诊断性学习和 反思 性学习和自主性学习,这意味着学生必须从事自我监控、自我测试、自我检查、自我约束等活动,以诊断和判断学习中所追求的是否是自己设置的目标。在教学中,应该根据理论和实训教学的不同特点、不同教学内容的具体组织方式,不断的反馈,使学生自己及时评价。同时,在学生成绩考试评定中,应采取了灵活的考试方式
笔试、有口试,也有设计方案和调查报告,笔试内容也应着重考核学生运用所学知识分析问题解决问题的能力,注重知识、能力和素质的综合评价。
以上探讨了在建构主义理论指导下统计学课堂教学方法,统计教学是一门艺术,艺无止境。相信当建构主义理论真正走进统计课堂教学时,统计教学会取得更好的教学效果。
浅谈统计学教育分析论文相关 文章 :
1. 统计学教学专业论文范文
2. 统计学教学优秀毕业论文
3. 统计学专业课程建设模式探究论文
4. 统计学课程教学专业论文
5. 统计学教学专业优秀硕士论文
6. 统计学课程教学相关论文
SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考!
统计分析软件SPSS的特点和应用分析
【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。
【关键词】统计分析软件;SPSS;独立样本;非参数检验
一、前言
统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件,目前在各专业 毕业 论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的 爱好 者。本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。
二、SPSS软件的特点
(一)操作简便
SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
(二)编程方便
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计 方法 的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
(三)功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
(四)全面的数据接口
能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件, Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt,word,PPT及html格式的文件。
(五)灵活的功能模块组合
SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
(六)针对性强
SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。
三、实例分析――两个独立样本的检验(Test for Two Independent Sample)
例题:为了调查甲、乙两地土壤对 种植 同一种西瓜有没有影响,从这两个产地分别随机抽取同种的8只和7只西瓜,称重后得重量(市斤)如下:
甲(斤):、、、、、、、
乙(斤):、、、、、、
问:根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?
解:建立假设 H0:甲乙两地的西瓜重量没有显著差异;
H1:甲乙两地的西瓜重量有没有显著差异。
然后根据上面给出的数据建立数据文件,注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具 体操 作过程如下:
第一步:单击Analyze Nonparametric Test 2 Independent Sample,打开Two-Independent-Sample对话框(见图1)。
第二步:选择检验的变量进入检验框中,选择分组变量进入Grouping Variable框中,单击Define Group键,打开Define Group对话框,将分组变量值分别键入两个框中,单击Continue返回主对话框(见图2):
第三步:在Test Type栏中,确定检验方法。
SPSS中提供了四种检验方式,几种检验方法侧重点不同,但都是先把两样本数据混合排序,再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样,所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。
第四步:选择输出的结果形式及缺失值处理方式;
第五步:单击OK,得输出结果。
所以,以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。
参考文献
[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.
[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).
[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).
试谈SPSS软件在考试数据统计分析中的应用
摘要: SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤,文中的方法对考试研究人员具有一定的指导意义。
关键词: SPSS软件 考试数据 统计分析 操作步骤
1. 引言
一份好的试卷须有好的测量指标来表明它的优良程度,试题有难度和区分度指标,试卷有效度和信度指标,这些是评价考试最主要的测量指标,但是仅有这些指标不足以反映一份试卷的实际测量效果,考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代,考试成绩统计主要依靠人工阅卷,考试数据无法电子化存储,对考试数据分析统计难以实现。随着计算机的普及和信息化的推广,各种分析数据的软件应运而生,这些软件中汇集了统计学和测量学的分析工具,使得应用电子信息技术分析统计考试成绩数据成为可能,这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中,SPSS是应用最多、影响最广泛的分析工具之一。在本文中,我们以SPSS软件为工具,对 教育 招生考试成绩的数据进行统计分析,分析主要着重于考试数据的相关性、假设检验等几个方面。
2. SPSS分析软件简介
“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”,中文名称为“社会科学统计软件包”,它是世界著名的统计分析软件之一,在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包,它集数据整理、分析于一身,主要功能包括数据管理、统计分析、图表分析、输出管理等,该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。
下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析,介绍使用SPSS进行统计分析的一般方法和步骤。
3. 相关性分析
教育考试中,考试结果的信度,试题的区分度,每个题目得分与试卷总分的关系,以及题目之间的关系,等等,都是考试研究的重要内容,最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中,Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。
Pearson相关系数法计算公式:
式中x为第i个考生第j题的得分,y为第i个考生第k题的得分,为第j题的平均分,为第k题的平均分,n为测试样本量。该公式既可以计算两个连续变量之间的相关性,又可以计算一个双歧变量与一个连续变量之间的相关性。
Spearman相关系数法计算公式:
r=1-(2)
式中D为两个变量的秩序之差,n为样本容量。
Cronbach a信度系数法计算公式:
α= 1-(3)
式中n为试题数,s为第i题的标准差,s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。
对于给定的一组考生成绩数据,利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性,以及各个题目之间的相关性。我们以Pearson相关系数分析为例,利用SPSS软件进行统计分析。
数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷),数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。
我们以SPSS 版本的软件为例,介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例):
(1)将考试数据导入SPSS软件,在SPSS数据窗口中,顺序点击【Analyze】→【Correlate】→【Bivariate...】,系统弹出变量相关系数设置对话框。
(2)在该对话框中,将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中,在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中,选取“Pearson”复选框。
(3)在该对话框的“Test of Significance”设置区域,可以点选“Two-tailed”选项或者“One-tailed”,我们采用系统默认值。
(4)对话框中的 其它 选项取软件系统的默认值,点击【OK】,开始相关系数计算,系统弹出新的窗体输出运算的结果。本次输出的情况如下:
上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中,但题目T4和题目T5之间的相关程度远高于其它几个题目,我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系,这是我们通过分析获取的重要信息,该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性,这在大规模考试中是不应该出现的,需要在以后的命题考试中加以改进。
Spearman相关系数分析方法和上述分析方法类似,只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框,程序就会按Pearson相关系数法进行统计分析,如果同时选中“Spearman”和“Pearson”复选框,程序将会同时计算按两种分析方法统计分析的数据,并会以不同的图表进行显示,而Cronbach a信度系数法计算方法与上述方法略有不同,其操作步骤如下:
(1)在SPSS数据窗口中,顺序点击【Analyze】→【Scale】→【Reliability Analysis...】,系统弹出“Reliability Analysis”信度分析设置对话框。
(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中,在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数),点击“Statistics”选择项可以进行更为详细的参数设置,我们采用系统的默认值即可。
(3)参数设置完毕之后,点击【OK】,软件开始相关系数计算并输出运算结果。
4. 选择题的选项分析
在目前的教育招生考试中选择题是一种较常见的题型,考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2],对选择题干扰项的设计及其施测后的实际效果关注甚少,事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设,对试卷中常见的选择题选择项进行统计分析。
教育考试的单项选择项一般设置为4个,其中仅有1个选择项是正确的。命题人员在设计选择项时,应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测,对考生作答的分布情况作出预估。考试结束后,研究人员应该对实测的情况与命题教师预测的情况进行对比分析,以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性,因此可以尝试使用χ检验假设进行分析。
我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理,设变量E是命题者对某道试题的期望值,E=nP,n为样本容量,P为期望的相对频率,引入以下统计量:∑(O-E)/E,其中O为观察频数。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
我们需要进行的假设检验是:零假设H:选项的实测分布与期望分布相同;非零假设H:选项的实测分布与期望分布不同。
检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真,则检验统计量∑(O-E)/E呈近似χ分布,其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合,就不排除零假设,否则就排除零假设;最后对检验假设的结果进行解释。
数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本,利用SPSS进行统计分析。
SPSS数据统计分析的步骤如下:
(1)将考试数据导入SPSS软件,依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】,弹出“Chi-Square Tests”对话框。
(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中,本例中题目的序号为t7。
(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框,具体操作方法是选中单选框“Values”,输入具体的期望数值,点击“Add”按钮,依次重复上述的步骤直至所有的选项的期望值输入完毕。
(4)点击【OK】,输出软件运算结果。
我们需要进行的假设检验,H:选项的实测分布与期望分布相同;H:选项的实测分布与期望分布不同。
假设检验的显著性水平为α=,χ=∑(O-E)/E,自由度为df=4-1=3,查χ分布表或利用相关软件可得P=,由于P>α,因此不能拒绝零假设,即选项的实测分布与期望分布相同。因此,检验结果在显著性水平时,没有足够的证据拒绝零假设,即可认为本题选项的实测分布与期望分布相同,也就是说本题的实际测试效果与命题教师预测的效果是一致的,命题教师准确地估计了考生的实际水平,这是分析获得的很重要的结论。
5. 结语
SPSS软件在考试数据统计分析中应用广泛,但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面,本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看,软件操作步骤和统计分析过程十分简单、快捷,对于测量学和统计学基础不太好的数据分析统计人员来说,只要遵循一定的操作步骤,就可以进行分析。
参考文献:
[1]王孝玲.教育测量(修订版)[M].上海:华东师范大学出版社,2006.
[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006.
[3]李伟明,冯伯麟,余仁胜.考试的统计分析方法[M].北京:高等教育出版社,1990.
[4]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007.
猜你喜欢:
1. 统计学数据分析论文
2. spss统计分析实习心得
3. 统计学学年论文
4. 统计学分析论文
人种是世界人类种族的简称,是指人类在一定的区域内,历史上所形成的、在体质上具有某些共同遗传性状(包括肤色、眼色、发色和发型、身高、面型、头型、鼻型、血型、遗传性疾病等)的人群。人种的概念,最初于1684年由法国博物学家伯尼埃首先提出的。 最早的人种分类,是3000多年前古埃及第十八王朝西替一世坟墓的壁画,它以不同的颜色区别人类,将人类分为四种:第一,将埃及人涂以赤色;第二,亚洲人涂以黄色;第三,南方尼格罗人涂以黑色;第四,西方人及北方人涂以白色。成为今日将人类分成白种人、黄种人、黑种人、褐色人的基础。 瑞典杰出的科学家林奈,在1758年所做的分类中,将世界人种划分为:野蛮种——菲拉斯,怪物种——蒙斯托拉斯,理智种——塞比恩斯;进而按当时众知的洲数,把理智种进一步分为欧洲白种人,亚洲黄种人、非洲黑种人和美洲人红种人四大种族。 法国著名学者居维叶主张划为三大人种,并以《旧约全书》中的诺亚三个儿子的名字分别命名为:闪人种、含人种、雅弗人种。这种从文化上、宗教上对人种进行划分,人们很难接受。 被誉为“西方人类学鼻祖”、“人类之父”的德国格丁根大学教授布鲁门马赫,是第一个用科学方法进行分类的,他根据肤色、发色和发型、眼色、身高、头型等体质特征,以及原住居民地,把现生人类划为五大人种: ①高加索人种(白种)。皮肤白色,头发栗色,头部几成球形,面呈卵形而垂直,鼻狭细,口校欧洲和西亚、北非的居民属之,但芬兰人、拉普兰人等除外。 ②蒙古人种(黄种)。皮肤黄色,头发黑而直,头部几成方形,面部扁平,鼻小,颧骨隆起,眼裂狭细。西亚以外的亚洲人和北部的因纽特人、拉普兰人和芬兰人属之,但不包括马来人。 ③非洲人种(黑种)。皮肤黑色,头发黑而弯曲,头部狭长,颧骨突起,眼球突出,鼻厚大,口唇胀厚,多数人有八字脚。除北部非洲人外,其他非洲人皆属之。 ④美洲人种(红种)。皮肤铜色,头发黑而直,眼球陷入,鼻高而宽,颧骨突出。除因纽特人外,其他美洲原住居民属之。 ⑤马来人种(棕种)。皮肤黄褐色,头发黑而缩,头部中等狭细,鼻阔、口大。太平洋诸岛和马来半岛居民属之。这个划分可说是人种的地理分类。 其实,美洲的红种人并不存在,印第安人是黄色人种的一大分支,由于他们崇敬红色,常用红颜料涂脸,被误为红种人。再者,不同的人种有不同的血液特征、遗传疾并遗传基因等,所以,学者们都用各自不同的标准对人种进行分类。因此,对现代人种的分类问题,至今尚未取得一致的意见。不过50年代以后,在布氏分类基础上又增加了指纹、血型等指标,使人种的划分逐渐与现代科学结合起来,逐步形成了目前公认的人种划分标准。 黑种人起源于热带赤道地区,该地区在一年之内受到太阳的直射时间长,气温高,紫外线强烈。长期居住在此地的人群,经长期自然选择,逐渐形成一系列适应性特征:皮肤内黑色素含量高,以吸收阳光中的紫外线,保护皮肤内部结构免遭损害;体表汗腺密度特别大,以便在极度炎热时能维持或迅速恢复正常体温;鼻低宽,鼻孔通道短,嘴唇厚、嘴裂大、体毛少,便于散热;头发象羊毛一样卷曲,使每根卷发周围都有许多空隙,空隙充满空气,空气传热性差,因此,卷发有隔热作用,保护头脑不受伤害等。 白种人起源于较为寒冷地区,该地区阳光斜射,光线较为微弱,紫外线也弱,当地居民体内黑色素含量低,皮肤呈浅色;身体较粗壮高大,以减少热量散失;鼻子高窄,鼻孔通道较长,以预热吸进的冷空气;体表毛发密稠,以防寒冷等。 黄种人起源于温带地区,其肤色和身体特征的适应性具有黑白两色人种的过渡性。 近几百年来历史证明,以上三大人种的相互混合,又长期地稳定在一定的地域内,也能产生新的人种。如美国黑人其祖先来自非洲,它们与欧洲去的美国白人长期混合,现美国黑人体内已有20%以上白种人遗传因子,所以,在体质上已明显地区别于非洲黑人,构成新的人种。在巴西,则是印第安人、西班牙人、葡萄牙人、日本人、中国人等的混合,经过相当长的时期,也形成了新的人种——混血人种。 美国科学家S·M长恩,在经过长达10年的酝酿和调查之后,他认为全世界有9大地理人种,并划分出32地域人种。 1.美洲印第安人种 指欧洲人、非洲人到来之前,北起阿拉斯加,南至南美洲南端,包括整个南北美洲的原有居民。他们散布在偏僻的地区,以狩猎、采集或半农业为主,人口不多,在遗传上常呈完全独立的状态。其特征是具有棕黄色皮肤,黑色粗直的头发,铲形门牙,突出的颧骨,鼻梁较突,体毛疏少,在ABO血型系列中,O型、B型频率高,明显地不同于有联系的亚洲地理人种的血型。 2.波利尼西亚人种 指分布于东太平洋广大地区,自夏威夷和波利尼西亚群岛,直至新西兰一带的人群。 3.美拉尼西亚——巴布亚人种 指分布在新几内亚岛、斐济群岛和西色为棕色,宽鼻型,黑色头发呈直或卷曲状,体毛少,在ABO血型系列中,B型频率少。 太平洋其它岛屿的人群。其特征是皮肤呈暗棕色,圆型头,毛发卷曲,眉脊发达,鼻尖呈钩形,肩胛窄。 4.澳大利亚人种 指欧洲人到来之前,分布在澳洲的原有人群。其特征是褐色皮肤、波状或卷曲状头发,线状体型,有很大的牙齿、明显的眉毛脊,颌骨外突,体毛中等浓度,在ABO血型系列中,B型频率很低。 5.亚洲地理人种 主要指分布在亚洲大陆,乃至日本、菲律宾、苏门答腊、婆罗洲群岛等地的人种,又称为蒙古地理人种。其特征是皮肤呈浅黄色,头发黑而直,胡须与汗毛稀少,脸形扁平,颧骨较高,眼皮有波浪状的蒙古褶,在ABO血型中B型频率很高。 6.印度地理人种 指分布在南亚,自喜马拉雅山南麓到炎热的印度洋地区的人群。其特征是皮肤自北至南由浅色到深色,眼睛呈蓝色,头发呈黑色或黄色、直式波浪形,在ABO血型系列中B型频率高,不同于欧洲地理人种,而与亚洲地理人种相似。 7.欧洲人种 包括分布在欧洲的若干地域人种,以及部分散居于西亚、北非、西非等白色人种,又名高加索地理人种。其特征是肤色浅,鼻梁高窄,头发直硬或波浪形、呈金黄色或褐黑色,嘴唇薄,体毛浓度,胡须和腮毛特别发达。男子秃顶频率高,在ABO血型系列中,常掺入A2血型,Rn型频率高。 8.非洲人种 指分布在撒哈拉沙漠以南整个非洲在内的若干地域人种,又称尼格罗地理人种。其特征是皮肤黑至深褐色,头发短而卷曲,嘴唇厚而外翻,鼻子短宽,颌部明显突出,体毛稀少,在Rn血型系列中,R0型频率高,体内常具有对疟疾有相对免疫力的镰刀形血球。 9.密克罗尼西亚人种 指分布在密克罗尼西亚群岛,以及西太平洋一些岛屿的人群。其特征是身材矮小,肤色、毛色较深,长头型,头发多呈波纹形、螺旋形,全身多毛。血型频率与波利尼西亚人种相似,但B型频率较高。 长恩的九大地理人种分类的长处是简便好记,比较符合客观实际,因而受到学术界的重视和公认。但也有缺陷,如美洲印第安地理人种太大了;南美印第安人和北美印第安人在体质上也有明显的区别,应考虑分开归属问题。再如长恩的人种划分都局限在公元1500年以前(即地理大发现时代以前)的人种分类和分布,忽视了地理大发现时代及其以后,欧洲人、非洲人等向南北美洲、澳洲等地的大迁移,由此引起了人种大融合,从根本上改变了美洲、澳洲人种分布等事实。随着时间的推移,这种融合愈来愈靠近,由此可把南北美洲划为北美地理人种和拉丁美洲地理人种,是比较适宜的。 另外,还有报道称在热带雨林地区,考古探险队员曾发现罕见的绿色人种和蓝色人种,不过这些都没有得到充分考评。
我想,回复一下是我唯一能做的!
你要找论文吗看一下周一星写的人文地理学这本书你要论文资料的话把邮箱给我我们学校地理学很牛哦
摘 要 上海市城市轨道交通建设通车10年以来,对城市人口分布的影响逐步显现。通过分析上海市轨道交通1号线沿线主要区的近10年人口数量变动情况,说明轨道交通沿线中心城区是主要人口迁出地区,而沿线的近郊和郊区是主要人口迁入地区。作为人口迁入区的闵行区,新迁入人口主要分布在轨道交通沿线乡镇。城市轨道交通具有引导城市人口从高密度地区向低密度地区迁移分布的重要作用。关键词 城市轨道交通,交通廊道,人口迁移 轨道交通的建设,提高了沿线地域的可达性,进而改变沿线土地的利用类型,影响城市土地利用的空间分布。连接城市中心区与郊区的轨道交通则又是城市空间向外扩张的发展轴,郊区的轨道交通站点能够提高其周边土地的利用价值,促进郊区的城市化发展。而由轨道交通所引起的城市空间在结构和内容上的发展变化,都将影响城市人口流动,改变城市人口密度分布,诱导人们远离城市中心居住[1]。研究轨道交通对城市人口迁移的驱动作用,是研究城市轨道交通对城市发展与环境总体影响的一个重要内容,也是城市人口流动研究的补充。当然,影响城市人口迁移的因素非常复杂,包括社会、经济、政治、文化等多个方面。本文的目的是建立城市轨道交通系统与城市人口迁移的内在联系,证明轨道交通对城市人口分布会产生一定的影响。1 研究背景 基本资料 文中所用到的上海市各区县人口统计资料来自于上海市统计年鉴,其中闵行区各乡镇人口统计数据摘自闵行区统计局编写的《辉煌的成就》一书。人口统计数值表示该年份年末该地区户籍人口数。 上海轨道交通1号线简介 上海市轨道交通1号线是上海市第一条轨道交通线路,该线一期工程自1990年1月19日正式开工建设,1995年4月开始试运营;二期工程(由锦江乐园延伸至莘庄)于1997年7月1日通车;1号线北延伸线于2004年12月28日通车。本文所研究的范围只限于轨道交通1号线上海火车站———莘庄站区段。2 研究内容 上海市市区人口变动情况 本文选取1号线沿线的黄浦区、卢湾区、徐汇区、闵行区作历年的人口数据统计,并以普陀区为对照市区。图1为1号线沿线区域人口变化情况。黄浦区行政区划在过去10年间有所变化。本文所统计的黄浦区人口数为黄浦区和南市区人口总数。1992年以及1992年之前的人口数则包含有原黄浦区浦东部分的行政区域人口。 根据上海市发展历史以及现状,城市区域可分为中心城核心区、中心城边缘区、近郊区和远郊区[2]。黄浦区、卢湾区属于中心城核心区,全区或者大部分在内环线内;普陀区、徐汇区属于中心城边缘区;闵行区则属于近郊区。 中心城核心区人口逐年递减 从图1中可以看出,1993年之后,作为城市中心城核心区的两个区的人口数均呈现逐年递减。1995年轨道交通1号线建成通车之后,由于交通便利,路途花费时间大大减少,使得居住在郊区,工作、娱乐、休闲在市区成为可能。而在这之前,将居住地点尽量安置在繁华中心市区是市民的第一选择。黄浦区人口在1990—1993年间的变动趋势反映了上述情况。黄浦区人口从1993年始逐年减少:1993年户籍人口数为万,密度为65995人/km2;而2002年为万人,密度为50943人/km2,降幅达到。当然,1993年之前黄浦区人口数所表现的增加趋势也有可能是因为当时的黄浦区有部分行政区区域位于浦东,而浦东部分行政区域的户籍人口数逐年增加,并且增加量大于其浦西部分人口数的减少量。卢湾区的户籍人口数也呈现逐年降低的变化规律:在1993年,户籍人口数为万人,人口密度为52224人/km2;到2002年,户籍人口数为万人,人口密度为41465人/km2,降幅达。以上数据说明,轨道交通1号线沿线区域中的上海中心城核心区,户籍人口数逐年降低。 中心城边缘区和近郊区人口逐年增加 中心城边缘区的徐汇区,户籍人口数逐年增加:1993年为万人,人口密度为14008人/km2,2002年为万人,人口密度为16152人/km2,增幅为。近郊区的闵行区的户籍人口数量自1993年起逐年增加,到2002年人口密度增加至1927人/km2,增幅为。可见在地铁沿线区域中的近郊区和中心城边缘区,户籍人口数保持稳定的增加趋势。 普陀区属于中心城边缘区,地理区位与徐汇区相似,但其行政区域中并未建设有地铁线路,而轨道交通3号线在2001年开通,因此在本文所讨论的1990—2002年期间的人口迁移中未表现出较大影响。为此可将普陀区作为徐汇区、闵行区的对照。1988—1992年间,普陀区人口增长较快,从万人增加到万人,增幅为。但从1993年开始,普陀区户籍人口增加趋缓,10年间增加不到4万人,并且在1998和2001年出现户籍人口负增长。可见,在未建设有轨道交通线路的中心城边缘区区域,户籍人口数在近10年间增长缓慢,趋于稳定。在城市人口统计中,常常出现人户分离现象,即已经迁出的人口仍然保留其原居住地的户籍,或者已经迁入的人口并未更改户籍。我国的全国人口普查数据主要为当地常住人口。表2显示了本文研究区域的户籍人口数和人口普查数之间的对比。从表2中不难发现,中心城核心区的黄浦区、卢湾区在1990年时户籍人口数都低于普查人口数,而在2000年时户籍人口数均高于普查人口数。以常住人口考察这两个区的人口变动,在1990—2000年之间,减少量分别为万人和万人。人口减少量大于通过户籍人口数所表示的人口减少量,人口变动幅度更大。同样,徐汇区的人口变动,用人口普查数据表示,其增加量为万人,大于用户籍人口所表示的变动量。由于闵行区在1990年之时并未建区,因此仅有2000年的户籍人口数和第五次人口普查数相比较,其人口普查数大大高于户籍人口数。可以断定,该区的常住人口增量大于户籍人口数增量。普陀区的人口数量变动类似于徐汇区但又有所区别。上海市在近10年来,城市郊区的发展处于城市化阶段,上海中心城边缘区和近郊区不断繁华,因此普陀区的户藉人口数量在1990—2000年间持续增加。若以人口普查的常住人口为标准,则普陀区的增加量小于徐汇区的人口增加量。但是由于人口普查时间处于1990—2000年时间段的端点,不能判别其常住人口在这10年间的增长速度变化。所以,当时未建设轨道交通的普陀区常住人口增量小于轨道交通沿线的徐汇、闵行等区。 综上所述,在轨道交通沿线的上海市区中,中心城核心区的户籍人口数逐年降低,常住人口在10年之间减少量大于户籍人口数的减少量;而相对远离核心区的徐汇区、闵行区则表现出户籍人口数逐年增加的趋势,且2000年的常住人口远大于当年的户籍人口数,其常住人口增加量必定大于户籍人口数增加量。同时,地理区位相似于徐汇区的普陀区表现为户籍人口增加趋缓,且增加量低于徐汇区,也远低于闵行区的户籍人口增加量。 地区人口变动原因分析 地区人口变动有两个因素:①人口自然增长率;②人口机械变动,即迁出人口与迁入人口的对比[3]。就上海市而言,人口自然变动对城市人口数的影响不大,上海市区在1991年就开始出现人口负增长。据资料显示,近10年上海市区的人口自然减少不足15万人。因此,上海市区的户籍人口变动主要是因为迁入迁出人口对比。轨道交通1号线沿线的上海市中心城核心区黄浦区、卢湾区户籍人口数在近10多年来都大幅度下降,人口迁出是其关键原因。徐汇区、闵行区同样处于轨道交通沿线,但作为上海中心城边缘区和近郊区的这两个区域,在近10年中,户籍人口数持续增高,人口迁入是其主要原因。从高密度地区向低密度地区迁移,是轨道交通沿线市区城市人口再分布的主要方向。若以常住人口数衡量,在沿线的这4个行政区中,迁入迁出人口数都大于通过户籍人口数所表现出的迁入迁出人口数,人口从高密度向低密度迁移的表现更为明显。 闵行区乡镇人口变动 1992年新闵行区设立以来,该近郊区的经济建设硕果累累,人民生活水平不断提高,特别是轨道交通1号线沿线区域的城市化水平一直保持较高的增长速度。对此,城市轨道交通的作用可谓功不可没。在轨道交通沿线区域,交通可达性的提高,城市基础建设投资的加大,居住生活环境的改善,都强有力地吸引城市中心区的居民迁移入住。 图2为本文研究的闵行区部分乡镇与轨道交通1号线的区位示意图。图3为这些乡镇近10年来的户籍人口变动情况。轨道交通1号线通过的莘庄镇、梅陇镇保持稳定的人口增长,且增长速度较快:1992—2002年户籍人口增长率分别为和;颛桥镇的人口有所波动,1992—1996年间人口数量比较平稳,1996—1997年间却出现较快增长,2001—2002年间却出现很大的下降。2001年10月,闵行区调整所辖区域的乡镇行政区划,颛桥镇位列其中,因此,较大的波动可能是行政区划的变革所引起。而浦江镇和虹桥镇的户籍人口数基本稳定在一定的数值范围内,前者在9万~万人之间,虹桥镇户籍人口在2万~3万人之间。在城市轨道交通通过提高沿线地域的可达性来提高沿线土地的利用价值、带动沿线区域的城市化进程中,沿线区域的人口集聚程度主要还表现在非农业人口数量的提高。图4反映了上述乡镇的非农业人口数量的变动。莘庄镇和梅陇镇非农业人口数量从1992年起高速增长,到2002年分别从23224人和14642人增加到71172人和65942人,增长率分别达到了和。从变化曲线图中可以看到,它们的增长速率相当,并且到2002年止依旧保持较高速度的人口增长率。其它3个镇则表现出与莘庄、梅陇不同的变动状况:颛桥镇和浦江镇的非农业人口以缓慢的速度增长,10年间的增加量不足1万人;而虹桥镇的人口变化在10年间有所起伏,1996年之后以较低的增长速率持续增加。 非农业人口数量高速增长的莘庄镇和梅陇镇都位于轨道交能1号线沿线,这说明轨道交通能够加大非农业人口的集聚。在轨道交通1号线沿线区域,建成有大量的住宅区,并以轨道交通1号线为一条城市扩展的轴线,住宅区不断的向外沿辐射扩展。正因为此,距离轨道交通1号线终点站不远的颛桥镇,非农业人口的增长速度略大于浦江镇和虹桥镇(这两个镇的非农业人口增长比较缓慢)。虹桥镇可能是因为城市化进程已经接近或达到完成阶段,因此变化量不大。浦江镇位于黄浦江以东,所辖区划面积较大,而非农业人口仅占全镇人口的,城市化水平较低;同时,浦江镇距离城市轨道交通较远,并未受到轨道交通系统建成通达之后的有利影响。所以该镇的城市化进程缓慢与其可达性较低有一定关系。 通过上述对闵行区部分乡镇人口变动以及乡镇区位与轨道交通线路相对位置的分析可知,城市郊区的轨道交通对沿线区域人口具有集聚效应,轨道交通的通达有利于加快该区域城市化进程。3 结论 上海第一条城市轨道交通线自1995年通车以来,对城市人口的迁移作用非常明显。在上海城市发展过程当中,轨道交通的建设对于改变城市人口密度分布,引导城市人口从中心城区向城市近郊区迁移具有重要作用。本文通过对上海市轨道交通1号线沿线区域的人口变动分析,可以得出以下结论:(1) 轨道交通线路通达的上海市中心城核心区是主要的人口迁出地区;(2) 轨道交通线路通达的近郊区和郊区是主要的人口迁入地区;(3) 近10年来,轨道交通改善了郊区的可达性,大大促进人口从高密度区域向低密度区域持续迁移。参考文献1 秦应兵,杜 文.城市轨道交通对城市结构的影响因素分析.西南交通大学学报,2000(6):284~2872 高向东,江取珍.对上海人口分布变动和郊区化的探讨.城市人口,2002,26(1):66~693 彭镇伟,路建普.上海城市人口布局优化研究.城市规划汇刊,2002(2):21~26
我认为可以从人口地理学角度出发,以我国人口分布特点概述基础上探讨分布的影响因素。影响因素可以从一下角度出发:1. 自然因素(气候、地形、土壤、水体和矿产资源等)2. 社会经济因素(生产方式和生产力水平、经济发展水平、经济活动方式和交通运输条件)3. 历史因素和政治因素最终完成分析。
现状:东部多、西部少;平原盆地地区多,山地、高原地区少;农业地区多,林牧业地区少;沿江、临海公路,铁路沿线地区多,交通不便的地区少。人口分布这种不平衡状况,是旧中国多年来生产分布不平衡、不合理的产物。1、东部人口稠密,西部人口稀少。2、全国人口在省、区的分布,其所占的比例和密度差异很大。影响我国人口分布不平衡的主要因素,由于我国人口处于漫长的封建社会历史时期,绝大部分人口都从事于农业生产活动,东部地区的湿润区域及平原、盆地与河谷地带的生态环境最适宜发展农业生产,从而集聚和分布了较多的人口。反之,在自然条件较并、不利于农业生产的西部地区,土地开发利用受到限制,人口分布稀疏得多。 趋势:会越来越像城市,大城市集中,以及东部地区,或者说经济发展程度高的地区集中 但是相信随着科学技术的发展,人们对生活空间和品质的要求,城市交通的方便快捷,到一定程度的时候,就会开始出现往乡村扩散
中国是一个经历了人口迅速转变的人口大国,也是一个正处于经济迅速发展和社会、文化巨大变革的发展中国家,同时还是一个生态环境处于敏感时期的国度,在这样一个国家的这样一个历史时期,其人口问题的研究因而也具有了世界意义和世纪意义。 从本质上讲,人口问题是指人口过程内部以及人口过程与其它社会、经济或自然过程之间出现的矛盾或者失衡,并导致了不利后果或负面影响。严格来讲,所谓人口问题应该划分为两类:一类是人口过程内部出现的矛盾或者失衡;另一类是由于某种人口现象或人口变动与社会、经济、生态环境等某个(些)方面产生了矛盾或者失衡。后一类问题的出现则有三种情况:其一,主要是由人口变动或人口现象导致的,我们可称其为人口主因的社会、经济或环境问题;其二,人口作为次要因素和其它因素相互作用的结果,我们可称其为人口次因的社会、经济或环境问题;其三,是由于社会、经济、或生态环境条件变化导致的人口过程内部的失衡,我们可称其为社会、经济或生态环境主因的人口问题。其中,第一种和第二种情况是人口相关问题,本质上属于社会、经济或环境问题,而第三种情况和前述第一类问题则属于人口问题。正确认识人口问题的本质,将直接影响到我们对21世纪中国面临的主要人口问题的准确判断,以及应对和解决这些问题的对策的制定及其执行效果。 21世纪中国面临的人口问题和人口相关问题将会更加复杂和多变,其影响在宏观和微观两个层面上都将更加凸显。面对这种形势,一方面,我们需要树立正确的人口价值观和科学的认识论,坚持人口问题和人口相关问题研究的综合性、实证性、社会性和微观化;另一方面,我们需要拥有一支专业复合型的人才,并吸引更多的相关学科领域的学者加入人口问题和人口相关问题的研究,各相关学科领域学者在共同研究中的互补、互动将会成为21世纪中国人口科学研究的重要特色。
我想,回复一下是我唯一能做的!