1、频数分析:
对一组数据的不同数值的频数,或者数据落入指定区域内的频数进行统计,了解其数据分布状况的方式。通过频数分析,能在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差,并以此证明以后相关问题分析的代表性和可信性。
2、描述性统计:
对调查总体所有变量的有关数据进行统计性描述,包括数据的集中趋势与离散趋势。
3、探索性分析:
正态性检验用于检验数据是否满足正态分布,一些算法需要数据满足正态分布(如单样本T检验,独立样本T检验等)。
毕业论文数据分析的做法如下:
首先,针对实证性论文而言,在开始撰写论文之前,必须要提前确定好数据研究方法。而数据研究方法的确定与选择需要根据大家毕业论文的研究课题来确定。
另外,大家也可以跟自己的的论文指导老师多多交流,尽可能多的了解更多关于研究方法的知识,以供自己选择。除此之外,大家还需要大量查找文献资料,见多识广有大量输入之后才能有所输出,本环节需要大家跟导师沟通商议后决定。
接下来一个比较重要的步骤是搜集和整理实验数据。在这一部分,很多同学朋友都会遇到各种各样的问题,比如,不知道去哪里找数据,找到的数据可靠性无法保障,需要的数据总是无法搜集全面等等各种问题。
那么在这里需要跟大家强调一下,推荐大家使用国家统计局、中国统计年鉴、国泰安、万方等等这些比较权威的网站去搜集数据资料。
在此需要注意的是,国泰安和万方等这些网站是需要收费的,上去看了一下,价格不是很亲民。
给大家分享一下,如果有些数据在国家官方网站确实找不到或者毕业论文所需的最新数据还没及时发布,推荐大家可以上某宝,因为某宝上电子版数据往往都很全面,而且价格大都可以接受。
在此提醒大家搜集到数据之后,一定要按照自己的习惯整理保存好,避免后期使用数据时出现差错。
统计描述一般指的是均数、标准差等
数据源:(是什么)研究区域描述:(如果你研究的是区域的话,要写出研究区域你要研究的那一方面的发展概况)数据处理方法:你用了什么方法,仔细描绘,比如怎么选取变量,有无修正参数或部分数据啦等等,怎么检验你处理的方法是否恰当啦
统计描述一般指的是均数、标准差等
数据源:(是什么)研究区域描述:(如果你研究的是区域的话,要写出研究区域你要研究的那一方面的发展概况)数据处理方法:你用了什么方法,仔细描绘,比如怎么选取变量,有无修正参数或部分数据啦等等,怎么检验你处理的方法是否恰当啦
,上去看看。
第一节论文写作的八个环环相联的步骤严格地说,论文写作并不是从提笔写(或在电脑上打字)开始的。此前的许多步骤都属于论文写作的必要环节,一定程度上比实际动手写重要得多。许多过来的人都有体会,完成一篇较大的论文,准备时间少则数月,多则数年,一旦真正准备好了,动手写作的时间不过数天到数周。第一步,确定论文的选题。从广义上说,选任何本专业范围内的题目都能够写出东西来,只要你有新观点、新发现、新角度、新研究方法、新材料等等。但是这后面的“五新”大大限制了硕士论文的选题。这是由于作者多数是第一次写这么长的学术论文,缺乏经验,也缺乏深厚的知识积累,难以把握;同时,二三万字这个条件也对选题有很大的制约,如果题目过大,无法在这个相对狭小的范围内展开。所以,选题是否得当,对于论文的成功,影响很大,甚至有人说,一个好的选题等于成功了一半。根据许多硕士论文的选题经验,这一级论文的选题可从以下几方面考虑:本专业的研究空白、发生争议的话题(自己的观点感到较为充分)、对比性的话题、从其他专业角度研究本专业的话题(这是一种选题的边际效应)、有新的插入角度的老话题、刚刚冒出来的本专业的新问题。第二步,围绕已经确定的论文选题,回顾相关的理论和研究,或者叫“文献检索”。这一步的工作是较为艰苦的,需要有思想准备。在我国,多数中文学术资料目前没有上网,需要手工查找,因而这个步骤中查找中文资料花费的时间和精力可能很大;拉丁文资料,特别是英文资料由于网络传播的方便条件,相对好查询。但是不少资料即使找到了目录,真正能够阅读到,仍需要作者不懈的努力。这一步是必要的,如果没有这一步,你的论文内容很可能重复了别人已经做过的工作,等于白做;查找的过程,也是启发思路、产生观点火花的过程,不走这一步,等于掐掉了自己新观点、新视角、新材料的来源。这也是为下一步做观点、角度、材料上的准备。第三步,提出你自己关于选题的理论假设,或要研究的具体问题。选题是指准备写的论文的大体方向和范围,真要动手写作,就会遇到两类具体的问题。第一类属于观点方面的:我的具体观点是什么?你可以设想出一个或几个观点,但它们仅仅是一种假设,通过许多证据、材料,通过严密的论证和适当的论证框架结构,证明你的假设是成立的,这才能形成论文的主体。第二类属于实用方面的:我要具体论证什么问题?你可以提出许多原因、各种环境条件的影响,它们是不是与所论证的问题相关,相关到什么程度,这需要通过科学的调查和分析。不论哪一种情况,这涉及论文的中心思想或论证主题,一定要明确,并且贯穿论文的始终。由于硕士论文字数相对长,常见的问题之一,在于作者把握不住全文,写着写着,无形中脱离了自己原来确定的假设或具体问题,说了许多无关中心思想或论证主题的内容。第四步,决定采用哪些研究方法。人文-社会科学的研究方法,大体可以归为两大范畴,思辨研究和实证研究,后者又可分为定性研究、定量研究两种具体的研究方法。人们为探究社会事实或社会现象,而采用不同的研究取向,不同的研究取向又有不同的研究方法,不同的研究假设、收集资料的方式和对结果的判断标准。但是各种研究方法在现在的论文写作中,已经越来越多地呈现相容和内在的连接。一般地说,根据自己的选题和讨论的具体问题,可以以一种研究方法为主,辅以其他的方法。例如研究“人”作为大众媒体信息的接受者其接受信息时的状况,这种研究取向就决定了研究本身要以定量分析为主,但同时也需要一些历史的、文化的、政治经济学的思辨研究。在文科硕士论文中,作者直接为论文进行的定量分析,规模一般较小,适应的范围也是有限的,较多地采用别人而不是自己直接的调查结果。这是由于论文的规模较孝给予作者的研究经费有限、作者个人进行社会调查的能力有限等原因造成的。以逻辑分析为主的论文,适当采用一些定量分析的数据,有时会给文章增添一些分量。但是,一定要根据实际需要,而不要为了显示研究方法的多样而有意去做。例如一个很宏观的话题本来适于思辨研究,硬要加进一项微观的量化调查结果证明什么,反而会弄巧成拙。这是现在写好论文要把握的一个具体问题。第五步,设计论文的框架结构。一般文章的写作也需要有这一步,但对硕士论文来说,更为必要,其要求也更细一些。一般情况下,一篇硕士论文要有绪章、入题的第一章、主体章节,以及结束语。章节的设置在写前要有个大体的布局逻辑,使之结构合理;章和章之间有一种逻辑联系,防止盲目写下去,淹没主题,不知所云。这一步很少有一次完成的,往往会根据收集材料的情况、调查访问中遇到的新情况,经常变动。但是就像建筑师在盖房子前必须有图纸一样,到了写硕士论文这个层次上,大体的文章框架不能仅仅存于脑子中,一般要形成文字,相对细致一些,具体到“节”更好(但“节”的层次开始时不要固定化),便于写作时心中有数。到了设计论文框架这一步,因为有了文字化的章节设计,除了请导师指导外,这是在正式动笔写前较广泛地征求其他专家意见的一个好机会。框架还不是厚厚的论文,看时花费的时间不多,又可以大体看出文章的价值或存在的问题。这时修改论文结构比写完后修改要轻松、容易得多,时间也较为宽余,不要错过这个机会。第六步,对已经取得的文献资料、调查材料和各种论据进行分析、归类,分别充实到各章节中,再进行解释、论证。这实际就是论文写作本身,所以这样描述,意在让作者理解论文写作的过程。各种材料和论据,不是天生就可以证明论点或说明具体问题的,需要通过作者对材料的组织和论证,才能使其变得富有生命力,极其自然、有力地为自己所论的题目服务。在这一步,需要温习一下学过的逻辑学或社会调查统计的知识,用正确的逻辑思维和严谨的数据组织方式,紧紧围绕已经确定的理论假设或具体问题,调动自己所学的各种知识,通过正论(这是主要的)、反论、设论、驳论、喻论等等手法,论证观点或问题,得出结论,完成论文。论证中肯定会出现种种材料使用或缺乏的问题、逻辑推理的问题、论据与论题不相配的问题等等,需要停下来再找材料和访问专家,充实或削减原来论文框架中的内容,必要时对框架结构进行局部调整。这种情形是正常的、经常发生的。在时间的安排上,对此要作出计划。如果时间安排不当,有时论文功亏一篑的原因就在于写作时间安排过紧,来不及调整论文结构,这很不值得。第七步,必要时重新估量选题,修正论证对象的范围。这是与第六步同时出现的另一种情形,即通过较为广泛地征求意见和本人的思考,感到原来的选题对自己不适当,或难以完成,那么就要及时调整整个论文写作的计划,改变选题。这种情形也是正常的,关键在于不要长时期犹豫不决,必须较快地作出决定,以便有时间重起炉灶。由于前面已经对本专业的学术研究有过较多的思考和文献检索,即使改变选题,重新做起,花费的时间不会很多,对此过多的担心是不必要的。选题不当、难以完成的另一种情况不在于选题本身,而在于选题论证的范围过大。解决这个问题并不难,把论证对象的范围缩小就是了。这里最大的障碍在于作者舍不得“割爱”,花费了许多功夫准备论文,一旦许多材料用不上,难以割舍。这种情况当然会涉及到重新设计论文框架结构的问题。不过,将较大的论证对象的范围缩小,总比相反的情形要容易得多。硕士论文写作中,论证对象范围过小的情况很少见,因为二三万字的论文,本来大多适宜开口较小的选题。第八步,对论文从技术上进行规范化的检查和调整。章节设计的技术问题(含目录)、文中的引证标示、注释及编号、文后的参考文献编排,以及不属于论文本身的内容提要(包括英文提要)、关键词等等,都要按照规范化的要求进行检查和调整。这些虽然属于技术性问题,但也反映出作者的治学态度。特别是引证,凡是使用了别人观点的地方,都必须注明材料来源,不能含糊不清,更不能将别人的研究成果变成自己的。标明的材料来源也要十分清楚,论著名称、作者或编者、出版社或发表的刊物名称、出版或发表时间等等,一应具全。有时,一篇较有水平的论文,答辩时提出批评的主要问题是引证的不规范,由于这个原因使论文的评价低一档,这很不值得。第二节论文的选题:一个适当的选题等于论文成功了一半由于十年“文化大革命”这场浩劫,我国的人文-社会科学研究遭到了毁灭性的破坏,林彪、“四人帮”在意识形态领域的种种谬论充斥人文-社会科学的各个学科。1978年我国恢复研究生招生时,人文-社会科学研究几乎一切从头开始,因而研究生的论文选题还没有显现为一个问题,因为写什么题目,即使不是空白,也是需要重新认识和论证的。经过改革开放后二十多年几代人文-社会科学研究者的努力,我国的人文-社会科学研究呈现一派繁荣的景象,研究生的招收数量大幅度提高。年年招生,年年写新的论文,而各学科的研究领域是相对稳定的,空白越来越少,新问题的研究又有一定难度,于是现在文科研究生的论文选题,形成一种独特的竞争局面,如何选择好论证的题目,凸现为一个新问题。有鉴于此,需要重点谈谈硕士论文的选题问题。
1、频数分析:
对一组数据的不同数值的频数,或者数据落入指定区域内的频数进行统计,了解其数据分布状况的方式。通过频数分析,能在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差,并以此证明以后相关问题分析的代表性和可信性。
2、描述性统计:
对调查总体所有变量的有关数据进行统计性描述,包括数据的集中趋势与离散趋势。
3、探索性分析:
正态性检验用于检验数据是否满足正态分布,一些算法需要数据满足正态分布(如单样本T检验,独立样本T检验等)。
这个建议你 查十篇左右的文献 看看以前发表的毕业论文都是怎么写的 然后还可以跟上一级打听下 或者跟指导你毕业的老师咨询下 找到一个研究样本之后 再想怎么做 论文题目不急
***统计方法的应用
SPSS软件是“统计产品与服务解决方案”软件,是数据统计分析的一个重要的工具。下文是我为大家整理的关于spss统计分析论文的 范文 ,欢迎大家阅读参考!
统计分析软件SPSS的特点和应用分析
【摘要】通过文献资料法,介绍了统计分析软件SPSS的特点,并通过实例:用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的应用做了详细的介绍,旨在为学习SPSS软件的人们提供参考。
【关键词】统计分析软件;SPSS;独立样本;非参数检验
一、前言
统计分析软件SPSS是一款统计产品与服务解决方案的软件,其全称为“统计产品与服务解决方案(Statistical Product and Service Solutions)”。该软件是一款在统计中应用很广的统计分析软件,目前在各专业 毕业 论文经常可以看到它的身影,其应用范围广、方便快捷等特点吸引着众多的 爱好 者。本文通过对统计分析软件SPSS的功特点进行介绍,通过举例用非参数检验中的两个独立样本的检验(Test for Two Independent Sample)进行分析,对该软件的操作用做了详细的介绍,为学习SPSS软件的人们提供参考。
二、SPSS软件的特点
(一)操作简便
SPSS软件的界面非常友好,除了数据录入及部分命令程序等少数输入工作需要键盘键入外,大多数操作可通过鼠标拖曳、点击“菜单”、“按钮”和“对话框”来完成。
(二)编程方便
具有第四代语言的特点,告诉系统要做什么,无需告诉怎样做。只要了解统计分析的原理,无需通晓统计 方法 的各种算法,即可得到需要的统计分析结果。对于常见的统计方法,SPSS的命令语句、子命令及选择项的选择绝大部分由“对话框”的操作完成。因此,用户无需花大量时间记忆大量的命令、过程、选择项。
(三)功能强大
具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。
(四)全面的数据接口
能够读取及输出多种格式的文件。比如由dBASE、FoxBASE、FoxPRO产生的*.dbf文件,文本编辑器软件生成的ASCⅡ数据文件, Excel 的*.xls文件等均可转换成可供分析的SPSS数据文件。能够把SPSS的图形转换为7种图形文件。结果可保存为*.txt,word,PPT及html格式的文件。
(五)灵活的功能模块组合
SPSS for Windows软件分为若干功能模块。用户可以根据自己的分析需要和计算机的实际配置情况灵活选择。
(六)针对性强
SPSS针对初学者、熟练者及精通者都比较适用。并且现在很多群体只需要掌握简单的操作分析,大多青睐于SPSS,像薛薇的《基于SPSS的数据分析》一书也较适用于初学者。而那些熟练或精通者也较喜欢SPSS,因为他们可以通过编程来实现更强大的功能。
三、实例分析――两个独立样本的检验(Test for Two Independent Sample)
例题:为了调查甲、乙两地土壤对 种植 同一种西瓜有没有影响,从这两个产地分别随机抽取同种的8只和7只西瓜,称重后得重量(市斤)如下:
甲(斤):、、、、、、、
乙(斤):、、、、、、
问:根据样本数据检验两地的土壤对种植西瓜在重量上是否有显著差异?
解:建立假设 H0:甲乙两地的西瓜重量没有显著差异;
H1:甲乙两地的西瓜重量有没有显著差异。
然后根据上面给出的数据建立数据文件,注意数据文件中有一个表示重量数据的变量和一个表示地区分组的变量。最后在数据编辑窗口进行检验。检验的具 体操 作过程如下:
第一步:单击Analyze Nonparametric Test 2 Independent Sample,打开Two-Independent-Sample对话框(见图1)。
第二步:选择检验的变量进入检验框中,选择分组变量进入Grouping Variable框中,单击Define Group键,打开Define Group对话框,将分组变量值分别键入两个框中,单击Continue返回主对话框(见图2):
第三步:在Test Type栏中,确定检验方法。
SPSS中提供了四种检验方式,几种检验方法侧重点不同,但都是先把两样本数据混合排序,再从不同的角度分析并检验两个独立总体的分布是否有显著的差异。有时这几种检验结果可能不一样,所以要结合数据的探索分析考察数据的分布状况作出结论。本文选择了常用的Mann-Whitney U曼―惠特尼检验和Kolmogorov-Smirnov Z K-S检验。
第四步:选择输出的结果形式及缺失值处理方式;
第五步:单击OK,得输出结果。
所以,以上两种检验结论是一致的。也就是说在两地种植的同一种西瓜地重量没有显著差异。
参考文献
[1]杜志渊.常用统计分析方法―SPSS应用[M].山东人民出版社,2011.
[2]刘宁元.运用SPSS对高职专业课程成绩进行相关分析[J].电脑与电信,2007(3).
[3]井海立.SPSS在数学试卷统计分析中的应用[J].科技信息(学术版),2006(10).
试谈SPSS软件在考试数据统计分析中的应用
摘要: SPSS软件是数据统计分析的一个重要的工具。本文作者利用SPSS软件对考试数据的相关性、检验假设进行了统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤,文中的方法对考试研究人员具有一定的指导意义。
关键词: SPSS软件 考试数据 统计分析 操作步骤
1. 引言
一份好的试卷须有好的测量指标来表明它的优良程度,试题有难度和区分度指标,试卷有效度和信度指标,这些是评价考试最主要的测量指标,但是仅有这些指标不足以反映一份试卷的实际测量效果,考试研究人员希望从考生的试卷统计分析中获取更多的信息来评价一份试卷。在计算机未普及的年代,考试成绩统计主要依靠人工阅卷,考试数据无法电子化存储,对考试数据分析统计难以实现。随着计算机的普及和信息化的推广,各种分析数据的软件应运而生,这些软件中汇集了统计学和测量学的分析工具,使得应用电子信息技术分析统计考试成绩数据成为可能,这些统计信息可以为教研部门、考试行政部门进行行政决策等提供非常重要的帮助。在众多的统计分析软件当中,SPSS是应用最多、影响最广泛的分析工具之一。在本文中,我们以SPSS软件为工具,对 教育 招生考试成绩的数据进行统计分析,分析主要着重于考试数据的相关性、假设检验等几个方面。
2. SPSS分析软件简介
“SPSS统计分析软件”的英文名称为“Statistical Package for the Social Science”,中文名称为“社会科学统计软件包”,它是世界著名的统计分析软件之一,在自然科学、社会科学的各个领域均有非常广泛的应用。SPSS是一个组合式软件包,它集数据整理、分析于一身,主要功能包括数据管理、统计分析、图表分析、输出管理等,该软件的统计分析过程包括描述性统计、均值比较、一般线性模型、相关分析、回归分析、对数线性模型、聚类分析、数据简化、生存分析、时间序列分析、多重响应等几大类。
下面我们利用SPSS软件对考试数据的相关性、检验假设进行统计分析,介绍使用SPSS进行统计分析的一般方法和步骤。
3. 相关性分析
教育考试中,考试结果的信度,试题的区分度,每个题目得分与试卷总分的关系,以及题目之间的关系,等等,都是考试研究的重要内容,最主要的研究方法就是数据的相关性分析。在众多的教育考试数据的相关性分析方法中,Pearson相关系数法、Spearman相关系数法和Cronbach α信度系数法是比较常用的几种方法。
Pearson相关系数法计算公式:
式中x为第i个考生第j题的得分,y为第i个考生第k题的得分,为第j题的平均分,为第k题的平均分,n为测试样本量。该公式既可以计算两个连续变量之间的相关性,又可以计算一个双歧变量与一个连续变量之间的相关性。
Spearman相关系数法计算公式:
r=1-(2)
式中D为两个变量的秩序之差,n为样本容量。
Cronbach a信度系数法计算公式:
α= 1-(3)
式中n为试题数,s为第i题的标准差,s为总分的标准差。该公式实际上就是将考试中所有试题间相关系数的平均值(又称内部一致性)作为α信度系数。
对于给定的一组考生成绩数据,利用SPSS统计分析软件可以非常容易地定量分析考生某学科试卷总分和该学科某道题的相关性,以及各个题目之间的相关性。我们以Pearson相关系数分析为例,利用SPSS软件进行统计分析。
数据统计分析的对象是某省高考数学6道解答题的得分情况(不是整张试卷),数据源于该省的高考数据成绩。研究的目的是测量6道解答题每两个题目之间的相关性。
我们以SPSS 版本的软件为例,介绍利用SPSS进行数据统计分析的步骤(以Pearson相关系数法为例):
(1)将考试数据导入SPSS软件,在SPSS数据窗口中,顺序点击【Analyze】→【Correlate】→【Bivariate...】,系统弹出变量相关系数设置对话框。
(2)在该对话框中,将待计算的变量从左侧的变量列表中导入到右侧的“Variables”变量列表中,在本例中导入t1、t2、t3、t4、t5、t6共6个变量(t1―t6是6道解答题的变量名称)。在“Correlation Coefficients”相关系数选项中,选取“Pearson”复选框。
(3)在该对话框的“Test of Significance”设置区域,可以点选“Two-tailed”选项或者“One-tailed”,我们采用系统默认值。
(4)对话框中的 其它 选项取软件系统的默认值,点击【OK】,开始相关系数计算,系统弹出新的窗体输出运算的结果。本次输出的情况如下:
上表的统计结果可用于题目之间相关性的分析。表中的大部分题目的相关系数都比较适中,但题目T4和题目T5之间的相关程度远高于其它几个题目,我们可以确信这两者之间一定存在着比其他题目之间更紧密的关系,这是我们通过分析获取的重要信息,该信息表明这两个题目之间的相关性高于其他几个题目之间的相关性,这在大规模考试中是不应该出现的,需要在以后的命题考试中加以改进。
Spearman相关系数分析方法和上述分析方法类似,只需要在上述SPSS操作的第二个骤中选取“Pearson”复选框,程序就会按Pearson相关系数法进行统计分析,如果同时选中“Spearman”和“Pearson”复选框,程序将会同时计算按两种分析方法统计分析的数据,并会以不同的图表进行显示,而Cronbach a信度系数法计算方法与上述方法略有不同,其操作步骤如下:
(1)在SPSS数据窗口中,顺序点击【Analyze】→【Scale】→【Reliability Analysis...】,系统弹出“Reliability Analysis”信度分析设置对话框。
(2)将待计算的变量从左列的变量列表中导入到右侧的“items”变量中,在左下列的“model”选择项的下拉列表中确保选中“Alpha”(信度系数),点击“Statistics”选择项可以进行更为详细的参数设置,我们采用系统的默认值即可。
(3)参数设置完毕之后,点击【OK】,软件开始相关系数计算并输出运算结果。
4. 选择题的选项分析
在目前的教育招生考试中选择题是一种较常见的题型,考试研究人员关注较多的是对选择题基本特征、测量功能及其优缺点的理论探讨[1][2],对选择题干扰项的设计及其施测后的实际效果关注甚少,事实上施测后对题目各选项的有效性作出判断可为评价试题质量提供重要参考依据。我们利用统计中χ检验假设,对试卷中常见的选择题选择项进行统计分析。
教育考试的单项选择项一般设置为4个,其中仅有1个选择项是正确的。命题人员在设计选择项时,应当也必然对每道题目所有的选择项(正确选择项和干扰选择项)的考生作答情况作出预测,对考生作答的分布情况作出预估。考试结束后,研究人员应该对实测的情况与命题教师预测的情况进行对比分析,以检验考试效果是否达到了预测的目标。这和χ拟合度检验的思想具有一致性,因此可以尝试使用χ检验假设进行分析。
我们依据文献[3][4]的方法来介绍χ检验假设在考试数据分析中应用的基本原理,设变量E是命题者对某道试题的期望值,E=nP,n为样本容量,P为期望的相对频率,引入以下统计量:∑(O-E)/E,其中O为观察频数。
本文为全文原貌 未安装PDF浏览器用户请先下载安装 原版全文
我们需要进行的假设检验是:零假设H:选项的实测分布与期望分布相同;非零假设H:选项的实测分布与期望分布不同。
检验假设的思想:拟合度检验的统计量在确定的某种显著性水平下如果零假设是真,则检验统计量∑(O-E)/E呈近似χ分布,其自由度为研究变量的可能值减1;如果实测分布与期望的分布相当吻合,就不排除零假设,否则就排除零假设;最后对检验假设的结果进行解释。
数据分析的目的是判断考生实际的应答结果(实测数据)与命题期望的选择概率(期望数据)是否一致。我们随机抽取某省5542个高考考生的数学有效数据构成分析样本,利用SPSS进行统计分析。
SPSS数据统计分析的步骤如下:
(1)将考试数据导入SPSS软件,依次点击【Analyze】→【Nonparametric Tests】→【Chi-Square...】,弹出“Chi-Square Tests”对话框。
(2)将变量列表中待分析的题目序号导入到“Test Variables List”(检验变量列表)中,本例中题目的序号为t7。
(3)将对选择试题的每个选项的期望值依次输入到“Expected Values”所属的方框,具体操作方法是选中单选框“Values”,输入具体的期望数值,点击“Add”按钮,依次重复上述的步骤直至所有的选项的期望值输入完毕。
(4)点击【OK】,输出软件运算结果。
我们需要进行的假设检验,H:选项的实测分布与期望分布相同;H:选项的实测分布与期望分布不同。
假设检验的显著性水平为α=,χ=∑(O-E)/E,自由度为df=4-1=3,查χ分布表或利用相关软件可得P=,由于P>α,因此不能拒绝零假设,即选项的实测分布与期望分布相同。因此,检验结果在显著性水平时,没有足够的证据拒绝零假设,即可认为本题选项的实测分布与期望分布相同,也就是说本题的实际测试效果与命题教师预测的效果是一致的,命题教师准确地估计了考生的实际水平,这是分析获得的很重要的结论。
5. 结语
SPSS软件在考试数据统计分析中应用广泛,但大部分是集中在试题难度、均值、方差统计、考试数据的图表显示等几个方面,本文从一个新的角度利用SPSS软件对考试数据的相关性、检验假设等几个方面进行了尝试性统计分析,介绍了使用SPSS进行统计分析的一般方法和步骤。从上述分析来看,软件操作步骤和统计分析过程十分简单、快捷,对于测量学和统计学基础不太好的数据分析统计人员来说,只要遵循一定的操作步骤,就可以进行分析。
参考文献:
[1]王孝玲.教育测量(修订版)[M].上海:华东师范大学出版社,2006.
[2]雷新勇.大规模教育考试:命题与评价[M].上海:华东师范大学出版社,2006.
[3]李伟明,冯伯麟,余仁胜.考试的统计分析方法[M].北京:高等教育出版社,1990.
[4]雷新勇.考试数据的统计分析和解释[M].上海:华东师范大学出版社,2007.
猜你喜欢:
1. 统计学数据分析论文
2. spss统计分析实习心得
3. 统计学学年论文
4. 统计学分析论文
用EXCEL对论文数据进行分析,不是不可以做。但是一定要把握几个原则,首先你得要走专业数据的标准,换句话说,假设你的某项指标的系数标准是之间,你得要有标准,这样的话就可以进行分析!当然你得需要提供表格模板!让答辩者按照你的格式填写,你就可以用excel分析了!
(数据挖掘)上有很多文献是处理数据的,你去找些资料参考下
1:excel虽然内置有数据分析模块,但是毕竟不是专业的数据统计分析软件,功能上受限很多。2:当然我们平时的大部分数据分析工作,无论是课程、毕业论文需要的,大家可能更习惯于使用专业的Eviews、SPSS、Stata、Minitab,甚至计量和统计科班的大神们都在用SAS、MATLAB或者R语言、Python语言。3:今天给大家推荐的两款excel数据分析插件内存小,内置于excel工具栏随点随用,仅仅包含常用功能,界面简洁。4:第一款6SQ统计是国内一家叫做六西格玛网的公司开发的,主要用于品质管理,不过常用的统计功能和数据分析模块都具备。一共有两个版本:开发版(收费)和个人版(免费),经过试用,两个版本功能差别不大。
一般没有,主要是看你的指导老师
问题一:怎样进行论文数据分析 请在此输入您的回答,每一次专业解答都将打造您的权威形象数据源:(是什么) 研究区域描述:(如果你研究的是区域的话,要写出研究区域你要研究的那一方面的发展概况) 数据处理方法:你用了什么方法,仔细描绘,比如怎么选取变量,有 *** 参数或部分数据啦等等,怎么检验你处理的方法是否恰当啦 问题二:论文结果分析怎么写 结果是你实验过程中记录的各项变化和数据。列出图、表更直观一些。并且要做一下适当的说明。 分析是将这些结果说明了什么写出,即结论,同时是否与你的预期一致,还有你的实验结果有什么意义。 如果结果与预期不符,说明一下原因或可能的原因。 问题三:有数据了怎么写数据分析的论文 20分 数据了,写数据,分析的 问题四:论文的数据分析怎么写 你可以把数据发给我看看,我帮你看下 问题五:关于毕业论文的数据分析 我觉得你先要明白想用这些数据得出怎么样的结果 然后我就知道怎么样进行数据分析 数据分析只是方式,前提是你要明白自己的目的 问题六:论文中数据显著分析,怎么做是啊a,b,c 论文不难写的,不要抄袭,有自己的观点就行,不会写可以问我的。论文常指用来进行科学研究和描述科研成果的文章,简称之为论文。它既是探讨问题进行科学研究的一种手段,又是描述科研成果进行学术交流的一种工具。 问题七:急!!毕业论文实证分析中的样本选取和数据来源怎么写啊 20分 数据可以去公司里面,年鉴等地方找 不要相信其他人说的给你,什么没问题,都骗你的 我经常帮别人做数据分析的 问题八:毕业论文的假设检验进行数据分析后 有些没通过 影响大吗 最后的结论怎么写 要写哪些内容 25分 做的是什么假设检验:方差分析、卡方检验、秩和检验还是直线相关与回归 问题九:这个论文数据分析该找哪些数据,该怎么分析,求大神指导。 这个框架 没有办法判断 你需要把模型的设定 先做出来 才可能确定数据选择和收集 问题十:工程力学论文怎么写,其中的数据分析如何 1,定义:应用于工程实际的各门力学学科的总称。常指以可变形固体为研究对象的固体力学。广义的工程力学还包括水力学、岩石力学、土力学等。工程力学是研究有关物质宏观运动规律,及其应用的科学。 2,一般工程力学包括结构力学,理论力学,材料力学即三大力学。它们的关系是包括与被包括的关系。包括实验力学,结构检验,结构试验分析。模型试验分部分模型和整体模型试验。结构的现场测试包括结构构件的试验及整体结构的试验。实验研究是验证和发展理论分析和计算方法的主要手段。
毕业论文数据分析的做法如下:
首先,针对实证性论文而言,在开始撰写论文之前,必须要提前确定好数据研究方法。而数据研究方法的确定与选择需要根据大家毕业论文的研究课题来确定。
另外,大家也可以跟自己的的论文指导老师多多交流,尽可能多的了解更多关于研究方法的知识,以供自己选择。除此之外,大家还需要大量查找文献资料,见多识广有大量输入之后才能有所输出,本环节需要大家跟导师沟通商议后决定。
接下来一个比较重要的步骤是搜集和整理实验数据。在这一部分,很多同学朋友都会遇到各种各样的问题,比如,不知道去哪里找数据,找到的数据可靠性无法保障,需要的数据总是无法搜集全面等等各种问题。
那么在这里需要跟大家强调一下,推荐大家使用国家统计局、中国统计年鉴、国泰安、万方等等这些比较权威的网站去搜集数据资料。
在此需要注意的是,国泰安和万方等这些网站是需要收费的,上去看了一下,价格不是很亲民。
给大家分享一下,如果有些数据在国家官方网站确实找不到或者毕业论文所需的最新数据还没及时发布,推荐大家可以上某宝,因为某宝上电子版数据往往都很全面,而且价格大都可以接受。
在此提醒大家搜集到数据之后,一定要按照自己的习惯整理保存好,避免后期使用数据时出现差错。
统计描述一般指的是均数、标准差等
1、频数分析:
对一组数据的不同数值的频数,或者数据落入指定区域内的频数进行统计,了解其数据分布状况的方式。通过频数分析,能在一定程度上反映出样本是否具有总体代表性,抽样是否存在系统偏差,并以此证明以后相关问题分析的代表性和可信性。
2、描述性统计:
对调查总体所有变量的有关数据进行统计性描述,包括数据的集中趋势与离散趋势。
3、探索性分析:
正态性检验用于检验数据是否满足正态分布,一些算法需要数据满足正态分布(如单样本T检验,独立样本T检验等)。