1.绪论(医学统计学的定义与研究对象、在科研中的作用、主要内容)2.统计资料类型与常用统计指标3.统计图表4.概论分布与抽样误差5.常用统计方法(相对数与x2检验、平均数与变异指标、正态分布、t分布、正常值范围、可信区间、t检验与u检验、方差分析、非参数统计、相关回归、曲线拟合、多元回归等)6.实验设计(临床试验设计、调查设计)基本方法7.多元分析方法应用举例(逐步回归、判别分析、聚类分析、主成分分析等)计算机统计软件的调用与结果分析授课方式、方法:授课(66学时)、课堂讨论(13学时)、阶段复习(4学时)、计算机实习(4学时)、考试(3学时)、作业(课余时间)考试方法:闭卷考试教材名称:1.医学统计学,郭祖超主编,人民军医出版社,1999年使用指南,教研室自编,1996年主要参考书目:1.医用数理统计方法(第三版),郭祖超主编,人民卫生出版社,1988年2.中国医学百科全书 · 医学统计学,杨树勤主编,上海科学技术出版社,1985年3.医用统计方法,金丕焕主编,上海医科大学出版社,1993年4.医学统计学与电脑实验,方积乾主编,上海科学技术出版社,1997年预修课程:医学院校基础课程附:《医学统计学》教学要点教学目的和意义:讲授医学统计学基本原理,医学数据的常用统计描述和统计推断方法。要求学员掌握基本的统计计算公式和应用条件,了解医学实验设计的基本原则和计算机统计软件的调用,能独立处理常见的医学试验数据。经过学习,使学员能够在医学科研的设计、数据收集和结果分析的各个阶段正确运用统计学的原理和方法,提高研究效率和科学性。教学内容和重点:医学统计学的基本概念和统计图表、假设检验方法、实验设计与方差分析、计算机统计软件的调用。教学时数分配和学分:绪论、统计指标和统计图表(4学时)、x2检验和t(u)检验(14学时)、方差分析(10学时)、相关回归与曲线拟合(14学时)、统计软件介绍(4学时)、多元回归与逐步回归(13学时)、实验设计(临床试验设计、调查设计)(7学时)、课堂讨论(13学时)、阶段复习(4学时)、计算机实习(4学时)、考试(3学时)、作业(课余时间,约40学时)。讲座比例1∶1。
公式() w检验公式() 偏度系数公式()公式() 峰度系数公式()公式 () g1的抽样误差公式 () g2的抽样误差公式 () g1的u检验u1=g1/Sg1公式 () g2的u检验 u2=g2/Sg2两方差齐性检验公式()F=S12/S22,S1>S2方差分析公式() 总离均差平方和公式() 组间离均差平方和公式() 组内离均差平方和公式() 总变异自由度 ν总=N-1公式()组间变异自由度 ν组间=k-1公式() 组内变异自由度 ν组内=N-k公式() F检验F=组间均方/组内均方多个均数间两两比较公式() 最小显著相差Dα=t,νSA-B公式() 两均数的标准误公式() 平均例数i=1,2,…,k公式() 标准误多个方差齐性检验公式()公式()直线相关公式() 直线相关系数公式() 离均差积和公式() 相关系数t检验直线回归公式() 直线回归方程γ=a+bx公式() 回归系数
论文估算时样本量首先点击打开“样本量”计算表格。
然后点击输入公式“=”号。再输入目标总体数量的平方值,并乘以标准偏差。接着用1减去标准偏差,乘以误差幅度的平方值 。样本量计算方法:样本量=目标总体数量^2*标准偏差*(1-标准偏差)/(误差幅度)^最后按“Enter回车键”确定,计算得出样本量。这样就计算好了。
样本量的计算公式是n=z²σ²/d²。其中,Z为置信区间、n为样本容量、d为抽样误差范围、σ为标准差,一般取。应用于统计学、数学、物理学等学科。样本量大小是选择检验统计量的一个要素。样本量计算举例:样本量估算可以通过统计学公式,也可以通过专用软件进行,但首先仍需要确定研究背景、研究假设、主要评价指标和设计模型。目前常用的样本量估算软件有nQuery Advisor+nTerim、MedCalc、PASS、SAS、Stata、R语言等。
采用统计学公式进行样本量估算的相关要素一般包括临床试验的设计类型、评价指标的期望值、Ⅰ类和Ⅱ类错误率,以及预期的受试者脱落的比例等。评价指标的期望值根据(基于目标人群样本的)已有临床数据和小样本预试(如有)的结果来估算,应在临床试验方案中明确这些参数的确定依据。
统计学意义(p值)ZT 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,的p值通常被认为是可接受错误的边界水平。 在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生p值的结果≤被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果≥p>被认为是具有统计学意义,而≥p≥被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。 所有的检验统计都是正态分布的吗并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。
秋风送爽,也给我们送来了刘岭教授的统计说说第五期。这一期的统计学方法之选择大家一定要认真学起来,说不定马上你就会用到了。编者语针对常用的基本统计学方法,一般而言说的就是t检验、单因素方差分析和卡方检验,这也是大家在写论文、阅读论文时经常遇到的统计学方法(几乎每篇文章都会涉及这一种或几种方法),那到底该采用何种统计学方法呢?今天我们就此来聊聊。一、拿到数据开始分析之前,一定要进行数据类型的划分(图1),因为不同数据类型资料,描述的方式不一样,统计学方法也不一样。图1 统计资料的类型举个例子(表1):表1 某地2002年735例65岁以上老年人健康检查记录二、各种类型资料的统计分析(描述与统计推断)1.计量资料特点:每个观察单位的观察值之间有量的区别,有单位;描述形式:最常见采用“X±S”(一般文献中经常见到),用算数均数描述其平均水平,用标准差描述其离散程度。如果遇到数据“特别变态”(特别是标准差大于算数均数),就采用Md(P25,P75)(Md为中位数,P25和P75为四分位数)(表2)。正态分布检验请大家复习:医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验表2 计量资料常用统计指标的特点及其应用场合统计推断方法:一般分为单因素和多因素两种。单因素分析方法分析要点:一是划清数据类型(计量资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是满足正态方差齐性时采用t检验(注意t检验有三种形式哦!)或单因素方差分析,不满足时采用秩和检验(图2)。图2 计量资料统计方法的正确选择提醒两点:① 如果样本数据不服从正态分布的话,那就只能用非参数检验(秩和检验),但其检验效能低于参数检验(t检验或方差分析)。所谓检验效能低就是本身有差异,却没有能力发现其差异。② 如果是两组以上样本的数据时,不能采用t检验(会导致假阳性错误概率增加),应该采用方差分析。若方差分析的P<,需再进一步两两比较,常用的方法为LSD法或SNK法(注意依旧不能采用t检验)。在上两讲内容中我们已经学过t检验(医学科研课堂丨统计说说(二):你的t检验做对了吗?)和方差分析(医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析)了,至于秩和检验,我们以后会逐步介绍滴。多因素分析一般采用回归分析,主要是线性回归分析,以后会给大家介绍此方法。2.计数资料特点:无序分类,同类别中各观察单位之间没有量的差别,但各类别间有质的不同,各类别互不相容。其中二分类一定是计数资料(例如性别只有男/女之分,是否继发某种疾病只有继发/未继发之分),而多分类满足分类在性质上没有程度等级上的差别,即为计数资料(例如婚姻状况包括未婚、已婚、离异、丧偶,就属于多分类,但各分类没有程度等级差别,因此为计数资料,尿糖定性检测结果包括-、+、++、+++、++++,属于具有程度等级差别的多分类资料,就不属于计数资料,属于等级资料了)。描述形式:最常见采用“例数(%)”(一般文献中经常见到),主要要分清构成比(结构相对数)和率(强度相对数)的差别(表3)。而且在应用时,分母(就是样本量啦)一般不宜过小,分母太小不足以反映数据的客观事实,也不稳定。表3 计数资料常用统计指标的特点及其应用场合比如说:1.某地肺癌患者中男性A例,女性B例,则当地肺癌患者的性别比为A/B就是“比”。2.某次研究共检出了致病菌3种,总株数为A+B+C,其中一种致病菌检出株数为A,那么A/(A+B+C)就是构成比,即该种致病菌占总致病菌的比重或分布。3.某研究对患者(总例数为B)进行治疗,结果治愈的患者例数为A,则A/B即为率(可以理解为治愈率)。统计推断方法:一般分为单因素和多因素两种。单因素分析方法分析要点:一是划清数据类型(计数资料);二是明确试验设计类型(完全随机设计?几组样本?);三是注意所用方法的应用条件;四是多样本率比较,若卡方检验的P<,需再进一步两两比较,并进行Bonferroni校正,以控制假阳性(图3)。图3 计数资料统计方法的正确选择提醒两点:① 构成比是以100作为基数,各构成部分所占的比重之和必须为100%,故某组成部分所占比重的增减必影响其它组成部分的比重;② 构成比和率在实际应用时容易混淆,主要区别在分母上,所以应正确选择分母。多因素分析一般采用回归分析,主要是Logistic回归分析,以后会给大家介绍此方法。3.等级资料特点:属于多分类资料,满足多分类在性质上有程度等级上的差别,各分类属性按一定顺序排列(有序),即为等级资料。描述形式:最常见采用“例数(%)”(一般文献中经常见到),这和计数资料的描述大体相同,主要区别在于多个分类排列时一定要按照顺序进行(从小到大或从弱到强)。统计推断方法:等级资料的统计分析方法在单因素分析中采用非参数检验(秩和检验),当然对于双向有序R×C资料,也就说分组变量和结局变量都是有序(等级)的情况,构成比的比较采用卡方检验,程度的比较采用秩和检验,趋势关联性的比较用秩相关(也称等级相关)。多因素分析中采用有序Logistic回归。注意:分类变量(计数资料和等级资料)在软件分析操作时,要适当数量化处理(赋值),赋值情况会直接影响统计分析结果的解释。最后用下面这张图来总结基本统计学方法的选择(图4)。图4 常用基本统计学方法的正确选择今天的内容就到这里,同学们多多复习,有什么问题和不懂的可以在下面留言,我们会请刘岭教授一一解答。好了,让我们期待下一期吧!撰稿:刘岭 约稿编辑:刘芹排版:毕丽 审核:王东专家简介刘岭:陆军军医大学卫生统计学教研室副教授,主要从事卫生统计学教学、科研工作。担任中华卫生信息学会第八届统计理论与方法专业委员会委员,重庆市预防医学卫生统计专业委员会副主任委员,并担任《第三军医大学学报》等多家杂志的编委、统计审稿专家。历史推荐医学科研课堂丨统计说说(四):统计学方法之灵魂—方差分析 医学科研课堂丨统计说说(三):你所应该了解的正态、方差齐性检验 医学科研课堂丨统计说说(二):你的t检验做对了吗? 医学科研课堂丨统计说说(一):样本量估算是个什么东东?
1.绪论(医学统计学的定义与研究对象、在科研中的作用、主要内容)2.统计资料类型与常用统计指标3.统计图表4.概论分布与抽样误差5.常用统计方法(相对数与x2检验、平均数与变异指标、正态分布、t分布、正常值范围、可信区间、t检验与u检验、方差分析、非参数统计、相关回归、曲线拟合、多元回归等)6.实验设计(临床试验设计、调查设计)基本方法7.多元分析方法应用举例(逐步回归、判别分析、聚类分析、主成分分析等)计算机统计软件的调用与结果分析授课方式、方法:授课(66学时)、课堂讨论(13学时)、阶段复习(4学时)、计算机实习(4学时)、考试(3学时)、作业(课余时间)考试方法:闭卷考试教材名称:1.医学统计学,郭祖超主编,人民军医出版社,1999年使用指南,教研室自编,1996年主要参考书目:1.医用数理统计方法(第三版),郭祖超主编,人民卫生出版社,1988年2.中国医学百科全书 · 医学统计学,杨树勤主编,上海科学技术出版社,1985年3.医用统计方法,金丕焕主编,上海医科大学出版社,1993年4.医学统计学与电脑实验,方积乾主编,上海科学技术出版社,1997年预修课程:医学院校基础课程附:《医学统计学》教学要点教学目的和意义:讲授医学统计学基本原理,医学数据的常用统计描述和统计推断方法。要求学员掌握基本的统计计算公式和应用条件,了解医学实验设计的基本原则和计算机统计软件的调用,能独立处理常见的医学试验数据。经过学习,使学员能够在医学科研的设计、数据收集和结果分析的各个阶段正确运用统计学的原理和方法,提高研究效率和科学性。教学内容和重点:医学统计学的基本概念和统计图表、假设检验方法、实验设计与方差分析、计算机统计软件的调用。教学时数分配和学分:绪论、统计指标和统计图表(4学时)、x2检验和t(u)检验(14学时)、方差分析(10学时)、相关回归与曲线拟合(14学时)、统计软件介绍(4学时)、多元回归与逐步回归(13学时)、实验设计(临床试验设计、调查设计)(7学时)、课堂讨论(13学时)、阶段复习(4学时)、计算机实习(4学时)、考试(3学时)、作业(课余时间,约40学时)。讲座比例1∶1。
正确的统计学分析一定要建立在明确的研究目的和研究设计的基础之上,那些事先没有研究目的和研究设计,事后找来一堆数据进行统计分析都是不可取的。 在医学论文的撰、编、审、读过程中经常遇到的问题是研究的题目与课题设计、论文内容不符,包括文章的方法解决不了论文的目的、文章的结果说明不了论文的题目、文章的讨论偏离了论文的主题;还有是目的不明确、设计不合理。如题目过小,论文不够字数,而一些无关紧要的变量指标或结果被分析被讨论;又如题目过大,论文的全部内容不足以说明研究的目的,使论文的论点难以立足。 所以,合理明确的论文题目或目的以及研究设计方案是撰、编、审、读者应当关注的首要问题。此外,样本含量是否满足,抽样是否随机,偏倚是否控制等,也是不可忽视的问题。2、建好分析用的数据库建好数据库是正确统计分析的前提和基础,甚至决定了论文分析结果的成败。对于编、审、读者来讲,一般由于篇幅的限制,往往得不到数据库数据,而只有作者在数据库数据基础上经统计描述计算后给出的诸如各指标均数 x、标准差 s 或中位数 M、百分位数 Px 的“二手”数据,或将研究对象小或特征属性分组,清点各组观察单位出现的个数或频数的频数表数据等。 无论是否能够得到数据库数据,作者在统计分析过程中一定依据数据库数据进行计算,得出结果。如果对“二手”数据或频数表数据的结果等存在疑惑,编辑、审稿专家或读者有权要求作者提供数据库数据以检查其完整性、准确性和真实性,确保研究数据的质量。假若在投稿须知中对数据库数据作出必要的要求,无疑对于保证刊物的发表质量有着积极的意义
统计学意义(p值)ZT 结果的统计学意义是结果真实程度(能够代表总体)的一种估计方法。专业上,p值为结果可信程度的一个递减指标,p值越大,我们越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率。如p=提示样本中变量关联有5%的可能是由于偶然性造成的。即假设总体中任意变量间均无关联,我们重复类似实验,会发现约20个实验中有一个实验,我们所研究的变量关联将等于或强于我们的实验结果。(这并不是说如果变量间存在关联,我们可得到5%或95%次数的相同结果,当总体中的变量存在关联,重复研究和发现关联的可能性与设计的统计学效力有关。)在许多研究领域,的p值通常被认为是可接受错误的边界水平。 在最后结论中判断什么样的显著性水平具有统计学意义,不可避免地带有武断性。换句话说,认为结果无效而被拒绝接受的水平的选择具有武断性。实践中,最后的决定通常依赖于数据集比较和分析过程中结果是先验性还是仅仅为均数之间的两两>比较,依赖于总体数据集里结论一致的支持性证据的数量,依赖于以往该研究领域的惯例。通常,许多的科学领域中产生p值的结果≤被认为是统计学意义的边界线,但是这显著性水平还包含了相当高的犯错可能性。结果≥p>被认为是具有统计学意义,而≥p≥被认为具有高度统计学意义。但要注意这种分类仅仅是研究基础上非正规的判断常规。 所有的检验统计都是正态分布的吗并不完全如此,但大多数检验都直接或间接与之有关,可以从正态分布中推导出来,如t检验、f检验或卡方检验。这些检验一般都要求:所分析变量在总体中呈正态分布,即满足所谓的正态假设。许多观察变量的确是呈正态分布的,这也是正态分布是现实世界的基本特征的原因。当人们用在正态分布基础上建立的检验分析非正态分布变量的数据时问题就产生了,(参阅非参数和方差分析的正态性检验)。这种条件下有两种方法:一是用替代的非参数检验(即无分布性检验),但这种方法不方便,因为从它所提供的结论形式看,这种方法统计效率低下、不灵活。另一种方法是:当确定样本量足够大的情况下,通常还是可以使用基于正态分布前提下的检验。后一种方法是基于一个相当重要的原则产生的,该原则对正态方程基础上的总体检验有极其重要的作用。即,随着样本量的增加,样本分布形状趋于正态,即使所研究的变量分布并不呈正态。
论文估算时样本量首先点击打开“样本量”计算表格。
然后点击输入公式“=”号。再输入目标总体数量的平方值,并乘以标准偏差。接着用1减去标准偏差,乘以误差幅度的平方值 。样本量计算方法:样本量=目标总体数量^2*标准偏差*(1-标准偏差)/(误差幅度)^最后按“Enter回车键”确定,计算得出样本量。这样就计算好了。
样本量的计算公式是n=z²σ²/d²。其中,Z为置信区间、n为样本容量、d为抽样误差范围、σ为标准差,一般取。应用于统计学、数学、物理学等学科。样本量大小是选择检验统计量的一个要素。样本量计算举例:样本量估算可以通过统计学公式,也可以通过专用软件进行,但首先仍需要确定研究背景、研究假设、主要评价指标和设计模型。目前常用的样本量估算软件有nQuery Advisor+nTerim、MedCalc、PASS、SAS、Stata、R语言等。
采用统计学公式进行样本量估算的相关要素一般包括临床试验的设计类型、评价指标的期望值、Ⅰ类和Ⅱ类错误率,以及预期的受试者脱落的比例等。评价指标的期望值根据(基于目标人群样本的)已有临床数据和小样本预试(如有)的结果来估算,应在临床试验方案中明确这些参数的确定依据。
n=6 可以是一个数字比如说2/3 的n次方,当N=6时, P> 概率大于。最好再加点论文的内容吧, 这样估计都猜不出来到底是什么。
采用spss软件,单因素分组对照计算。
t值和P值都用来判断统计上是否显著的指标。在p值就是拒绝原假设的最小alpha值,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值。P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。Fisher的具体做法
假定某一参数的取值,选择一个检验统计量,在该统计量的分布在假定的参数取值为真时应该是完全已知的从研究总体中抽取一个随机样本计算检验统计量的值计算概率值或者说观测的显著水平即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
P值的计算:一般地,用X 表示检验的统计量,当H0为真时,可由样本数据计算出该统计量的值C,根据检验统计量X的具体分布,可求出P值。具体地说:左侧检验的P值为检验统计量X 小于样本统计值C 的概率,即:P = P{ X < C}右侧检验的P值为检验统计量X 大于样本统计值C 的概率:P = P{ X > C}双侧检验的P值为检验统计量X 落在样本统计值C 为端点的尾部区域内的概率的2 倍:P = 2P{ X > C} (当C位于分布曲线的右端时) 或P = 2P{ X< C} (当C 位于分布曲线的左端时) 。若X 服从正态分布和t分布,其分布曲线是关于纵轴对称的,故其P 值可表示为P = P{| X| > C} 。p值的计算公式:=2[1-φ(z0)]当被测假设h1为p不等于p0时;=1-φ(z0)当被测假设h1为p大于p0时;=φ(z0)当被测假设h1为p小于p0时;其中,φ(z0)要查表得到。z0=(x-n*p0)/(根号下(np0(1-p0)))最后,当p值小于某个显著参数的时候我们就可以否定假设。反之,则不能否定假设。注意,这里p0是那个缺少的假设满意度,而不是要求的p值。没有p0就形不成假设检验,也就不存在p值统计学上规定的p值意义:p值碰巧的概率对无效假设统计意义p>碰巧出现的可能性大于5%不能否定无效假设两组差别无显著意义p<碰巧出现的可能性小于5%可以否定无效假设两组差别有显著意义p<碰巧出现的可能性小于1%可以否定无效假设两者差别有非常显著意义
这个得找找统计检验方面的数
χ²检验的基本公式为:χ²=∑(A-T)²/T;χ²值反映了实际频数和理论频数之间的吻合程度。若H0成立,则A与T相差不应该很大,即χ²统计量不应该很大。
A与T相差越大,χ²值越大,相应的P值越小。若P≤α,则A与T相差较大,有理由认为无效假设不成立,从而拒绝H0,接受H1。
性质:
1、X^2 分布在第一象限内,卡方值都是正值,呈正偏态(右偏态),随着参数v的增大,X^2 分布趋近于正态分布;卡方分布密度曲线下的面积都是1。
2、X^2 分布的均值与方差可以看出,随着自由度v的增大,χ2分布向正无穷方向延伸(因为均值v越来越大),分布曲线也越来越低阔(因为方差2v越来越大)。
3、不同的自由度决定不同的卡方分布,自由度越小,分布越偏斜。
一、每一行的x2和p值使用选择个案来计算
1、数据—加权个案
2、数据-选择个案
3、If条件:变量>=1&变量<=2(因为卡方检验是2x2的行列变量检验,所以这里就只产生了两个变量1和2,其他变量就暂时屏蔽了)
二、男总数182人,91人风症素,相减91人无风症素。女160人,76人风症素,相减84人无风症素。如下图输入数据:性别1代表男,性别代表女。有无症素1代表有,0代表无。value就是相应的数据。
1、数据--加权个案,对value值加权。
2、分析--描述统计--交叉表,如下图所示,选择行和列,value值不用选。
3、统计量--选择卡方--确定。
4、结果如下表,看第一行即可。卡方值,也就是x2值为。sig.值,也就是p值为。
5、因p=>,表明性别对风症素无显著性影响。
扩展资料:
由样本资料计算x2值;
将计算所得的x2值与临界x2值(负值都取绝对值)作比较,若计算值大于临界值,则否定Ⅱ0;反之,则承认Ⅱ0。
计算卡方值的公式一般可表示为:x2=∑[(fo—fc)2/fc]
式中:fo表示实际所得的次数,fc表示由假设而定的理论次数,∑为加总符号。
x2检验对于定类与定类或定类与定序变量之间的相关检验应用较多。
参考资料来源:百度百科-X2检验