刚在那个什么 创新医学网 上看见过 医学论文 写作辅导的文章 这个知道是不是 你要的答案 统计资料的显著性检验(significant test)方法的选择是医学论文中常常遇见的问题,退稿原因中常有显著性检验方法选择不当。如t检验、u检验、χ2检验等,虽然各有其应用范围和要求,但也其共同之处。作者可根据统计资料的类型,选择一种或几种检验方法。但当作者在获得一组、两组或两组以上的数据资料时,选择何种显著性检验,是至关重要的问题。不同的资料类型其统计指标、统计检验的方法是不同的,见表1。 医学生物研究中,许多指标都是服从正态分布(u分布)的,而随着样本含量加大或自由度增大,t分布、χ2分布、F分布都趋向于正态分布见图1、图2。 在《中华创伤杂志》第12卷1~6期和增刊中文章所涉及的统计方法(表2),表明了正态分布的广泛性、常见性。 故当作者获得数据资料后,首先应进行正态性检眩�范ㄊ欠为标准正态分布(或近似正态分布)或不属于正态分布。笔者首先推荐概率单位法。 当统计资料属于正态分布或近似正态分布时,差异显著性检验方法的选裕�诜合其应用条件下,一般可按表3进行选择。 显著性检验应用时的主要注意事项:(1)率值或均值在进行显著性检验前,应注意样本的代表性和可比性。(2)检验结果接近显著性界限时:要多方面考虑,是否确实不存在差异;或是观察例数不够,而需加大样本例剩换是检验公式运用不当,可用其他检验印证。(3)多个样本比例数的χ2检验,差异显著性,只能说明多组比例数不同或不完全相同,而不能确定哪个比例数不同,要进一步进行显著性检验才能了解两个样本比例数是否构成相同。表1 一般情况下不同资料的统计指标与检验方法的关系资料类型 统计指标 统计检验方法 计量资料 均数、标准差 t检验、F检验等 计数资料 率、构成比 χ2检验等 半定量资料 率、构成比 秩和检验、Ridit分析表2 《中华创伤杂志》第12卷1~6期、 增刊显著性检验方法使用频数检验方法 应用次数 检验方法 应用次数 t检验 27 直线相关与回归分析 5 χ2检验 16 拟合线性回归 1 F检验 24 相关分析 6 Q检验 2 非参数统计 4 u检验 1 未注明方法 6表3 常用显著性检验方法的选择统计资料比较类型 显著性检验 小样本均数与总体均数相比较 t检验 小样本均数相比较 t检验、F检验 两个或多个大样本均数与 总体均数相比较 u检验、t检验 大样本均数相比较 u检验、t检验 配对计量资料 配对t检验 两个率的比较 u检验、χ2检验 多个样本率的的比较 χ2检验 配对计数资料两种属性的 相关分析及其差别的比较 χ2检验
数据类型就不同,卡方是计数资料比较,t是计量资料比较
医学论文中常用统计分析方法的合理选择目前,不少医学论文中的统计分析存在较多的问题。有报道,经两位专家审稿认为可以发表的稿件中,其统计学误用率为90%-95%。为帮助广大医务工作者提高统计分析水平,本文将介绍医学论文中常用统计分析方法的选择原则及应用过程中的注意事项。 检验t检验是英国统计学家 1908年根据t分布原理建立起来的一种假设检验方法,常用于计量资料中两个小样本均数的比较。理论上,t检验的应用条件是要求样本来自正态分布的总体,两样本均数比较时,还要求两总体方差相等。但在实际工作中,与上述条件略有偏离,只要其分布为单峰且近似正态分布,也可应用[2]。常用的t检验有如下三类:①单个样本t检验:用于推断样本均数代表的总体均数和已知总体均数有无显著性差别。当样本例数较少(n<60)且总体标准差未知时,选用t检验;反之当样本例数较多或样本例数较少、总体标准差已知时,则可选用u检验 [3]。②配对样本t检验:适用于配对设计的两样本均数的比较,在选用时应注意两样本是否为配对设计资料。常用的配对设计资料主要有如下三种情况:两种同质受试对象分别接受两种不同的处理;同一受试对象或同一样本的两个部分,分别接受不同的处理;同一受试对象处理前后的结果比较。③两独立样本t检验:又称成组t检验,适用于完全随机设计的两样本均数的比较。与配对t检验不同的是,在进行两独立样本t检验之前,还必须对两组资料进行方差齐性检验。若为小样本且方差齐,则选用t检验;反之若方差不齐,则选用校正t检验(t’检验),或采用数据变换的方法(如取对数、开方、倒数等)使两组资料具有方差齐性后再进行t检验,或采用非参数检验[4]。此外,当两组样本例数较多(n1、n2均>50)时,这时应用t检验的计算比较繁琐,可选用u检验[5]。 2.方差分析方差分析适用于两组以上计量资料均数的比较,其应用条件是各组资料取自正态分布的总体且各组资料具有方差齐性。因此,在应用方差分析之前,同样和成组t检验一样需要对各组资料进行正态性检验、方差齐性检验。常用的方差分析有如下几类:①完全随机设计的方差分析:主要用于推断完全随机设计的多个样本均数所代表的总体均数之间有无显著性差别。完全随机设计是将观察对象随机分为两组或多组,每组接受一种处理,形成两个或多个样本。②随机区组设计的方差分析:随机区组设计首先是将全部受试对象按某种或某些特性分为若干区组,然后区组内的每个研究对象接受不同的处理,通过这种设计,既可以推断处理因素又可以推断区组因素是否对试验效应产生作用。此外,由于这种设计还使每个区组内研究对象的水平尽可能地相近,减少了个体间差异对研究结果的影响,比成组设计更容易检验出处理因素间的差别。③析因设计的方差分析:将两个或两个以上处理因素的各种浓度水平进行排列组合、交叉分组的试验设计。它不仅可以检验每个因素各水平之间是否有差异,还可以检验各因素之间是否有交互作用,同时还可以找到处理因素的各种浓度水平之间的最佳组合。此外,还有正交设计、拉丁方设计等多种方差分析法,实验者在应用时可以参考相关的统计学著作。目前,某些医学论文中有这样的情况,就是用t 检验代替方差分析对实验数据进行统计学处理,这是不可取的。t 检验只适用于推断两个小样本均数之间有无显著性差别,而采用t 检验对多组均数进行两两比较,会增加犯I 型错误的概率,即可能把本来无差别的两个总体均数判为有差别,使结论的可信度降低[6]。对多个样本均数进行比较时,正确的方法是先进行方差分析,若检验统计量有显著性意义时,再进行多个样本均数的两两(多重)比较。3.卡方检验(χ2检验)χ2检验是一种用途比较广泛的假设检验方法,但是在医学论文中常用于分类计数资料的假设检验,即用于两个样本率、多个样本率、样本内部构成情况的比较,样本率与总体率的比较,某现象的实际分布与其理论分布的比较。但是当样本满足正态近似条件时,如样本例数n与样本率p满足条件np与n(1— p)均大于5,则可以计算假设检验统计量u值来进行判断。常用的χ2检验分为如下几类:①2×2表χ2检验:适用于两个样本率或构成比的比较,在应用时,当整个试验的样本例数n≥40且某个理论频数1≤T<5时,需对χ2值进行连续性校正。因为T值太小,会导致χ2值增大,易出现假阳性结论。此外,若样本例数n<40,或有某个T值<1,此时即使采用校正公式计算的χ2值也有偏差,需要用2×2表χ2检验的确切概率检验法(Fisher确切检验法)。②配对资料χ2检验:适用于配对设计的两个样本率或构成比的比较,即通过单一样本的数据推断两种处理结果有无显著性差别。在应用时,如果甲处理结果为阳性而乙处理结果为阴性的样本例数n1与甲处理结果为阴性而乙处理结果为阳性的样本例数n2之和<40,需要对计算的χ2值进行校正。③R×C表χ2检验:适用于多个样本率或构成比的比较。在R×C表χ2检验中,若检验统计量有显著性意义时,还需要对多个样本率或构成比进行两两比较,即分割R×C表,使之成为非独立的四格表,并对每两个率之间有无显著性差别作出结论。 2×2表资料在应用时可分为如下几种类型:横断面研究设计的2×2表资料、队列研究设计的2×2表资料、病例-对照研究设计的2×2表资料、配对研究设计的2×2表资料。研究者应注意不同类型的2×2表资料的统计分析方法略有差别,比如在分析队列研究设计的2×2表资料时,如果用χ2公式计算得到P<,研究者则应再计算相对危险度(RR)并检验总体RR与1之间的差异是否具有统计学意义。此外,在进行R×C表χ2检验时,还有如下两个主要的注意事项:首先,T值最好不要<5,若有1/5的T值<5,χ2检验结论是不可靠的,解决的办法有三种:增大样本量;删去T值太小的行和列;将T值太小的行或列与性质相近的邻行或邻列的实际频数合并。其次,不同类型的R×C表资料选择的统计分析方法是不一样。①双向无序的R×C表资料:可以选用一般的χ2公式计算。②单向有序的R×C表资料:如果是原因变量为有序变量的单向有序R×C表资料,可以将其视为双向无序的R×C表资料而选用一般的χ2检验公式计算,但如果是结果变量为有序变量的单向有序R×C表资料,选用的统计分析方法有秩和检验、Radit分析和有序变量的logistic回归分析等。③双向有序且属性不同的R×C表资料:对于这类资料采用的统计分析方法不能一概而论,应根据研究者的分析目而合理选择。如果研究者只关心原因变量与结果变量之间的差异是否具有统计学意义时,此时,原因变量的有序性就显得无关紧要了,可将其视为结果变量为有序变量的单向有序R×C表资料进行分析。如果研究者希望考察原因变量与结果变量之间是否存在线性相关关系,此时需要选用处理定性资料的相关分析方法如Spearman秩相关分析方法等。如果两个有序变量之间的相关关系具有统计学意义,研究者希望进一步了解这两个有序变量之间的线性关系,此时宜选用线性趋势检验。如果研究者希望考察列联表中各行上的频数分布是否相同,此时宜选用一般的χ因此,对于适用参数检验的资料,最好还是用参数检验。秩和检验是最常用的非参数检验,它包括如下几类:①配对资料的符号秩和检验(Wilcoxon配对法):是配对设计的非参数检验。当n≤25时,可通过秩和检验对实验资料进行分析;当n>25时,样本例数超出T界值表的范围,可按近似正态分布用u检验对实验资料进行分析。②两样本比较的秩和检验(Wilcoxon Mann-Whitney检验):适用于比较两样本分别代表的总体分布位置有无差异。如果样本甲的例数为n1,样本乙的例数为n2,且n1<n2;当n1≤10、n2—n1≤10时,可通过两样本比较的秩和检验对实验资料进行分析;当n1、n2超出T界值表的范围时,同样可按近似正态分布用u检验对实验资料进行分析。③多个样本比较的秩和检验(Wilcoxon Kruskal-Wallis检验):适用于比较各样本分别代表的总体的位置有无差别,它相当于单因素方差分析的非参数检验,计算方法主要有直接法和频数表法等。此外,在进行上述3类秩和检验(前两类秩和检验实际上已经被u检验替代)时,如果相同秩次较多,则需要对计算的检验统计量进行校正。公式计算。④双向有序且属性相同的R×C表资料:这类资料实际上就是配对设计2×2表资料的延伸,在分析这类资料时,实验者的目的主要是研究两种处理方法检测结果之间是否具有一致性,因此常用的统计分析方法为一致性检验或Kappa检验。4. 非参数检验非参数检验可不考虑总体的参数、分布而对总体的分布或分布位置进行检验。它通常适用于下述资料[2]:①总体分布为偏态或分布形式未知的计量资料(尤其样本例数n<30时);②等级资料;③个别数据偏大或数据的某一端无确定的数值;④各组离散程度相差悬殊,即各总体方差不齐。该方法具有适应性强等优点,但同时也损失了部分信息,使得检验效率降低。即当资料服从正态分布时,选用非参数检验法代替参数检验法会增大犯Ⅱ类错误的概率。
医学检验研究的是人体复杂的各种生理和病理指标,更必须加强与临床相关科室的密合作才能得到成功。在建立合作关系时要注意解决的问题是;(1)选准临床迫切需要解决的课题,做好设计和规埘;(2)选好合作对象;(3)共同完善风险同负、利益共享的双赢机制。本刊期待着在新一届编委会的领导下,能有更多的紧密结合临床实际的优秀论文奉献给广大读者!
1、t值是t检验的统计量值,t检验,亦称studentt检验(Student'sttest),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。t检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。2、F值是F检验的统计量值。F检验是一种在零假设(nullhypothesis,H0)之下,统计值服从F-分布的检验。其通常是用来分析用了超过一个参数的统计模型,以判断该模型中的全部或一部分参数是否适合用来估计母体。3、P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P值,一般以P<为有统计学差异,P<为有显著统计学差异,P<为有极其显著的统计学差异。其含义是样本间的差异由抽样误差所致的概率小于、、。扩展资料:F值和t值是F检验和t检验的统计量值,与它们相对应的概率分布,就是F分布和t分布。统计显著性是出现目前样本这结果的机率。P值代表结果的可信程度,P越大,就越不能认为样本中变量的关联是总体中各变量关联的可靠指标。p值是将观察结果认为有效即具有总体代表性的犯错概率,如p=提示样本中变量关联有5%的可能是由于偶然性造成的。参考资料:百度百科——假设检验中的P值百度百科——F检验百度百科——t检验
采用spss软件,单因素分组对照计算。
t值和P值都用来判断统计上是否显著的指标。在p值就是拒绝原假设的最小alpha值,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值。P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。Fisher的具体做法
假定某一参数的取值,选择一个检验统计量,在该统计量的分布在假定的参数取值为真时应该是完全已知的从研究总体中抽取一个随机样本计算检验统计量的值计算概率值或者说观测的显著水平即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
关于你提的这个问题,我要很庄重的告诉你,我不知道哦,哈哈……
卡方检验的使用范围和优缺点与t检验有3点不同,具体介绍如下:
一、两者的使用范的使用范围不同:
1、卡方检验的使用范围:在分类资料统计推断中进行应用。包括两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
2、t检验的使用范围:主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。
二、两者的优缺点不同:
1、卡方检验的优缺点:可以方便简洁进行检验。但是,原理较为复杂
2、t检验的优缺点:只能够比较两个平均数的差异是否显著。
三、两者的原理不同:
1、卡方检验的原理:卡方检验就是统计样本的实际观测值与理论推断值之间的偏离程度,实际观测值与理论推断值之间的偏离程度就决定卡方值的大小,如果卡方值越大,二者偏差程度越大;反之,二者偏差越小;若两个值完全相等时,卡方值就为0,表明理论值完全符合。
2、t检验的原理:单总体t检验是检验一个样本平均数与一个已知的总体平均数的差异是否显著。当总体分布是正态分布,如总体标准差未知且样本容量小于30,那么样本平均数与总体平均数得离差统计量呈t分布。
参考资料来源:百度百科-卡方检验
参考资料来源:百度百科-t检验
1、卡方检验是用途非常广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。
2、T检验,亦称studentt检验(Student'sttest),主要用于样本含量较小(例如n<30),总体标准差σ未知的正态分布。T检验是用t分布理论来推论差异发生的概率,从而比较两个平均数的差异是否显著。
扩展资料
注意的问题:
1、做假设检验之前,应注意资料本身是否有可比性。
2、当差别有统计学意义时应注意这样的差别在实际应用中有无意义。
3、根据资料类型和特点选用正确的假设检验方法。
4、根据专业及经验确定是选用单侧检验还是双侧检验。
5、当检验结果为拒绝无效假设时,应注意有发生I类错误的可能性,即错误地拒绝了本身成立的H0,发生这种错误的可能性预先是知道的,即检验水准那么大。
当检验结果为不拒绝无效假设时,应注意有发生II类错误的可能性,即仍有可能错误地接受了本身就不成立的H0,发生这种错误的可能性预先是不知道的,但与样本含量和I类错误的大小有关系。
6、判断结论时不能绝对化,应注意无论接受或拒绝检验假设,都有判断错误的可能性。
7、报告结论时是应注意说明所用的统计量,检验的单双侧及P值的确切范围。
参考资料来源:百度百科-卡方检验
参考资料来源:百度百科-t检验
参考资料来源:百度百科-假设检验
F=处理所致变异+随机误差变异/随机误差变异=组间均方/组间均方卡方=(ad-bc)²n/(a+b)(c+d)(a+c)(b+d)(适合四格表)T值好多符号打不出来,抱歉~
1、t指的是T检验,亦称student t检验(Student's t test),主要用于样本含量较小(n<30),总体标准差σ未知的正态分布资料。
计算:t的检验是双侧检验,只要T值的绝对值大于临界值就是不拒绝原假设。
2、P值(P value)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。如果P值很小,说明原假设情况的发生的概率很小,而如果出现了,根据小概率原理,我们就有理由拒绝原假设,P值越小,我们拒绝原假设的理由越充分。
计算:概率定义为:P(A)=m/n,其中n表示该试验中所有可能出现的基本结果的总数目。m表示事件A包含的试验基本结果数。
统计学是关于认识客观现象总体数量特征和数量关系的科学。它是通过搜集、整理、分析统计资料,认识客观现象数量规律性的方法论科学。由于统计学的定量研究具有客观、准确和可检验的特点,所以统计方法就成为实证研究的最重要的方法,广泛适用于自然、社会、经济、科学技术各个领域的分析研究。
参考资料:百度百科-统计学
t值和P值都用来判断统计上是否显著的指标。p值就是拒绝原假设的最小alpha值,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值。P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。
扩展资料:
Fisher的具体做法是:
假定某一参数的取值。
选择一个检验统计量(例如z 统计量或Z 统计量) ,该统计量的分布在假定的参数取值为真时应该是完全已知的。
从研究总体中抽取一个随机样本计算检验统计量的值计算概率P值或者说观测的显著水平,即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
如果P<,说明是较强的判定结果,拒绝假定的参数取值。
如果
如果P值>,说明结果更倾向于接受假定的参数取值。
1:T 这是数理统计中的一种统计量 T统计量2:而统计量指不含未知参数的样本函数。如样本x�1,x�2,…,x�n的算术平均数(样本均值)=1n(x�1+x�2+…+x�n)就是一个统计量。从样本构造统计量,实际上是对样本所含总体的信息提炼加工;根据不同的推断要求,可以构造不同的统计量。3:为什么要构造统计量,这个主要是为了参数估计与检验,具体就相当复杂了。。。4:最后P叫做P值是T、F等一些统计量在置信区间为α下的一种指标吧,5:总之呢,这个涉及到了描述统计学,数理统计学以及计量的很多知识6:希望你看看相关书籍 自己掌握吧
,t值和P值都用来判断统计上是否显著的指标。p值就是拒绝原假设的最小alpha值嘛,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值啊,举个例子,比如说算出来的统计量的值为z,服从的是正态分布,如果是双边检验的话那么pvalue=2*(1-probnorm(abs(Z)));单边检验的话,应该是1-probnorm(z);具体问题具体分析,不同的检验方法求p值方法也不一样,统计的书上肯定都有;T值计算方法相似。
采用spss软件,单因素分组对照计算。
t值和P值都用来判断统计上是否显著的指标。在p值就是拒绝原假设的最小alpha值,把统计量写出来,带进去算出来之后,根据统计量的分布来算p值。P值是用来判定假设检验结果的一个参数,也可以根据不同的分布使用分布的拒绝域进行比较。由R·A·Fisher首先提出。Fisher的具体做法
假定某一参数的取值,选择一个检验统计量,在该统计量的分布在假定的参数取值为真时应该是完全已知的从研究总体中抽取一个随机样本计算检验统计量的值计算概率值或者说观测的显著水平即在假设为真时的前提下,检验统计量大于或等于实际观测值的概率。
我们常常在统计学应用中看到P值,F值,T值,这些参数是什么?我想应该先讲讲“假设检验”,弄明白假设检验,很多问题就通了。
本文首先介绍了假设检验在统计学的位置,然后从 显著性检验 、 P值的疑问 、 假设检验方法的使用 三个角度描述假设检验。
统计学按照发展阶段和侧重点不同,可分为描述统计学和推断统计学 [1]
描述统计学 是阐述如何对客观现象的数量表现进行计量表示; 推断统计学 主要阐述如何根据部分数据(样本统计量)去推论总体的数量特征及规律性的一系列理论和方法
假设检验(hypothesis testing)作为推断统计学的重要部分,用来判断样本与样本、样本与总体的差异是由抽样误差引起还是本质差别造成的统计推断方法。
显著性检验是假设检验中最常用的一种方法,也是一种最基本的统计推断形式,其基本原理是先对总体的特征做出某种假设,然后通过抽样研究的统计推理,对此假设应该被拒绝还是接受做出推断。
常用的假设检验方法有Z检验、T检验、卡方检验、F检验等 [2]
显著性检验(significance test)是假设检验的一种最常用的方法,用于检测实验组与对照组是否有差异以及差异是否显著的办法。
因为显著性检验<假设检验<推断统计学,所以显著性检验具有以下特点:
小概率事件实际不可能性原理是显著性检验的基本原理,如果P小于阈值 ,表明事件是小概率事件,存在发生的可能性但可能性不大甚至不可能发生,所以认为 大概率不会发生,拒绝原假设。
显著性水平是假设检验中的一个概念,是指当原假设为正确时人们却把它拒绝了所愿意承担的风险。 通常取α=或α=。这表明,当作出决策时,其正确的可能性为95%或99%,有或α=下错结论的风险。
置信度也称为可靠度,或置信水平、置信系数 置信度 = 1-α
什么是显著性差异?
H0和H1的设置,不管在什么场景要满足:
赌场上你想检查一下抛掷的硬币是否被动过手脚,要求抛几次硬币看结果是不是公平的。 总共扔了十次,也都是“花”朝上,认为很可能这枚硬币不是公平的。
这就是假设检验: 你提出假设:说硬币是正常的 (H0:硬币是正常的;H1:硬币不正常) 我提出要检验你的假设:扔十次,看实验的结果是不是和你的假设相符
反复扔硬币应该符合二项分布
总共扔10次硬币,那么是出现7次正面之后,可以认为“硬币是不公平的”,还是在出现9次正面以后认为“硬币是不公平”,这是一个主观标准,看你能够承担的风险有多大,也就是显著性水平 。
例如取 为, ,则认为原假设是小概率事件,拒绝原假设,认为硬币不正常,存在显著性差异(和正常硬币的抛掷分布情况很不一样)。 由于取 为,所以这个决策有95%的准确性。
P值是指在特定的统计假设模型下,数据的某个统计指标(如两组样本均数之差)等于观察值或比观察值更为极端的概率。
上文显著性检验就是比较P值和 之间的关系做出决策,但对P值的争议很大,因此需要单独讲一讲P值。
目前科学界对P值的使用存在很大的置疑,认为P值是是扰人烦的蚊子,是皇帝的新衣,比“毫无用处”还糟糕 [6] 。
林泽民教授2016/6/6在台湾政大社科院的演讲,题目为《看电影学统计:p值的陷阱》提到统计学很快会有很重大的改变,传统的作法:用P值来作统计检定的作法,大概再过几年就不容易再存在。
2018年1月22日,美国政治学顶级学术期刊《政治分析》在他们的官方twitter上宣布从2018年的开始的第26辑起禁用p值。根据该刊的声明,其主要原因是:“p值本身无法提供支持相关模式或假说之证据。”
在临床试验中P值的使用尤为普遍,用来检验药物的有效性,P值问题使得近半数的相关论文可靠性被推翻。
为什么说P值是个陷阱?为什么P值本身无法支持相关模式或假说之证据?
主要原因是因为:P值只能对样本数据负责,但模型的意义在于推断总体,所以总有以偏概全的风险存在。同时,因为P值易受样本操控,而很多研究为了得到想要的结论,往往是不断调整样本量,直到得到想要的结果 [8] 。
P值本身是没有问题的,但如果单纯只依赖P值是否小于 做出决策却也是不可取的,学术界反对的是P值的滥用。
美国统计协会(American Statistical Association,ASA)全面透彻地梳理了统计界关于P值的统计意义并形成共识 [7] :
而常用统计推断检验方法分为两大类:参数检验和非参数检验
根据总体数据是否服从某种分布,采用参数检验和非参数检验两种检验方法,具体使用哪种检验方法根据属性和要求决定。
某公司运营团队为了针对活跃度提升专题运营活动的效果进行测试,从同样群体中抽出两组人群,一组运营组,一组对照组。30天后运营活动结束后,想要知道该次针对性运营是否有效,两组活跃度分数是否差异明显?
T检验是数据化运营效果分析中应用最多的方法和技术。使用要求为:1)样本组之间独立;2)每组样本来自正态分布总体;3)两个独立样本方差相等。
虽然两组都是独立的,但两组样本的总体不一定是正态分布的,方差也不一定相等,我们可以采用非参数检验—wilcoxon符号秩检验。
wilcoxon符号秩检验适用于两个独立样本间的两两比较。
如果不能确定总体是否为正态分布,则只能退而求其次用非参数检验的方法。如果满足T检验要求,有限考虑T检验的结果。
[1] 推断统计学: [2] 假设检验: [3] 显著性水平: [4] 显著性差异: [5] 统计学假设检验中 p 值的含义具体是什么? [6] 统计学里“P”的故事:蚊子、皇帝的新衣和不育的风流才子: [7] 临床试验中P值的意义及结果: [8] P值的陷阱: [9] 非参数检验: