最近一个项目的统计分析中,疗效指标的分析是是使用Wilcoxon rank-sum test(秩和检验),这篇文章梳理一下秩和检验的内容。
SAP中的分析关于此处的具体描述如下,主要通过秩和检验获得一个P值。
Frank Wilcoxon (1892—1965) 是美国的统计学家,一生发表了 70 篇左右论文,其中最大的贡献就是这2个以他名字命名的非参数检验方法: 秩和检验 和 符号秩检验 。他在 1945 年发表的论文中将二者分别称为 非成对检验 (unpaired experiment)和 成对检验 (paired experiment)。 Wilcoxon秩和检验是通过两个随机样本推断其所代表的 两个总体的分布位置 是否相同;Wilcoxon符号秩检验是对配对资料的差值进行分析,判断差值对应 总体的中位数 是否为0。
成对检验,就是我们通常所说的配对检验,是两个 相关 样本的比较分析。这里的相关如何理解呢? 是指起始条件一致的试验对象配成对,分别给予不同的处理 。常见的配对方法有以下几种:
显然,对于配对试验,各个处理组的人数是相同的。而我这个项目,两处理组人数不同,是非成对试验。
秩和检验属于非参数检验,在介绍它之前,先了解下什么是参数检验。 参数检验 是指,对分布类型已知的总体,运用样本的统计量来估计总体的参数。例如,用样本均值估计总体均值,用样本标准差估计总体标准差。在进行参数检验时,样本需要满足一些前提条件(参数检验所需统计理论的假设条件)。比如,常见的t检验、方差分析要满足,独立、正态、方差齐,这三个条件。但是我们研究中的数据,可能会不符合这些前提条件,这时候使用参数检验的检验功效就比较低。此时,建议使用非参数检验。
而 非参数检验 是指不考虑数据的分布类型以及具体值,更多地运用 数据大小排序 的信息,来推测总体位置分布是否相同。此检验不能估计总体的参数,因而称为非参数检验。非参数检验不考虑数据的具体值,会造成数值型数据信息的丢失。所以,在符合参数检验的条件下就使用参数检验。
而我这个项目采用秩和检验,很可能所收集的数据不满足正态性或方差齐性。
假设检验是一种统计推断的方法,应用到的具体方法有两个: 小概率原理 和 反证法 。
什么是小概率原理呢?先介绍小概率事件,在统计学上,将发生可能性小于的事件,称为小概率事件。小概率原理是指,在一次抽样中,小概率事件不可能发生。
什么是反证法呢?我们先假设一个论题成立,然后根据这个论题进行推理,如果推出矛盾,这时就可以认为之前的假设是不成立的,这就是反证法。
假设检验的核心思想,可以用7个字进行概括: 一分为二,灭其一 。(参考课程:医学统计学-武松老师)
用一个虚构的例子来说明假设检验的思想。有个警察在追小偷,来到了一个Y字型的路口。警察不知道小偷走向了哪边,小偷的走向有两种可能,这就是一分为二。如果现在有证据将其中一种结果排除掉,那么小偷就在剩下的一种可能里了。
怎么排除呢?先假设小偷跑向了右边,然后我们竟然能够 用统计学方法证明——小偷跑向右边的概率是小于的 。这意味着什么?意味着小偷跑向右边这个事件是一个小概率事件,而根据小概率原理,在小偷跑一次的过程中,这个小概率事件不会发生。因此我们有理由认为小偷跑向了左边。这就是典型的一分为二,灭其一。我们并不能直接证明小偷跑向了左边,但我们证明小偷没有跑向右边,那么他就跑向了左边。
上面的这个例子的关键是, 假设小偷跑向右边时,能够用统计学方法获取到跑向右边的概率 。在统计学上,这个假设称为零假设,与零假设相对的是备择假设。
以秩和检验的假设为例,零假设是,两组数据的 总体分布位置 相同;备择假设是,两组数据的 总体分布位置 不同。在零假设成立的情况下,我们可以推算出 获取当前状态的样本或更极端状态的样本 发生的可能性,也就是概率。如果概率小于,那么它就是小概率事件。根据小概率原理,小概率事件在一次抽样中不可能发生,于是我们有理由拒绝零假设。
这就是假设检验的思想了。
感谢阅读!若有疑问,欢迎评论区留言讨论。
相关文章: 秩和检验 (2):完整流程(秩、秩和、SAS) - ()