在所有的研究开始之前,我们都面临这么一个决策。 显然,我们做研究的资源(人力、物力、财力和时间等)都是有限的,如果我们想要研究的问题需要的数据量远远超出我们的能力范围,那么我们就面对着一个残酷的现实: 这个研究还没有开始,就已经注定失败了 文献中的确定样本统计量的方法如下:“统计功效分析:从我们之前的研究得出,内源性骨质增加的不同分组间的平均值差异为毫米,每一个组别的标准差为1毫米。当我们定义检测此差异的显著性水平为,统计功效为时,每一个研究组所需的被试数量至少为20个。 所以,我们需要找到找到文献中利用统计功效分析计算出所需样本量的方法。 p值、显著性水平、统计功效、统计效应等概念相互关联。 与样本相同或者更极端的概率,可以想象正态分布的钟形曲线,p值代表的是包含样本值及其右侧的尾部区域(意为更极端结果)累计概率值(如为双侧检验,则包括左、右两侧的尾部区域)。 拒绝原假设的检验统计量的值集称为拒绝域,接受原假设的值域称为接受域。 案例请读博客文章: [你真的懂p值吗]( ) 统计功效指的就是:如果我们感兴趣的效应或差异的确存在,在给定的显著性水平的规定下,我们能够正确地拒绝原假设的概率。也就是不犯第二类错误的概率。 统计学家证明,统计功效(1-β)由这些因素决定:标准化的统计效应大小(ES)、样本量(N)、显著性水平。 这四个量只要知道其中任意三个,就能求出剩下的一个。因此,如果需要在开展研究之前估计所需的样本量N,只需知道显著性水平、1-β和ES,剩下的事情交给计算机软件就可以完成了(如SAS、SPSS、R等都有利用功效分析来估计数据量的模块)。 而,显著性水平、统计功效一般都设定好了。 真实的效应大小在某种意义上说我们是永远无法知晓的,即使经过了大量研究,我们也只能不断接近真相。而在功效分析估计数据量时,我们连研究都还没开始做呢,那怎么估计呢? 最常用的估计效应大小的方法有两种: