相关合集:统计学论文
医学期刊论文的统计学质量是医学研究科学性与严谨性的重要标志,但目前国内高水平医学期刊的论文中统计学误用和滥用问题却较为普遍。本文总结了《山东医药》近年来发表论文中的统计学问题,就其中实验设计、统计分析方法选用、数据表达等方面作一些分析与讨论,希望能引起各位专家学者和临床医生的共识与重视,促进我国医学期刊质量的提高。
1.实验设计方面存在的问题
实验分组仅从专业角度考虑问题,未从统计学角度考虑问题。作者仅从专业上想如何设计分组,而没有想到其涉及的实验因素以及每个因素包含的水平,组与组之间是否具有可比性等一系列问题。
1.1不遵循或不重视随机化原则随机化是科研设计的重要原则,直接影响研究结果的可信度。随机化既要随机抽样,还要随机分组,并有足够的样本量作前提。然而,在医学论文中许多作者对此不够重视,主要表现在论文中统计处理随机化不突出,随机化缺失情况比较常见,有的论文甚至将随机误解为随意、随便,不采用随机化处理方法,导致结果缺乏可靠性。还有些文章中没有提出“随机”抽样的设计与方法,没有排除标准,给人随意选择病例之感,且病例数少,因此没有代表性,所得出的结论不可靠。部分文章虽然注明了“随机”,但未提及采取什么方法进行随机化研究或两组间的例数相差甚远,不符合随机化的一般规律,没有临床参考价值。
1.2缺少对照研究或对照组设计不合理正确设立对照是临床研究的一个核心问题,设立对照的意义在于说明临床试验中干预措施的效应,减少或防止偏倚和
机遇产生的误差对试验结果的影响。目前,国内许多期刊发表的论文对照组设计不合理现象比较普遍,尤其有些作者对某种新药或新技术在临床的应用观察研究中,不设对照组,缺乏对照观察,得出的结论缺乏科学性,令人怀疑。有的文章虽然设立了对照组,但在分析结果时,却没有将试验组与对照组的结果进行比较,而仅将各组间的自身前后进行比较,从而使该研究失去对照意义。
对照组选择不当,还表现在两组间重要的临床特征和基线情况相差太大,无可比性,如性别、年龄、病情、经济情况和文化程度等不一致,如有些论文将健康人或志愿者作为对照组,使结果受到非处理因素的影响,产生偏倚或系统误差,使结论不可信。
1.3均衡性原则掌握不够均衡性原则要求实验中的各组之间除处理因素不同外,其他可控制的非处理因素要尽可能保持一致。特别对疾病预后有重要影响的临床特性一定要在组间分布均衡。各组间越均衡,可比性越强。有些作者在对病例进行分组时,忽视了均衡性原则,两组之间没有可比性,结论自然是错误的。具体表现在:有的文章对治疗组与对照组的相应统一指标没有设在均衡的水平上。对治疗组情况交代的比较详细,而对对照组的年龄、性别、病情等不予交代,或所选对照组的年龄与治疗组不在一个年龄段,影响了作者对指标的观察。
2.统计分析方面存在的问题
统计方法选择非常重要,它直接影响结论的可靠性。临床资料的结果变量可分为计数资料、计量资料和等级资料。计数资料指将观察对象按两种属性分类,
如生存、死亡,治愈、未治愈,有效、无效等,通常转化为率。如果是两组间的比较,则采用四格表x2检验或其校正公式,如果是多组间率的比较,则采用行X列表资料x2检验。计量资料指对某一个研究对象用定量的方法测定某项指标得到的资料,一般均有计量单位。通常资料呈正态分布时,两组间均数比较用t检验,多组间均数比较用方差分析和q检验。当资料不呈正态分布或方差不齐时,也可用秩和检验等非参数检验法。
2.1统计方法描述不清,结论欠科学文中未交代所用统计方法,如是配对设计的t检验还是成组设计的t检验,是Ridit分析还是x2检验,是作相关分析还是作回归推断。统计方法交代不清或根本不予交代,使读者对论文结论的正确与否无法判断。有的作者只提一句“经统计学处理”后,就写出结论。有的甚至直接用P值说明问题,笼统地以P<0.05或0.01、p>0.05便称结果差异有无显著性,值的大小不说明差值的大小,它还与抽样误差大小有关[5]。因此,还应写明具体的统计方法,如有特殊情况,还应说明是否采用了校正,应写出描述性统计量的可信区间,注明精确的统计量值和P值,然后根据P值大小作出统计学推断,并作出相应的医学专业结论。
2.2假设检验方法和结果的表达不交代假设检验方法或假设检验方法交代的不具体、不清楚是医学科研论文中常见的错误。如果不交代假设检验方法或假设检验方法交代的不具体.读者就无法考察论文的统计学方法选择的是否正确,无法核对计算结果是否准确。每一种假设检验方法都有其特定的适应条件和严格的适用范围。对于同一组资料,采用不同的假设检验方法可能得出截然相反的结论。如将配对设计的资料按成组设计资料的方法处理,将会损失样本提供的信息、降低检验效率,可能使原本有统计学意义的结果无统计学意义。
在论文写作时,不但要交代选用的是什么统计学方法,而且统计学方法要尽可能具体。如选择t检验,要说明是配对t检验,还是成组t检验;选择方差分析时,要说明是完全随机设计的方差分析,还是配伍组设计的方差分析。对于四格表资料,应说明是一般四格表x2检验、配对四格表x2检验及四格表资料的精确概率法等。
2.3解释有统计学意义时存在的问题在解释差别有统计学意义的结果时,有些人常常根据P值的大小作出对实验效应差别程度不同的专业结论。例如某实验研究,比较甲、乙两种治疗方法对某病的治疗效果(假定甲法的疗效优于乙法),若得到“P<0.001”,则认为甲法极显著优于乙法;若得到“P<0.01”,则认为甲法非常显著优于乙法;若得到“P<0.05”,则认为甲法显著优于乙法。犯这种错误的原因是错误的理解了统计学中P值的概念。统计学上根据假设检验原理推算出来的P值表示拒绝特定的无效假设可能犯假阳性错误的概率。P值的大小并非指差异的太小,只能反映两者相同或不相同。P值越小,说明越有理由认为两种处理方法效果不同,而不能反映对比的两组或多组之间差异的大小。差异的大小只能根据专业知识来确定。因此差别的统计学意义,过去称差别有“显著性”,为了避免误解,目前倾向于称“差别有统计学意义”。此外,甚至在部分投稿文章中未交代所采用的统计分析方法,也未见应用统计学的迹象,仅从各组数据的均数大小做出了统计推断。
医学期刊论文中暴露出来的统计学错误,从表面上看是编辑部和审稿者把关不严所致。事实上,即使审稿时发现了上述错误,也无法改正。因为实验设计的错误只有在科研工作开始之前才有可能得到纠正。即使编辑工作者能够阻止有严重统计学问题的论文发表,也仅仅是治标而已。如何使广大医学论文作者在医学研究中正确应用统计学,提高科研质量才是治本。我们应采取切实可行的对策和措施(如建立医学期刊统计学质量监督检查管理机制、建立医学期刊编辑统计学上岗考核制度、建立作者、编辑和审稿者统计学知识培训制度,等等),以求能大幅度减少和降低医学研究和医学期刊论文中统计学误用率。