长期以来在各种医学期刊中人们很少看到实验结果阴性或实验失败的报道,获得阳性结果的论文比阴性结果的论文有更多的发表机会。在此存在着发表偏倚问题,对此人们似乎早已习以为常,认为这是理所当然的。许多人对于这种做法持赞同或认可态度,认为科研工作当然要报告成功的,阴性结果可不必报告。Easterbrook等曾经回顾性地分析了285项研究,其中52%已被发表,作者发现具有显著性结果(阳性)论文比无显著性(阴性)的论文更容易发表(OR=2.32)。为了说明国内这方面的问题,我们统计了1997年国内出版的50多种中华系列杂志上发表的科研论著3718篇,其中属于阴性结果总共有5篇(表1),可谓凤毛麟角。这个问题在临床药物研究特别是Ⅱ期临床实验。研究中表现得尤为突出,一些得出阴性结果的临床报告几乎不可能发表,原因可能来自于研究者本人、委托厂家、审稿人或我等多个方面。
笔者认为有必要对这种现象进行一些讨论。造成这种局面的原因主要来自两个方面:第一,是作者自己认为阴性结果没有临床价值而没有投稿或担心阴性结果的将不会被发表。(事实证明这种担心完全正确)第二,审稿人选择论文时,更愿意发表阳性结果的论文。其实这种做法既不科学,也不合理,甚至有害。首先我们认为这是不符合客观实际的。现实科研中有成功,但在成功的背后则是大量的失败和挫折。科研工作中可能会得出一些与预想相符,作者期望的阳性结果。然而,也会有阴性结果,那为什么只报“喜”而不报“忧”呢?科学研究是一种严肃的探索性工作。在前进的过程中,尤其是涉及前沿的课题和领域中,涉及的未知数越多,遇到的挫折也就越多,失败几乎是不可避免的,这是符合客观规律的。
在医学杂志上只刊登成功的、阳性的结果,不刊登阴性结果,不利于科学人才培养。人类整个文明发展史实际上就是一部挫折、失败与成功的交替史。成功只是其中极小的一部分。在人类科学研究中挫折和失败总是多于成功,而书本和杂志上往往只记录了成功的,很少而且没有披露那些在成功之前经历过的无数次失败、挫折和无数次不屈不挠的艰难探索。这样做的结果容易诱导甚至迫使一些意志不坚强、素质不高的科研人员弄虚作假(因为不这样做就不能毕业、晋升)。
我们应该鼓励争鸣性文章的发表,刊登一些必要的阴性结果还是很有意义的。因为科学研究工作犹如攀登一座座崎岖巍峨的山峰。在登顶过程中人们不断地寻找到达顶峰的路径。经常会出现的情况是虽然历经千辛万苦,最后发现自己已走入绝境(如临绝壁或深渊)。此时只好退回去另寻蹊径。这时如果我们能在原先的入口处立起一座标牌,表明此路不通,或前有绝壁、深渊,以警示后来人,这样可以为别人省去许多麻烦,减少不必要的浪费,甚至牺牲。在科学研究过程中挫折和失败本身可能是带领我们走出困境的向导。正如爱迪生所说:“失败也是我们所需要的,它和成功对我一样有价值。因为只有在我知道一切做不好的方法以后,我才知道做好一件工作的方法是什么。”发现一条走不通的路,其实就是对发现成功之路的一大贡献。
对临床药物研究的文章而言,发表偏倚将会有严重的潜在的后果。因为这样做势必会误导药物的真实治疗效果,进而导致病人治疗上的决策失误,以及医疗方针的重大失误,造成极其严重的经济损失和不良的社会影响。
还有一点也是很重要的,这就是在科学研究过程中有时敢于发表一篇不同观点的结果,用强有力的确凿事实否定一项在相当长时间流行于人们当中的有相当市场的观点、做法,其意义有时更胜一酬。很多事实表明,在科学发展的道路上,对于谬误的揭露和否定,其价值并不亚于某项创造性的发现。由于人们思维中具有强大的惯性定势作用,因而拥护、维护某些目前流行的观点要比*某些过时、陈旧、不科学的观点,接收另外一种崭新的,尤其是一时还只为少数人理解的观念要容易得多。在这种情况下敢于发表并坚持新观点是相当不容易的。所以,我们提倡让那些设计严谨,并有良好对照研究但得出阴性结果的医学科研论文与获得阳性结果者有同等发表机会。
1.杂志编辑。编辑认为阴性研究结果无价值,退稿,或即使认为有价值,但推迟发表。稿件审核时,审核员认为阴性研究对本专业没有价值,建议退稿。曾经有一糖尿病杂志社,在给作者的训导版中写到只有在个别情况下,少许与已知事实一致的文献能得以发表,同种情况也适用于无阳性结果的试验性和观察性研究论文。2.作者。是产生发表性偏倚的主要因素。作者投稿时,往往只考虑杂志声望﹑权威性及可被接受性,多数情况下,愿意将阳性结果的研究投稿于英文杂志,而对阴性结果的研究,缺乏严谨撰写的兴趣。被退稿件作者放弃了对阴性研究的发表,或再投于那些非英语性、不被数据库收录、不知名的地方性杂志。3.文化背景和政治因素也可影响出版的决策。某些地区的研究者或编辑从不报道阴性结果的研究。4.研究资金来源的影响。如果说由政府机构和公共卫生部门提供资金的项目还可以接受阴性研究结果的话,那么,由制药公司资助的研究是绝对不可能接受阴性结果的。因此,资金的来源决定了研究结果是否会被发表。现有89%所报道的,联合用药比单一用药更好的临床研究是由药商赞助的,而只有61%的其它研究得出类似的结论。5.多中心临床试验比一般临床试验更易发表。然而,高质量研究并非比质量差的研究更有多的发表机会。6.同一阳性研究结果反复被多次发表。未及时发现某些阳性研究曾被多次发表,可导致SR过高估计干预的疗效。在对枢复宁治疗术后呕吐的Meta 分析中,1/3的患者被报道过两次,如果未能辨别,可导致疗效被高估23%。7.阳性研究与阴性研究被引用频率差别过高也可导致偏倚的产生。如在降低胆固醇治疗的研究中,不管研究规模和质量,那些认为治疗有益的研究比认为治疗无意义的研究被引用得更多,然而,与专家论著和描述性综述相比,SR更能识别和排除这些重复性文献所导致的偏倚。8.各国文献收录标准的差异。对发达国家而言,如多数非英文的西欧杂志被收录在Embase和 Medline中,而对不发达国家就并非如此。Embase、Medline 和 SCI收录的 3000至4000种杂志中,仅2%来自不发达国家。如印度是科研论文产量极高的发展中国家,而在Medline 收录的3861种杂志中仅30种来源于此国,且仅包括英文。阳性研究多发表在被数据库收录的杂志上,而阴性研究则往往发表在未被收录的期刊上。
可以评价Meta分析论文质量。偏倚评估会发现很多的问题,其目的是影响Meta分析质量的重要因素,是否诊断发表偏倚,可以作为评价Meta分析论文质量的标准之一。
为识别出评估发表偏倚影响的研究,在Medine(1993年1月至2003年10月)中用如下检索词检索:“发表偏倚”,“引用偏倚”,“语言偏倚”,“地区偏倚”,“参考文献偏倚”和“重复发表偏倚”。我们同时检索了在发表偏倚方面的Cochrane系统评价的参考文献。检索限定在那些主要研究发表偏倚的已发表文章,并且它们得到接受发表的原因依赖于它们是否发现偏倚。所获得的参考文献一共有265篇。在此之中,我们挑选了148篇文章作全面的检查,从其中的参考书目中获得另外26篇论文。我们排除了148篇不含有原始数据的论文,剩下的26篇论文被包括在本分析中。我们使用漏斗图对发表偏倚的报道进行评价。在漏斗图中,作用大小为横坐标,其精密程度的测量例如样本量为纵坐标。随着样本量的增加,作用的随机变化减小。这样,如果无发表偏倚存在,从各个研究中得到的数据将会在图表上呈一个倒漏斗状对称分布。与此相反,不对称的倒漏斗图形说明研究样本偏倚的存在。我们在坐标中标出作用大小与样本量相应的坐标(见图1)。作用大小是阳性结果发表的几率与阴性结果发表的几率的比值。们将已报道的相对危险度换算为比值比,但不换算危险比。水平线提示无发表偏倚。在26篇研究中,有23篇报道阳性结果的会得到优先发表。据报道,平均比值比为2.3,说明阳性报道可得到优先发表。以报道作用作为应变量作一回归斜线。该斜率与0无显著区别(P=0.13),说明数据的不对称性无统计学意义。