一:前言从传染病的预防开始,以Snow19世纪中叶发现霍乱的传播方式为标志出现的流行病学依然是一门相对年轻的科学。在其过去的两个世纪中,流行病学和人类总体的科学技术发展进步及健康水平的改变相伴随发生了很大的变化。特别是随着人类对传染病的逐步控制,慢性病,如心血管疾病及肿瘤,已成为对人类健康的主要危险。因此,在发达国家流行病学的重点已完成了从传染病到慢性病的转移。 毫无疑问,在过去的半个世纪中,流行病学发现一再对我们的健康知识做出贡献,这些知识导致了健康行为的改变,和控制健康问题的法律法规的制定(1)。其中包括确定吸烟为肺癌和心血管疾病的一个可预防的危险因素。比如在很多西方国家里,过去几十年来的心血管疾病的发病率持续下降很大程度上归功于流行学研究结果所带来的人群生活习惯改变(ref)。尽管流行病学对促进人类的健康是有目共睹的,但这并不意味着流行病学工作者可以满足现状。 过去的几年里,人们越来越关注围绕着“危险因素流行病学”的局限性的问题,并且越来越多地在流行病学文献中反映出来。同其它学科一样,流行病学也会在自我批判中进步。 Susser和 Susser(2, 3)在他们富有特别见解的文章中认为,过去的两个世纪里,流行病学历史的发展有三个代表性的时期,每一个时期都有其代表性的范例:①卫生统计学时期,代表性范例是瘴气说;②传染病流行病学时期,代表性范例是,细菌理论;③慢性病流行病学时期,代表性范例是“黑箱理论”(black box theory)或危险因素流行病学。每一个范例都有其因果理论和成功之处。用瘴气学说武装起来的19世纪的流行病学家认为疾病是由于土壤、水和空气中散发出来的肮脏的晦气引起的,并且通过大家在生态学方面的努力,例如改造排水设备、下水道和卫生设施等成功地使某些传染病的发生和死亡下降。接下来的时期,细菌理论假定疾病的主要原因是微小的有机体,并且认为病因是单一的。这种学说控制了19世纪后期到20世纪中期的大部分时间。该时期,中断疾病的传播主要通过疫苗接种、隔离及抗菌素。许多成就之中,“巴斯德消毒法”对流行病学做出了具有标志性意义的贡献。由于大多数传染病的控制,延长了寿命,以至于慢性病患病率增加而产生了危险因素的模式,它是现代流行病学和黑箱流行病学的标志。“黑箱”这种比喻性的说法,反映了研究与健康结局有关的暴露既不需要插入干预因素,也不需要了解病因机制。例如,常规的流行病学研究常常把重点放在危险因素上,而很少检查可能的致病途径或机制。尽管实际上单一的必要病因和充分病因很少存在,但是从流行病学研究得到的危险因素常常独立于其它因素给予解释。尽管这三个时期是不能截然分开的,但其主要发展阶段和内容可用表一来表示。(在此插入表一)本文是一篇观点性综述文章。我们先对流行病学的发展做一下简单的回顾。然后分以下五个个方面就流行病学的局限性加以论述:个体及群体水平流性病学研究;在研究弱的联系中危险因素流行病学的局限性 ; 当前对于“混杂因子”极其局限性的理解;流行病学中间效应的重要性;及病因的理解。二:个体水平和群体危险 随着近年来对社会经济因素(2-18)及心理因素(19-28)研究兴趣的增加,流行病学的范围也在不断括大。过去的几年里,围绕着流行病学的过去和未来出现了很激烈的争论(14)。其争论的焦点在于忽略社会因素对人们健康的影响上(5)(6, 7)。这些争论极大地刺激了考察社会因素对健康影响的研究兴趣(6, 7, 29)。这种学术的争论自然形成了两类学术阵营,即社会流行病学和传统流行病。社会流行病学的支持者主张将“流行病学”和其它“人群科学”如社会学、人口统计学和生态学等作为群体科学的家族成员结合起来。他们集中于疾病的社会决定因素,倡导社会科学并结合社会的概念和方法(11, 14)。他们认为,由于缺乏对社会结构和社会动力及其对健康影响的理解,导致了确定病因和预防疾病上的重要失败(5, 30)。这一观点在在几篇很有思想的评论文章中得以很好的支持和反映(31-35)。社会、经济和政治因素在群体水平上对人类健康的影响不乏实例。例如,欧洲国家随着工业化的发展结核病发生了很大的下降,该下降远在抗菌素疗法出现之前就发生了(36)。中国自从1980年代以来,随着经济改革和对世界的开放,曾经消灭了的性病复燃了(37)。几项研究表明,失业率与自杀率正相关(38)。虽然社会因素如何影响健康的机制尚未很好地了解,但是有些文献提示,社会环境像邻里环境、工作场所和政策可能通过多个途径包括中间效应影响人们的健康状况(34, 39)。流行病学家可能有一个共同的认识,至少是在常识和简单知识的基础上,个体及个体的健康是由人类所生存的社会所决定的。但是,在了解社会和在研究中实际上包括社会因素之间是有很大区别的。传统的流行病学家宁愿划清流行病学和社会学的界限,他们主张研究社会内容是社会科学的任务,已经超出了流行病学的范畴(40)。另一方面,批评“危险因素流行病学”者认为专门集中在个体上,从策略上讲是瞄准了错误的目标,因为它没有考虑健康的社会和环境的决定因素。的确,不考虑个体,我们就不能理解疾病的机制;但是反过来也很明确,如果忽视社会因素,我们就不能获得对于人群中疾病发生的社会影响的情况。例如,个体研究可以揭示结核病的危险因素是“与受感染的人接触”,“营养不良”等。在群体水平上,“社会的不平等”,“缺少疫苗接种规划”以及“对新移民的无效筛查”可能是致命的问题。个体危险因素的方法有几个局限性(41)。首先,个体危险因素只能解释疾病发生变异的一部分。例如,许多慢性病的大多数病例发生在非高危人群中。其次,很难通过劝说个人改变其习惯来改变个体的危险因素。而且疾病个体之间病因的差别可能与人群之间差别的原因不同(7)。因此,只有通过把个体水平和群体水平的因素结合起来,我们才能对疾病的发生有一个全面的了解并确定最有效的预防策略。虽然当前沸沸扬扬的争论似乎没有立即结束的迹象,但是很显然,流行病学的范畴正在拓宽而包含更多的内容。这一点在流行病学和其它学科如社会科学的结合中已经有所反映,并且在最近的流行病学文献中也越来越多地反映出来。这些变化可能如Susser(2)所描述的,预示着“生态-流行病学”新时期的到来。可能的模式的转变肯定超出了理论的领域,并且必然使传统的流行病学方法产生相应的变化。我们认为在未来的发展中,流行病学应同其它学科密切结合,及时反映研究社会变化对健康的影响。特别是在我国,目前在社会及心理因素对健康的影响尚很薄弱。因此具有广泛的流行病学研究前景。三:在研究弱的联系中危险因素流行病学的局限性 流行病学与生物统计学形成共生关系上是成功的,然而其理论发展是滞后的。评论家认为,在1960年MacMahon“病因网(web of causation)”的概念提出之后,流行病学领域缺乏能被广泛理解的流行病学理论(42)。“病因网”的思想,其注意力集中在与“结局最为接近的危险因素上,主要强调因果关系的复杂性,而不是理论上的描述(10)。正像教科书中反映的,是将方法应用于特殊的健康问题(10, 43)。过去的半个世纪中,流行病家成功地确定了许多非传染疾病的重要原因,例如吸烟,它可以使发生肺癌的危险增加高达20倍。其它类似的已知的流行病学结果其联系强度也是非常强的(相对危险度10或以上),例如聚氯乙烯暴露与肝血管肉瘤(44),二乙基己烯雌酚(DES)与女儿患阴道癌(45),胎儿风疹感染和白内障(46)。随着主要的危险因素逐渐得到确定,流行病学研究必须寻找弱的和中等强度的联系,如疾病与环境和生活方式之间的各种因素。2000年流行病学研究学会会议所有摘要的定量资料提示,所报告的RR大约80%低于(47)。流行病学研究中通常应用的探讨危险因素的方法足以确定强的危险因素,而当评价弱的联系时常常会产生矛盾的结果(48)。事实上有很多弱的联系,饮用咖啡与胰腺癌(49),饮酒与早老痴呆(50),染发和膀胱癌(51),激素替代疗法和乳腺癌(52),以及家庭内氡暴露与肺癌(53)等就是这样。所有观察到的联系有三种可能的解释:①机会;②测量误差或偏倚;③符合真实情况。弱的联系对测量误差和偏倚更为敏感。当暴露和结局的联系弱时,更容易产生机会造成的结果,因为阳性结果比阴性结果发表的机会更多,这是一种发表偏倚(publication bias)(54-56)。根据一些简单的推理和可行性假设,Smith(57)和Skrabanek(58)证明,流行病学文献所报告的阳性联系中将近一半的可能是机会的结果,而不是真正的联系。当研究者把重点放在单个危险因素,并且不能提出一个清晰的理论概念时,与研究弱联系相关的问题甚至更为糟糕。这些问题的一个表现是出现了大量的矛盾的研究结果(48, 59-61),常常是不能得到确定的结论,甚至多次重复同样的研究仍然如此。在流行病学研究论文中,结束语常常是“需要进一步的研究”,以此来安慰该领域里的流行病学工作者。对于流行病学中弱联系的挑战,常规的做法是进行重复的研究。Meta分析常用于系统地总结同一题目的多个研究结果(62)。作为一种系统地综合发表的研究结果的工具,meta分析得到了很大的发展,并且在流行病学研究中得到越来越多的应用(55, 63, 64)。由于meta分析本身并不能改进原研究的质量,在某些情况下可能使系统误差,例如出版偏倚不可避免。尽管meta分析仍然是一种有用的方法,还是非常有必要寻求新的思路和方法。显而易见,与小的危险效应有关的问题,可能不容易通过meta分析得到改进(57, 61)。 这里我们想借助于雌激素替代疗法(Hormone Replacement Therapy, HRT)和预防心脏病的最新研究结果来进一步说明流行病学分析方法的局限性。长期以来很多西方国家的医务人员提倡正常绝经妇女使用雌激素替代疗法。其主要理论基础为流行病学研究显示雌激素替代疗法可以预防骨质疏松症(Osteoporosis)和心脏病。但最近大人群的随机双盲临床试验(65)(Clinical trial )结果发现雌激素替代疗法不仅不会降低心脏病的发病率,相反增加发生心脏病的机会。因此,从根本上否定了很多流行病学研究结果。这一结果也直接导致了美国及加拿大有关部门紧急调整使用雌激素替代疗法的指南。尽管大样本随机双盲临床试验被视为确定因果关系的试金石,但从伦理道德角度讲,它只能用于假设的保护因素而往往不能鉴定危险因素。比如,我们不能用临床试验来证明高脂肪摄和乳腺癌的关系,因为我们不能要求被观测对象为了试验目的而增加脂肪摄入。 因此,为了克服危险因素流行病学的局限性,现代流行病学黑箱思考和分析方式待有改善。像许多人所倡导的,进入“黑箱”并且超越“黑箱”似乎是有价值的努力。进入“黑箱”意味着流行病学研究中描述和将因果机制整合的实践,而不是简单地研究“危险因素”。它还应当在个体水平的因素中,围绕着提出可能的因果机制假设的概念。超越“黑箱”意味着不仅注意直接的因素(或最接近的因素),还应当注意间接的因素(远端的因素),这些因素常常是宏观水平的社会因素。最近的流行病学文献中越来越多地讨论了多水平因果理论和多水平分析的问题。如果概念的模型试图说明所有可能影响疾病变异的社会因素,它将复杂地难以理解,并且不能指导科学研究。然而,如果忽略社会影响或将其看作一组与自变量无关的因素,我们将不能获得全面的科学的理解(66)。 要真正作到进入“黑箱”及超越“黑箱”流行病学需要向微观和宏观的双向结合与延伸,需要与其它相关学科(从反映微观世界的的分子生物学,到宏观群体的社会学)紧密结合。结合我国的流行病学现状,我们认为流行病学在双向结合延伸方面都有差距,但似乎在向宏观结合延伸方面更差一些。 四:当前对于“混杂”及其局限性的理解定义混杂因素和混杂效应 在理论流行病学中可能没有哪个概念比“混杂”受到更多的重视。众多定义中,John Last的“混杂因素”定义被认为是最权威的:“混杂变量是可以引起或防止研究结局发生的一个变量,它不是中间变量,并且与所研究的因素有关联(67)。”显而易见,该定义可以解读为两个纳入标准,一个排除标准,即混杂因素必须是研究结局的危险因素,必须与所研究的因素有关联,并且必须不是研究因素和研究结局之间的中间变量。该定义还意味着危险因素和混杂因素之间没有统计学差异,不需要从理论上区分它们。研究因素与混杂因素之间的联系可能是因果性质的,也可能不是因果性质的。显然,危险因素和混杂因素之间的区别可能在于研究者主要的研究兴趣上,而不是与研究结局有关的统计学上。如图1所示,研究母亲吸烟或饮酒与婴儿出生体重之间的关系。如果研究者的主要兴趣在吸烟上,他就可以将饮酒看作混杂因素。相反地,如果研究者的主要兴趣是母亲的饮酒的情况,他将会把吸烟看作混杂因素。因此,“危险因素”和“混杂因素”之间的差别在于研究的重点所在,而在统计学分析和结果的解释方面没有任何特别的含义。但是这两点表面上很重要的概念在研究中常常令人困惑。例如,在peer- reviewed杂志上发表的一篇文章中,作者试图明确地划分二者,甚至使用了 “教育是混杂因素还是危险因素?” 这样的标题,认为教育是混杂因素而不是危险因素(68)。这个说明显然与混杂因素的定义“作为混杂因素必须是研究结局的一个危险因素”相矛盾。 流行病学研究中混杂效应的常规分析方法及其局限性