我国国际论文的真实影响力分析MedPeer国内先进的医学科研服务人工智能平台科学研究的目的在于创造新的知识以解决未知的问题,科研论文作为传播科研成果最重要的载体之一,承载着记录科研成果和提供学术交流的任务。论文在国际发表,可以让更多的国外同行了解我国最新的科研成果,获得更高的国际影响力,所以在近20年里以SCI为代表的国际期刊论文成为我国科研考核的一个重要指标。在这样的科研管理政策下,我国学者往往将最新的科研成果发表到国际期刊上,使得我国国际论文数量在过去20多年里出现“井喷”式增长。根据《中国科技统计年鉴》,我国的国际论文由1995年的13134篇增加到2017年的361220篇,翻了近28倍,我国已经超越美国成为世界上发表国际论文最多的国家。虽然我国的国际论文在数量上取得了突破,但其质量及国际影响力却一直遭到质疑——我国国际论文的被引用次数虽然已经名列世界第二,但研究显示大量引用是来自我国同行的“自引”,而这种来自本国同行的引用不能完全代表文章的国际影响力。本研究对过去30年我国国际论文的被引用情况进行系统、深入的分析,以了解我国国际论文的被引及自引情况,获得真实的国际影响力。1. 研究综述 引用与科研影响力科研评价的理论基础源于美国著名社会学家Merton的规范主义科学社会学理论——科学是一个有着规范、价值和奖励的社会制度,科学的本质在于创造知识、传播知识以获得同行的认可。基于这一理论,论文和著作成为科研成果的主要呈现方式,其数量也成为国外科研评价体系的主要指标。与此同时,科学社会学理论认为,引用是施引文章对被引文章的一种标记,里面承载着引用者对于被引文章的评价和认识,是一种对于科研成果表示感谢的认可,所以引文也成为评价科研成果质量的重要标准之一。虽然Merton的规范主义理论得,了大多数人的认可,并奠定了科研评价的主要理论基础,但以瑞士著名心理学家Piaget为首的建构主义者却对科学知识的构建与价值提出了不同观点。建构主义理论认为,科学知识是在政治经济发展中形成的一种社会建构,知识的产生来源于人类对社会环境的体验而与自然环境无关。建构主义者强烈质疑“引用等同认可”的观点,认为引用是一种说服的工具——为了让读者接受自己的观点,作者往往在自己文章中引用许多著名学者的文章,以显示其权威性。两种不同理论的存在引发了大量关于引文本质的实证研究,而两种理论都在某些实证研究的结果中得到了证实或部分证实,所以很难说规范主义理论和建构主义理论哪个更好,哪个能更准确地解读引文的本质。虽然目前没有统一的关于引文本质的理论,但规范主义理论仍然被广泛应用于科研评价实践中——论文被引用次数的多少被认为代表其学术影响力。随着互联网的普及以及网络传播的广泛应用,许多学者意识到传统的科研评价仅局限于对发表文章数量和引用次数的计算,已经无法全面地反映科研成果及其影响力。Cronin说,早在2005年就提出需要将博客、网上点评、文章下载量和致谢都包括在科研评价中;Sugimoto等人认为,导师对学生的指导也是一种学术影响力的表现;Desrochers等人认为,社交媒体的曝光度与著作权、引用和致谢一样都代表学术影响力;Priem等人于2010年提出Altmetrics这一概念,认为社交媒体和网络平台中的收藏、分享、提及等行为所反映的影响都应该算是科研成果的另外一种影响力——社会影响力。 科学国际化法国著名生物学家Pasteur在19世纪就提出了“科学无国界”的概念,也算是科学国际化的最早倡导者,他的这一观点被后来的学者普遍接受,并深深植入西方的科研评价理论之中——科学研究不分国界而是为全人类服务的。然而,这一理论从西方发达国家的视角出发,建立在国际学术出版资源被西方发达国家垄断、英语成为国际期刊垄断语言的背景下,并不能普遍适用于英语为非母语的发展中国家。英语为非母语的发展中国家学者为了获得所谓的国际影响力,不得不将自己最新的科研成果发表在发达国家的英语期刊上。在发表过程中,他们除了遇到潜在的语言或意识形态上的歧视,还要无偿甚至付费(开放获取期刊的版面费)将知识产权转让于人;而他们的国内同行为了了解这些最新的科研成果还不得不向发达国家的学术出版商支付昂贵的订阅费用。科学研究为发达国家创造和传播了知识,但很多时候是以发展中国家科研成果的流失为代价的。在二战结束后,随着其他传统学术交流语言(比如法语、德语) 的文章越来越少,英语逐渐占据国际学术交流语言中的垄断地位,在Web of Science收录论文中英语论文的比例由二战前的60%增加到目前的95%。英语对于学术交流语言的垄断导致对其他语种论文的歧视,非英语期刊很难被Web of Science收录,而非英语文章较少被国际同行引用。英语对学术交流的垄断也表现在选题上,许多研究某一国家、地区的本土化选题很难在英语国际期刊上发表。在追求科研国际化的趋势下,许多学者为了发表英语文章,不得不选择一些迎合国际化的题目,这使得许多本土化的研究受到挤压,这一点在人文社会科学领域表现得尤为明显。这一现象在我国的科研活动中也普遍存在,在我国国际论文数量翻了28倍的这25年里,国内论文数量仅仅增加了不到5倍,并且在2011年后出现下滑。为了满足科研考核的要求,我国学者更愿意选择国际化的选题以投稿Webof Sci-ence收录的国际期刊,而不选择只能在国内发表的本土化的选题。即使是既适合国际又适合国内发表的选题,大部分人更愿意发表到国外,从而造成国内大量的优质稿源外流,进而影响国内学者获取同行的最新研究成果。 科研论文的国际影响力在传统的科研评价理论中,引文代表着引用者对于被引文章的认可与致谢,所以文章的被引数量往往被用来评价其代表的科研成果的质量。我国国际论文被引次数的增长也被认为是目前科研评价体系所取得的成就之一。然而,这一统计并没有排除我国同行的“自引”——文章被本国同行引用在科研评价上并不能代表其国际影响力。以往的研究发现,因为语言和研究内容接近,在引用文献时学者们更愿意引用本国同行的文章,这也导致部分国家国际论文的本国自引率较高。这种自引现象在我国学者中尤其明显。唐莉等人在2015年的研究中发现,我国学者的本国自引率高于其他国家学者,而这一结果也被后来的研究一一证实。早在1999年,Bookstein和Yitzhaki发现,本国自引率会影响对不同国家科研评价的结果;Ladle等人则提出,需要在科研成果国际影响力的评价中排除自引;Bakare和Lewison更是提出,一个新的指标"Country Over Citation Ratio"(国家引用率) 来描述不同国家的自引率。也有相关研究探讨我国国际论文的本国自引率问题。Shu和Lariviere发现,我国有些国际论文被国内同行大量引用,从而形成一种国际影响力巨大的错觉;Shehatta和Al-Rubaish也发现,中国国际论文的本国自引率大大高于世界平均水平,需要在衡量中国论文国际影响力时据此予以调整。然而,在我国的各项科技统计中还没有对本国自引和他引进行区分,所以我们尚不知道在排除本国自引之后我国国际论文的真实影响力,这也是本研究需要解决的主要问题。2. 研究问题本研究的目的是用科学计量学的方法分析我国国际论文的真实影响力——在排除我国同行自引的情况下,我国国际论文的被引用情况及其所代表的国际影响力。为此我们将探讨以下三个问题:在过去30年里,我国国际论文的自引率是如何变化的?如果排除自引的影响,我国国际论文的真实国际影响力究竟如何?我国国际论文的真实国际影响力是否因学科而异?需要说明的是:虽然科研成果的传播不局限于期刊论文的形式,诸如图书馆借阅次数、网络浏览和下载次数等都可以反映科研成果的影响力,但在传统的科学计量学研究中仍然倾向于使用引文和引用次数来分别代表科研成果的传播及其产生的影响——因每一次引用都可以视作引用人对被引文献的一种认可和致谢。3. 研究方法为了回答以上三个问题,我们提取1990至2015年Web of Science收录的论文及其引文数据,以了解不同国家、不同学科在国家层次的自引情况,最终计算出我国国际论文的真实国际影响力,并在不同国家、不同学科之间进行比较。首先从Web of Science核心库中提取1990至2015年发表的所有研究论文(文件类型=ar- ticle),总数为23382313篇;同时提取这些论文从发表当年到发表后3年的所有引文数据(比如2015年发表的文章在2015至2018年间的 用数据) ,因为相对较长的调查期(3年)可以更准确地反映出论文的引用情况。所有提取的文章(包括引文)根据第一作者的国家确定文章的来源国家,无论文章有多少个合作者,合作者来自多少个国家,一篇文章只 有一个来源国家,以避免国际合作文章的来源国被重复计算。如果引用文章和被引文章的来源国相同,即可认定是国家层次的自引。与此同时,使用“美国国家科学基金会学科分类系统”(National Science Foundation Classification)将所有Web of Science论文分入14个一级学科(见表1),以分析不同学科自引率的变化。这里需要说明的是,与“ Web of Science学科分类”(Web of Science Categories) 允许将同一期刊分到多个学科不同的是,在美国国家科学基金会学科分类系统中,一个期刊只能被分到一个学科中,这样也避免了同一篇文章在不同学科中被重复计算的可能。为回答前文的三个问题,我们利用收集的数据计算出相应的指标。首先,通过论文的引用文章来源中本国文章的比例计算出历年各国(包括中国)在国家层次上的文章自引率,以回答第一个问题。 然后,在排除自引的数据后,重新计算历年各国(包括中国)的文章国际引用率(国际引用次数/ 发表文章总数)和国际引用比(被国际引用文章数/发表文章总数),以回答第二个问题。最后,深入分析2015年发表文章的数据,按学科分别计算出各国(包括中国)在各个学科的引用率并加以比较分析,从而回答第三个问题。4. 研究结果自20世纪90年代以来 ,我国的国际论文数量和被引用次数都成倍增长,被Webof Science收录的研究论文(article)数量由1990年的6044篇增长到2015年的288856 篇;而论文在发表后3年(含发表当年)被引用次数也相应地从7809次增加到2329399次,两个数据都仅次于美国,位列世界第二。与此同时,我国国际论文的自引率也由1990年的增加到2015年的,而在同期内全球包括西方七个主要工业国家(同时也是世界前十的论文发表大国)的自引率均有下降——全球自引率由1990年的下降到2015年的,原来自引率最高的美国在同期由下降至,而其他几个西方主要国家的自引率均已下降到40%以下。目前我国是论文自引的第一大国,自引率远远高于其他国家,而且自引率增长的趋势还在继续(见图1)。如图2所示 ,在不排除自引的情况下,我国国际论文的引用率在2013年超过全球论文的平均引用率,由1990年的增加到2015年的,不仅超过了全球平均水平(),而且仅次于美、英、德三国,排名世界第四。如图3所示,在被引用文章比例上,我国国际论文也由1990年的增长至2015年的,不仅超过了世界平均水平(),而且与西方主要国家相差无几。但是,这些国际影响力的数据在排除了自引之后大幅下降,我国论文的国际引用率虽然在过去30年里不断增长,但在2015年仍然只有,不仅低于国际平均水平(),而且在全球只能排在第128 位。而在论文国际引用比上,我国在2015年的论文国际引用比只有,低于国际平均水平(),在全球只能排在第136位。如果我们深入分析,2015年发表的文章及其在随后3年里的被引情况,可以得到各个学科内全球和我国的自引率及其对科学计量学指标的影响。如表2所示,在根据美国国家科学基金会学科分类系统划定的14个一级学科中,我国国际论文的自引率在其中12个学科中高于全球平均水平。只在临床医学 () 和物理()两个学科中自引率略低于全球平均水平(和)。如果不考虑自引的影响,我国国际论文的引用率在一半学科中高于全球平均水平,而在剩下一半学科中略低于全球平均水平,但如果将本国的引用排除在外,我国国际论文的国际引用率在除临床医学(比)和物理(比)外的其他12个学科均低于全球平均水平。在不排除自引的情况下,我国有9个学科的论文引用比高于全球平均水平,但在自引被排除后,只有艺术(比)、临床医学(比)、物理 (比)、健康卫生(比 )和社会科学(比)五个学科的论文引用比略高于全球平均水平。最后,我们对2015年的所有论文进行引用来源追踪(见图4),发现最喜欢引用本国文献的不是我国学者而是美国学者。在所有对2015年论文的引用论文中,美国论文的参考文献中有是本国同行的文章,而中国学者引用本国文献的比例为 ,其他西方主要国家均低于40%。不同的是:因为有大量其他国家的引用,2015年美国论文的自引率只有;相比之下我国2015年国际论文被其他国家引用较少,自引率高达,这在一定程度上说明我国国际论文的真实国际影响力仍然较弱。5.研究探讨以往对我国论文自引率的研究发现,我国学者喜欢自引是因为对国内同行的研究成果更了解、更容易获取,而外国学者的文献由于高额的期刊订阅费用而难以获取,这使得我国学者更多地引用本国文献。也有研究认为,随着我国国际论文数量的增长,我国国际论文自引率随着可引用文章数量的增加而增长属于自然现象。但是,本研究对我国国际论文高自引率的原因却给出了不同的解释。 国际论文占有率在20世纪,美国一直是全球自引率最高的国家——这与其所发表的国际论文数量不无关系,美国长期以来一直是全球发表国际论文最多的国家,某些学科甚至一半以上的论文都是来自美国,考虑到美国学者的研究在大多数学科中都处于领先水平,所以美国学者许多时候“不得不”引用本国同行的文章。如图5所示 ,美国的论文自引率与其论文数量在全球的占有比例具有高度相关性,相关系数高达——美国论文的自引率基本上就是随着其论文数量在全球所占比率的下降而下降。我们也在英国和我国的国际论文中发现了这种相关性——英国自引率也是随着其国际论文占有率的下降而下降,两者的相关系数为;我国国际论文的自引率则是随着我国国际论文数量在全球所占比率的增加而增加,其相关系数为。然而,一个国家的国际论文自引率和占有率的相关性并不能完全解释我国国际论文的高自引率。通过比较可以从数据中看到差异:当美国的论文自引率为60%时,其论文数量在全球占比大概为36%;而当其论文自引率为50%时,其论文数量的全球占比大概为24%;我国国际论文数量在全球占比只有时,其自引率就已经超过50%了;而论文数量在全球占比刚过12%时,自引率就已经达到60%。当然,从这一角度来讲,自引率和国际论文占有率的相关性只能解释我国在过去30年间自引率的增长,但无法解释在同样占有率的情况下为什么我国国际论文的自引率远高于其他国家。 文献的可获取度在科学文献数量呈指数增长的时代,无人可以阅读与自己研究相关的所有文献,而文献的接近性和可获取性将直接影响施引者的引用行为。我国学者更倾向于引用本国同行的文章与获取国外文献的难度相关——这里的难度既包括由于高额版权费用而放弃订阅,也包括由于语言原因放弃阅读。二战之后,通过购买和兼并,商业出版社不断增加其在学术期刊市场的份额,国际学术出版市场由一个竞争的时代进入寡头垄断时代。垄断的结果就是国际期刊订阅费用水涨船高,许多高校和科研机构不得不取消部分期刊订阅,许多国内学者经常为了免费下载一篇同行的论文而在网上寻求帮助。虽然现在获取国际文献已比二三十年前容易许多,但还是无法像获取国内文献那样便捷,这也导致国内学者较少引用国外文献,转而更多引用国内同行的文章。然而,从施引文章来看我国学者对国外文献的引用其实并不少。在2015年所发表的文章中,我国国际论文的参考文献中只有是本国文献,相比之下美国学者的论文中有的参考文献来自美国文献。我国国际论文高自引率并不是因为我国学者只引用本国文献,而是因为我国国际论文较少被其他国家的学者引用。 目标置换效应与学科差异科学研究是为了创造并传播知识,但在科研政策的强大导向作用下这一目的出现了“目标置换效应”(GoalDisplacement Effect)。许多国际论文是为了发表而发表,这样的文章无法获得其他国家学者的认可与致谢。这一点从论文引用比上反映得十分明显,在排除自引以后,美国仍然有3/4以上的论文被引用,而我国国际论文只有2/3获得来自国外同行的引用。我国论文自引率高的主要原因是来自国外学者的引用太少,换句话说,我国国际论文的国际影响力确实不足。另外,科研国际化的政策往往没有考虑到不同学科的差异。在研究主题国际化程度非常高的医学、物理等学科领域,无论是中国学者还是其他国家学者,所研究的都是类似或相关的主题,在这些学科领域我国国际论文收到的国际引用也较多;而在研究主题非常本土化的人文社科领域,本土化的研究论文很难被国际期刊录用,即使录用后也只有有着相同背景和研究方向的本国同行会去引用,这就是为什么我国人文社科领域国际论文的自引率超过70%,而临床医学、物理的自引率低于国际平均水平。6. 研究总结通过分析过去30年我国国际论文的被引情况,发现我国国际论文的国际影响力因为国内同行的自引而被高估,其真实国际影响力也低于国际平均水平,具体的研究发现包括如下三个方面:我国国际论文的自引率在过去 30 年里不断增长,目前远远高于国际平均水平。在排除自引的影响后,我国国际论文的国际影响力远低于国际平均水平。我国国际论文的国际影响力因学科而异,在排除自引后我国国际论文仅在临床医学和物理两个学科领域高于国际平均水平。本研究的发现对于我国科研管理有着重要的启示作用。 科研评价导向鼓励甚至要求科研成果在国外发表却没有考虑学科差异,在评估论文的国际影响力时没有考虑自引的影响。研究结果显示,虽然我国发表国际论文的数量已经是世界第一,但国际影响力仍然有限,尤其是人文社科领域的国际论文由于研究主题的原因很难获得国际同行的引用。这种学科差异应该在制定科研评价政策时予以考虑,同时从科研管理的角度出发,人文社科领域研究不需要强调国际化,而应该立足中国大地,研究中国问题,更多地满足国内的需求。