学术期刊发表的论文两年内被引用的平均次数被定义为“影响因子”。一个普普通通的变量,“两年平均引用次数”,为何要动用这样的一个唬人的术语呢?它与期刊影响力究竟有什么关系?如果不能正确回答这些问题,就无法确定用这个指标来进行科研管理是否可行、是否有效。这个术语,英文写为“Impact Factor”(简写为IF),来源于一家美国科技情报研究机构。该机构早期是提供科研信息服务的,主要是为研究者提供学术刊物信息,后来逐渐演变为盈利机构,通过提供科研服务来获取利润。这种变化有一个世界性的背景。20世纪后半叶,科技的重要性使得各发达国家,还有一部分后起的发展中国家,大幅度增加了科技投入。投入必然产出研究论文、报告、专利等物化成果。对于研究者个人来说,成果在哪里发表事关自己的学术生涯发展,是个大问题。发表论文的人,总希望自己的论文被同行所关注并引用。抓住这种心态,搞一个论文发表后两年内的平均引用次数,就成了指标的第一选择。你想,如果你是一位年轻研究者,一家期刊能够让你的论文发表后两年内就被多次引用,这难道不能让你动心吗?你博士毕业后计划做两年博士后,难道不渴望能在两年后晋升副教授职位吗?那么好,这家机构及时送来了这种信息,告诉你哪些刊物能帮助到你。为了让你容易记住,该机构还把这个指标比较靠前的一批刊物命名为“SCI刊物”。20世纪后期,有数千家期刊被选入SCI刊物名录。这下问题简单化了:一位年轻学者的投稿方向就是SCI刊物,而且“两年平均引用次数”越多,就越值得优先投稿。研究者这边的问题解决了,但要把这个指标卖出去,科研管理者那里也要搞定才行。最大的难点是如何让科技管理者信服这个指标。从科研逻辑上说,这个指标显然是不具备说服力的。为什么两年里引用次数多的论文是好论文?哪些人在引用、如何引用的问题是否也应该问一下?要打消管理者的此类顾虑,还要另下一番功夫。由于学术界看重的是学术影响力,管理者也必须尊重学术影响力。因此,如果能够指标描绘成一个学术影响力指标,就容易被管理者做接受。怎样才能做到呢?答案是把逻辑搞乱,“逻辑越混乱,结论越有趣”。在实际操作上,把两年平均引用次数说成是影响因子,要弄出一个复杂过程。首先要把关于学术影响力的要件拿过来,例如论文发表后的引用情况如何、哪些学者在引用、论文对他人的研究有何影响、作者发表论文之后得到了哪些声誉,等等。要件取得越完整,学术界就越认可。第二步是把情况简化,找到特定条件下的案例,说明有影响力的论文均与引用情况相关联,这种案例很多,很好找。第三步再往前推一步,说引用情况好的论文就是影响力大的论文,此类论文的载体就是好期刊。不幸的是,这种不成立的推论能蒙住很多人(有一部文学作品企图揭露这件事,所用的例子是:所有精神病患者都不承认自己有精神病,你拒不承认自己有精神病,因此你必然有精神病,应该关到精神病院里去)。最后一步是关键性的,就是要抛弃掉“两年平均引用次数”这个平凡名称,而改用一个“影响因子”名称,让人不自觉地将其与学术影响力相联系。有了这个高大上的名称,不怕科研管理者们不就范。只要有部分管理者开始接受,哪怕他们只是为了图省事而接受这个简单指标,就会迫使其他人也最终不得不接受这个指标。以上所述的,就是一个平凡变量演化为唬人术语的原因和过程。无论最初搞这些指标的人动机如何,后来确实就变成了逻辑混乱的一团糟。要澄清这种混乱,还需要多说几句。从源头上说,期刊影响力是由所发表的论文决定的,发表某个研究领域和方向的第一篇论文(称为“首发论文”),可以见证刊物编委会的眼界;在重要方向上系统性地发表有理论和技术突破的论文,可以表明编委会成员自身的学术造诣;而发表有才气、有智慧、有远见的论文,则是彰显了刊物的品位。这几个方面都很突出的刊物,肯定是影响力大的刊物。就引用次数而言,一般化的引用并不重要,被看出科学问题要点的人引用,被欣赏论文智慧的人引用,被做前沿研究的高水平学者引用,引用之后能产生新的研究方向、科学问题、应用成果,这些才是真正要紧的。显而易见,在“IF” 那里这些评价都是缺失的。作为科技信息的采集者,他们并没有下功夫在这些方面构建指标。这说明,关于学术影响力的内涵方面,管理者必须另加考虑,用所谓影响因子这样的指标是不靠谱的。以后的人们来研究科学史,会把根据“影响因子”对刊物进行排名、分区的做法当成超级玩笑。退一步讲,即便我们不讲内涵,只讲数量,两年平均引用次数能否作为影响因子呢?答案仍然是不能。设想,我们试图根据引用次数来比一比各位研究者水平的高低。前面提到的那家科技情报研究机构自身提供的数据就表明,每篇论文、每个学术期刊都有一个“期待引用次数”,即论文发表后可被学术界引用的预期平均总次数。根据定义,期待发表次数大于或等于两年平均引用次数与论文半衰期(即从论文发表之日到引用高峰出现的时间长度)乘积的两倍。举例而言,如果一个期刊的两年平均引用次数为三次,半衰期为十年,则其论文的期待引用次数将会大于或等于60次;另外一家期刊的上述参数分别为六次和三年,则其期待引用次数仅为约36次。从这个例子可以看出,由于两年平均引用次数并非期待引用次数的唯一控制变量,因此在所谓高影响因子刊物上发表的论文并不一定总引用次数也高。真实的情况也是,主流期刊无论IF如何,论文总引用次数都是靠前的。所以说,对于研究者而言,即便仅仅出于引用次数的考虑,也应选择期待引用次数高的刊物,而不是两年平均引用次数高的刊物。对于科研管理者而言,还有另外一个问题,即评价刊物和评价个人是不同的两件事。一个刊物有较好的期待引用次数,有可能是个好刊物,但涉及到研究者个人时,无论其论文在哪里发表,还是要看实际的引用情况。设想,某位研究者在两年平均引用次数为十的刊物上发表论文,而此后的两年里只被引用了五次,那么在引用次数这个指标上,这篇论文实际上是在拖刊物的后腿。综上所述,我们提出以下几点意见和建议。(1)搞科技情报工作,给研究者提供学术期刊信息,这本身是一种服务,没有错,给一些变量下定义起名字也是可以的,但“IF”错在术语表达不准确。把两年平均引用次数说成是影响因子,就如同把犯罪分子每年作案次数定义为行善指数一样,前者歪曲了“影响”的意思,后者歪曲了“行善”的意思。今后凡出现“影响因子”表述的地方,应该一律回归原意,用“两年平均引用次数”来取代。(2)对于研究者个人,建议在选择投稿刊物时,首先应考虑其学术声誉,与正规科学家为伍,你也就成了正规学者,就有学术生涯的真正发展。在数量指标上可考虑“期待引用指标”,投稿时选择那些两年平均引用次数与半衰期乘积较大的刊物。(3)科研管理者要区分对刊物的评价和对研究者个人的评价。对前者,在内涵上要考察刊登经典论文和重要论文的情况,以及作者学术声誉,在外延上要看刊物的期待平均引用次数;对后者,在内涵上要看所发表的论文是否有理论或技术进步,在外延上要看论文发表后被优秀学者的引用情况。对人的评价是一项细致的工作,不能马虎、偷懒、简单、粗暴。科研管理的有效性是管理者工作成绩的衡量标准,如果管理不当,投入再多也难以产出好的成果