学术不端行为的划分是一个政策性极强的工作,同时也涉及许多法律问题。迄今位置,国内外还没有一个被广泛接受的标准。中国学术不端行为的表现形式(此处列出中国科协科技工作者道德与权益工作委员会提出的中国学术不端行为的七种表现形式,以供参考)抄袭剽窃他人成果。伪造篡改实验数据。随意侵占他人科研成果。重复发表论文。学术论文质量降低和育人的不负责任。学术评审和项目申报中突出个人利益。过分追求名利和助长浮躁之风。学术文献不端行为具体表现形式实际上,学术不端行为存在于学术活动的全过程。学术文献出版中的不端学术文献由于其公开性,被广泛传播,以及发表后可能会引展出的一系列问题,使其与其他不端类型相比,更尤其严重。学术不端文献的特征分析是其计算机自动检测的基础。学术期刊论文发表中学术不端文献可以大致分为以下五种:抄袭一稿多投一个学术成果多篇发表不当署名伪造、篡改。1、抄袭《辞海》关于抄袭解释:“窃取别人的文章以为己作”。关于剽窃的解释为:“抄袭,窃取他人的文字以为己作”。可见,抄袭与剽窃为同义语。通常认为学术抄袭就是:使用他人作品的内容而“不注明来源”,即不承认该内容来源于他人的作品,而把他人作品的内容据为已有。可以看出,抄袭是一种复制行为,然而复制不都构成抄袭。如合法的转载不能认为是抄袭。是否注明来源就不构成抄袭呢?世界各国著作权法中都规定了合理引用的权利。如为评论而引用有版权的作品视为合理引用。中国著作权法规定:“为介绍、评论某一作品或者说明某一问题,在作品中适当引用他人已经发表的作品”视为合理使用。王毅在《论抄袭的认定》[4]一文中指出“合理性”的三个重要特征:“新作必须区别于原作”;“新作必须独立于原作”;“原作的引用必须适宜于新作”。有的文献大段大段的复制别人的内容,虽注明了出处,是否不构成抄袭?然而未有关于引用数量的一致意见。据国外专家介绍,对于期刊论文,认为有超过10%的内容相同,即构成抄袭。还有专家要求更严,甚至不能有完全相同的句子。根据中国的实际情况以及中文的特点,我们认为以期刊论文为例,如有30%以上的文字复制可以认定为抄袭。为便于识别抄袭,我们从抄袭的形式上可以将其进一步分类。如可以分为文字抄袭与非文字抄袭。文字抄袭,就是拷贝粘贴别人作品的文字内容。非文字抄袭又可分为思想性抄袭与数据图表抄袭。抄袭别人的论点、概念、原理、方案等都属于思想性抄袭。根据抄袭来源可以分为只抄袭一篇文章的单源抄袭与从多篇文章中拼凑的多源抄袭。根据抄袭段落的特点可以分为抄袭同一段落的单段抄袭与抄袭多个段落的多段抄袭。抄袭有一个很有趣的现象,就是被抄袭源有时也是抄来的,因此有时需要追根溯源,才能查到抄袭源头。有时会发现正常引用的文献却是抄袭来的。 还有一种情况是自我抄袭。在学术文献中,存在大量学者在自己的文章中大量复制自己其他文章中的内容。自我抄袭应引起足够的重视。2、一稿多投同一作者将同一篇论文投给两家或两家以上学术刊物同时发表或先后发表称为一稿多投。一稿多投浪费了有限的出版资源、编辑与审稿专家的宝贵时间,违反了学术传统,侵害了期刊社的专有出版权。同时也损害了期刊的声誉与读者的利益。由于作者与编辑部之间的沟通问题,导致完全相同的文章,几乎相同时间在不同的媒体上重复发表是一种客观的一稿多投。客观的一稿多投虽然其主观恶意较少,但不容忽视。作者由于追求发表量而故意一稿多投是一种主观的一稿多投行为。其特点为:内容大部分相同,只有局部不同,如行文次序调整,或文章名称略有不同,在不同媒体上重复发表。判断一稿多投的基础是能够确定作者是相同或是不同的。只有相同的作者才有一稿多投问题,否则就是抄袭。3、一个学术成果多篇发表一个学术成果多篇发表是指将一篇论文拆成几篇发表、一次性成果多次反复使用、同一成果被拆分成多篇文章发表、同一实验被分成多种角度阐发。其主要特点是作者相同,多篇文章主题完全相同,内容大部分重复,只有少部分不同。 一个学术成果多篇发表是作者过度追求发文量的必然结果。其结果是既降低了学术质量,也损害了读者的利益。4、不当署名在他人作品上署名。包括故意署名与被动署名两种情况。前者是署名者未参加有关研究工作却为了某种目的故意在别人作品上署名,或侵占他人成果,使应该署名者不能署名或署名靠后,或提高署名者的成果数量。后者是指原作者为了提高作品的评价或发表机会擅自在作品上署上知名作者的姓名。不当署名情况相当严重,然而却缺少很好的技术手段精确检测。TMLC系统对前三种情况均可以较好的处理,但对于不当署名还只能提供一些线索供参考。不当署名的存在有其复杂的社会因素。如导师在学生的成果上署名,领导在下属的成果上署名,集体成果的署名等,有时就连专家也难以判定。5、伪造、篡改伪造就是不以实际观察和试验中取得的真实数据为依据,伪造虚假的观察与实验结果。包括伪造研究数据,研究结果。比如虚构发表作品、专利、成果。为了提高文章发表机会甚至有人伪造论文获得国家重点基金资助。篡改指科研人员在取得试验数据后,按照期望值随意篡改或取舍数据,以符合自己的研究结论,一般有主观取舍数据和篡改原始数据等形式。伪造与篡改还难以用计算机来自动检测。学位论文学术不端行为具体表现形式学位论文本身主要的问题在抄袭、伪造与篡改,没有一稿多投、一个学术成果多篇发表、不当署名等问题。但通常,作为学位论文工作的一部分,许多学生还被要求发表若干期刊文章,才能获得学位。因此,一个全面的学位论文的检测工作还必须包括有关的期刊文献的检测。