排除作者存在抄袭这种学术不端的行为,论文重复率高一般与选题以及个人语言习惯有关。
先来谈谈查重的原理。目前的常用的、比较权威的查重网站主要有中国知网和万方数据库等,而不管是哪一种查重方式,原理都是将论文与已经发表的文章进行对比。用于对比的文章既包括发表在期刊上的论文,也包括优秀硕博论文。简言之,数据库会将目前已经发表的文章与用于查重的论文做对比,如果单句或者整段的相似度太高,那么论文的重复率就会很高。
一方面,论文的重复率高与文章的选题有关。毕业生为了让自己的论文能够过审,很多人都会选择热门的研究题目,而热门的题目势必会有很多人已经研究过,且凭借学生的能力不可能提出完全创新的观点,所以他的文章与别人重复的地方就会很多。
另一方面,专业术语的使用以及语言习惯也会导致重复率高。毕业论文中会涉及到专业术语以及专业名词的解释,而专业名词统一的标准定义,毕业生没法修改定义,所以重复率会很高。而且每个人的语言习惯比较相似,对同一句话的表达方式也基本相同,所以如果文章中出现了“套话”,那么这句话和已发布论文中的话基本相似也是不可避免的。
当然除了以上两种原因,还有一种论文重复率高的原因是这篇文章本来就是抄袭的。有学生学习不好,不注重知识积累,那么他们毕业论文写不出什么东西,而为了毕业就不得不大段的复制别人已发表论文中的句子,通过这种方式写出的文章重复率自然很高。
其实论文重复率高并不必然表明这篇文章就是抄袭所得,但是为了防止学术不端行为的发生,严格把控论文重复率也是降低抄袭可能性的重要方法。