论文查重对学生毕业和在职人员的职称评定非常重要,各单位和学校也将其作为判断的主要依据之一。那么论文查重的判断依据是什么呢?
论文查重是上传整篇论文,系统根据目录划分段落,根据段落标点划分句子,对每个句子的每个段落进行查重检测。每一段都会在报告中显示重复率,整篇文章也会在报告中显示整体重复率。
全局相似度 = 相似字数/被检测字数总和,系统可以自动识别非主要部分的内容,并且不参与重复检测。以paperfree的查重检测系统为例。如果论文一段句子连续重复超过好几个字符重复,或超过查重检测技术系统可以设定的5%阈值,则视为抄袭复制。
正确的格式在上传论文时非常重要。例如,上传的文章没有目录,论文系统根据第一章进行分段检测,这将极大地影响论文的重复率。
绝大多数学校查重检测内容包括论文题目,摘要,关键词,目录,论文的正文部分,参考文献,附录以及致谢等;其中,摘要包括中文摘要和英文摘要都参与查重,基本上就是论文中你自己写的部分都参与查重;硕博论文中的原创声明,版权声明等内容是不参与查重的。
实际上, 每个学校和期刊都有自己的查重范围,大家可以咨询一下师兄师姐,或者直接问导师,或者咨询学术不端查询中心,这些都是确定查重范围的方法。
以下列举一些降重方法:
一、字数检测
对于不同的论文检测系统,都有自己的标准,不过有一个共同点,就是论文当中只要单词数超过20个单位的,与原本数据库当中的论文字数一模一样的话,则被认定为抄袭。所以在参考别人文章时不要大篇幅复制黏贴,最好能通过自己理解并且从新表达出来。
二、章节变换
需要提取其他人的论文资料,不仅通过改变句子的表达方式,也需要对一些章节进行变换,千万不要全盘抄袭,否则是没有办法通过的。我们可以通过参考多篇论文的方式,将其中的要点提取出来重新写作,这样效果会比较好一些。
三、格式与段落
在进行论文查重时,我们都是整篇文章上传,上传后,论文检测软件首先进行部分划分,上交的最终稿件格式对抄袭率有很大影响。不同段落的划分可能造成几十个字的小段落检测不出来。因此,我们可以通过划分多的小段落来降低抄袭率。部分论文检测系统对于段落与格式是直接忽略的,故只做小段落的划分不是能完全降低论文查重率。
四、数据库
论文检测,大多是针对已发表的毕业论文,期刊文章,还有会议论文进行匹配的,有的数据库也包含了网络的一些文章。建议大家可以通过书籍寻找参考文献,很多书籍是没有包含在检测数据库中的。
五、参考文献标注
参考别人的文章和抄袭别人的文章都需要在论文中加入参考文献的引用符号,每一款查重检测软件都有阈值,比如中国知网的被引阈值为5%。如果一段有1000个英语单词,那么一篇文章引入的单词数不能超过50个。即使加了参考文献,也会被判定为抄袭。所以在标注参考文献时也要注意在阈值范围内引用。
论文查重简单来说就是将作者提交检测的论文与系统自身的数据库资源进行比对,最终查重系统自动生成一份查重报告,得出一个总体相似度,也就是我们常说的论文查重率。判定规则是连续出现13个字符类似就判断为重复部分的标准计算论文重复率。
总体相似度的计算方法是:论文中与数据库中相似的字数和论文的总检测字数的比值。查重系统首先将提交的论文通过换行符自动切分成段落;然后再按照段落中的标点提取段落中的句子;最后再进行逐句查重检测。目前,查重系统不会判定相似语义为重复,其相似度更多的是文字本身的比对,包括关键词以及这个关键词出现在句中的位置。
论文查重包括论文正文、原创说明、摘要、图标及公式说明、参考文献、附录、实验研究成果、结语、引言、专利、文献、注释,以及各种表格等等。大多数高校在每年毕业季时,都会统一发通知说明学校的毕业论文规范和查重说明,学校会统一下发论文样式等内容,一般会详细说明查重的范围。要是学校有具体的要求,那提交到学校的时候必须按照学校所要求的来。
1、把多篇不同的论文拆散然后再进行组合,或者是自己的一篇论文投过很多次稿,一般都是会被检测出来重复的,会被视为抄袭,当然仅仅只是少量的文字和句子有摘抄的话,影响不会很大。
2、摘抄大段和逐字逐句的摘抄,或者是将其他文章中的章节仅仅只改变几个字或者词就放入自己的论文之中,通常也是会检测出来重复,视为抄袭;
3、想将其他论文文献中的资料引用到自己论文中,但是引用格式没标注正确的话,也有可能是会被检测重复视为抄袭的。
4、对于一些图片和表格的复制,虽然大部分查重系统不会进行检测,但是知网论文查重系统最新的VIP论文查重系统是可以检测出来的;
5、在引用和参考他人文献时,要注意使用的字数,超过规定的阀值也会被视为抄袭。
大家掌握好论文查重的规则后,在检测论文时一定要注意不触犯规则。大家进行论文初稿检测可以使用paperpp论文查重网站,进行定稿检测时最好是使用与学校一致的论文查重系统。
参考资料:《论文查重的规则是什么?》