论文查重简单来说就是将作者提交检测的论文与系统自身的数据库资源进行比对,最终查重系统自动生成一份查重报告,得出一个总体相似度,也就是我们常说的论文查重率。判定规则是连续出现13个字符类似就判断为重复部分的标准计算论文重复率。
总体相似度的计算方法是:论文中与数据库中相似的字数和论文的总检测字数的比值。查重系统首先将提交的论文通过换行符自动切分成段落;然后再按照段落中的标点提取段落中的句子;最后再进行逐句查重检测。目前,查重系统不会判定相似语义为重复,其相似度更多的是文字本身的比对,包括关键词以及这个关键词出现在句中的位置。
论文查重包括论文正文、原创说明、摘要、图标及公式说明、参考文献、附录、实验研究成果、结语、引言、专利、文献、注释,以及各种表格等等。大多数高校在每年毕业季时,都会统一发通知说明学校的毕业论文规范和查重说明,学校会统一下发论文样式等内容,一般会详细说明查重的范围。要是学校有具体的要求,那提交到学校的时候必须按照学校所要求的来。
论文查重是借助论文查重系统进行的,论文作者只需要把论文上传到查重系统,系统会根据论文目录进行分段查重。
1、在查重报告中,标黄色的文字代表这段话被判断为“引用”,标红色的文字代表这段话被判断为“涉嫌剽窃”。
2、查重是以“连续13个字重复”做为识别标准。如果找不到连续13个字与别人的文章相同,就检测不到重复。
3、论文中引用的参考文献部分也是会计算相似度的。
4、在知网的对比文库中,外文资料相对较少。
5、对比文库里不包括书籍,教材等。但有一个问题要注意,当你“参考”这些书籍教材中的一些经典内容时,很可能别人已经“参考”过了,如果出现这样子的情况,那就会被检测到相似。
6、检测系统对论文的分节是以“章”作为判断分节的。封面、摘要、绪论、第一章、第二章、等等这样一系列的都会各自分成一个片段来检测,每一个片段都计算出一个相似度,再通过这样每章的相似度来计算出整篇论文的总重复率。
7、当查重系统识别到你论文中有某句话涉嫌抄袭的时候,它就会对这句话的前面后面部分都重点进行模糊识别,这个时候判断标准就变得更严格,仅仅加一些副词或虚词(比如“的”、“然后”、“但是”、“所以”此类词语)是能够识别出来的。
8、在查重进行中,检测系统只能识别文字部分,论文中的图片、word域代码、mathtype编辑的公式、是不检测的,因为检测系统尚无法识别这些复杂的内容格式。可以通过[全选]——[复制]——[选择性粘贴]——[只保留文字]这样步骤的操作来查看具体的查重部分。另外,在编辑公式时,建议使用用mathtype,不要用word自带的公式编辑器。
9、在论文提交到学校之前,一定要自己先到网站查一下,如果有检测出来相似度较高的片段,自己先改一改。 论文修改一次以后,不要以为就肯定能过了,因为系统会根据论文内容的不同自动调整着重检测的段落,所以有时候第一次查重的时候是正常的,一模一样的句子,第二次检测的时候会判断为“抄袭”。这也是没有办法的,只能多查多改。
10、官方检测系统不对个人开放,学生自己是无法自行到知网去检测论文的,只能通过第三方检测平台进行。
论文查重的相关说明
论文查重,不同学校要求也不同,当然对于硕博与本科等区别也比较大;本科院校30%以内的也有,15%的也有;硕博的10%内的也有,所以同学们在查重前咨询下学校的要求,这样才能够有把握。
对于查重的原理基本上是一致的,没有区别;但是对于投稿的论文查重,建议使用跟杂志社要求的系统一致,比如知网期刊;如果需要排除作者自己的论文,那么只有查知网的才可以,其他的系统无法进行排除。
对于论文查重系统,并不是什么内容都查的出的,主要看文献库是否收录了当前内容,如果没有,那么就是查不出的。
对于论文查重系统来说并没有那么神秘的地方,同学们查重完成后,只要根据查重报告好好的修改,基本上都是没问题的。
标准
通常大学本科毕业论文的查重标准为30%以下;硕士毕业论文的查重标准为15%-20%。
原则
1、安全原则。很多学校都有自己的一套论文检测系统的,但不一定要开个人用户,如果你坚持使用相同的检测与学校系统,将会被记录,通过一个不知名的网站查重,会存在问题很大的风险性,如果可以被上传到网上面,那么我们后续的查重率肯定是100%了。
2、实用原则。很多人都认为,学校用啥检测,我们就提前用啥检测,殊不知,良好的系统检测只是为了要最后那个重复率的数字,而其查重报告对于修改来说,根本不方便。你都不知道是那几个词引起的重复。
3、修改原则。论文修改,无非是同义换词和同义换句。因为,将一句话中造成重复的词汇换掉,就有可能拯救了整句话。这是最快的修改方法。