1、第一,论文检测包括几个查重子系统,但是这些查重子系统的计算规则都是一致的,换言之,论文检测率的计算规则是统一的,即若一段文字内连续十三字以上重复即判定为该部分为重复部分,而用该重复部分的字数除以全文的总字数,就构成了论文检测率。
2、第二,全文的论文检测率是每章节每段的重复字数除以全文的总字数,但是,论文检测报告当中,大家都可以看到有一部分是显示去除引用重复率,而该部分重复率和全文重复率又有所不同,该部分的重复率是去掉全文引用部分的重复率,换言之,只要原文标注了引用,该部分就会不会再显示引用部分的重复率,这也是知网科学化以及智能化的体现。
3、第三,论文检测率目前既可以查文字部分,也可以查代码、公式、表格甚至外文的重复率,即,无论是原文本身的文字部分,还是其他表格、公式、代码等部分都会计算入查重的查重范畴以内,这些部分若出现重复,也会以论文检测率的形式显现出来。
若一段文字内连续十三字以上重复即判定为该部分为重复部分,而用重复部分的总字数除以全文的总字数,就得出了查重率。
无论谁写论文,论文查重率达到0%基本上是不可能。这是因为论文中不可避免地会引用一些句子或类似于他人论文的部分,因此重复是不可避免是正常的。一般来说,本科毕业论文的查重率不高于30%,硕士论文的查重率不高于15%。
论文查重率等于抄袭的文本部分与总文本的百分比。当作者将论文上传到查重检测系统时,查重系统将对比整篇论文和自身数据库。并用红色标记论文中与数据库数据相同或相似的部分。也就是说,如果有大量的红色文本,这意味着文本查重率比较高。
当系统进行检测时,论文查重系统会根据特定的算法自动将论文分成章节,然后进行句子对比检测。如果句子中连续13个以上的字符跟查重系统数据库相似,则该部分将被认定为重复。通常参与查重检测的论文内容有摘要部分和文本部分,论文中的图片、图表、代码和数学公式不参与查重检测。
论文查重简单来说就是将作者提交检测的论文与系统自身的数据库资源进行比对,最终查重系统自动生成一份查重报告,得出一个总体相似度,也就是我们常说的论文查重率。判定规则是连续出现13个字符类似就判断为重复部分的标准计算论文重复率。
总体相似度的计算方法是:论文中与数据库中相似的字数和论文的总检测字数的比值。查重系统首先将提交的论文通过换行符自动切分成段落;然后再按照段落中的标点提取段落中的句子;最后再进行逐句查重检测。目前,查重系统不会判定相似语义为重复,其相似度更多的是文字本身的比对,包括关键词以及这个关键词出现在句中的位置。
论文查重包括论文正文、原创说明、摘要、图标及公式说明、参考文献、附录、实验研究成果、结语、引言、专利、文献、注释,以及各种表格等等。大多数高校在每年毕业季时,都会统一发通知说明学校的毕业论文规范和查重说明,学校会统一下发论文样式等内容,一般会详细说明查重的范围。要是学校有具体的要求,那提交到学校的时候必须按照学校所要求的来。