篇论文提交上传至论文查重系统检测后,论文查重系统会将论文内容进行分割,通常是按照论文格式来进行划分,然后将划分好的论文一一与论文查重系统中的数据库资源进行比对,检测出有相似重复的内容就会将这些内容进行标注,标记红色或者黄色。当然每个查重系统会存在着差异,划分内容的范围多少是有区别的。
以知网为例,知网除了全文查重率和去除引用文献查重率部分,还有论文章节查重率部分,每章节的查重率是指论文章节的重复字数占此章节的总字数。此前不就更新的知网查重系统既可以查文字部分,也可以查代码、公式、表格、图片甚至一些英语的重复率,所以,知网检测论文的查重率这些内容也是包含在内。
一般说来,论文查重率 = 论文中重复字数/论文总字数*100%。以知网论文查重系统举例来说,目前知网论文查重主要包括有五个查重子系统,当然这些查重子系统的规则算法都是相同的,也就是说知网检测论文重复率的规则算法是统一的,只是系统数据库存在着一些差异,对应着不同的论文类型。
参考资料:《论文查重是怎么计算重复率的?》