论文查重原理如下:
连续出现13个字符类似就判断为重复部分,并将重复的内容计算到论文的重复率之中。论文查重系统会进行处理,按照篇章、段落、句子等层级分别创建指纹,比对资源库中的比对文献,也采取同样技术创建指纹索引。用户将论文上传至查重系统后,系统自动对论文进行检测。
知网论文查重采用最先进的模糊算法。如果整体结构和轮廓受到干扰,可能会导致同一处物品的第一个和第二个红色标记不一致,或者第一次没有标记的部分的红色标记可能会在第二次标记。论文降重的时候,尽量不要打乱论文的整体结构,修改重复内容即可。
整篇论文上传后,系统会根据论文生成的目录自动检测论文的章节信息,然后系统会分章节检测论文,可以获得每一个单独章节的副本,引用不参与文本检测;否则会自动分段,按1万字左右检测。同时,目录可能会被检测为文本,重复会被标记为红色。
中国知网对查重系统的敏感度设定了一个阈值,为5%。段落方面,不到5%的抄袭或引用无法检测出来,这种情况常见于小句子或大段落中的小概念。