论文查重的原理是连续出现13个字符类似就判断为重复部分,并将重复的内容计算到论文的重复率之中。论文查重系统会对内容进行分层处理,按照篇章、段落、句子等层级分别创建指纹,而比对资源库中的比对文献,也采取同样技术创建指纹索引。用户将论文上传至查重系统后,系统自动对论文进行检测,待查重完毕后即可提供用户一份查重报告单。
可以使用Papertime查重系统进行进行论文查重,系统采用自主研发的动态指纹越级扫描技术
检测的主要步骤有:文本预处理、语义挖掘、深度识别,并且检测准确率高达99%以上,
由超过9000万的学术期刊和学位论文以及一个超过10亿数量的互联网网页数据库组成。