论文三查是第三次查重,论文查重的内容包括论文正文、原创说明、摘要、图标及公式说明、参考文献、附录、实验研究成果,以及各种表格等。
根据论文的篇章、段落、句子等分别创建指纹,然后将分层的部分通过连续13个字符类似的查重原理对分层内容进行重复率计算,每一个部分查重完毕后都会写入到论文检测报告中,最后经过查重系统一系列的查重后,根据总引用率等信息并写入最终查重报告中,方便用户阅览查重信息。
相关知识:
当有一个文章需要检测时,放入比对库进行检测,如果某一句、某段、或者整篇和对比库中的文章相似,就会视为重复给记录下来。
整篇文章检测完毕之后,会根据之前记录的重复内容来生成比对文档。比对文档通常是网页格式或PDF格式,比对文档中会有论文检测获得的相似比例、重复的内容所在、重复内容的来源文章。
论文检测需要搜索引擎技术作为支撑,包括资源采集技术,文本数据库加工技术,文本数据库技术,数字资源版权保护技术,知识挖掘技术,自然语言处理技术、快速比对技术等。
以上内容参考:百度百科-查重