会查重的。
统先根据换行符把文章切分成段落,然后再根据标点符号把段落切分成句子,再把每个句子分别进行查重检测。论文的查重粒度是句子,两个句子的相似度主要取决于句子包含哪些词,以及词在句子中的位置。目前句子相似度只有文字上的对比,不考虑语义上的相近。如果做到语义上的查重,那我们就没法改重了。
总体相似度 = 相似字数 / 检测字, 被系统自动识别出来的非正文部分(如目录,标题,公式,图表,参考文献等)不参与检测,检测字数一般略小于论文字数。相似字数 =(句子1字数 * 句子1相似度 + 句子2字数 * 句子2相似度 + ...... + 句子n字数 * 句子n相似度),句子相似度范围0.00~1.00,绿色句子相似度按照0计算。
打个比方:“毛主席万岁”这句话被一百个人写文章时用过,检测结果中就会出现100个与之相似的文献,建议,不要问为何这么多相似文献,改掉相似的句子是关键。
修改办法:检测系统没想象中可怕,检测比对的是相同字段,而不是相同意思,所以只要大家换一种表达方式,意思是一样的,也查不出来,还有改词、换句、加自己的话,改变描述方式(变原句为倒装句、被动句、主动句等)、打乱段落顺序、删除可有可无的关键词汇、关键句等。经过实践证明,使用以上方法结合,可有效降低复制比,保证顺利通过。