1. 系统到底怎么查重?「不允许连续 13 字相同」是真的吗?经常有人问我,知网是按连续多少字相同来查重?不允许连续 13 字相同是真的吗?这是一条最流行、最古老的传言了,但实际上这是假的。就这么说吧,按最严格的标准来,就算你每隔 7 个字就插入一个字,语句不通不说,降重效果也微乎其微。知网查重系统开发一二十年了,每年更新个几次,算法若是真的如此小儿科,那也不会有人苦恼降重的问题了,每句多写几个字谁不会。2. 查重阈值是多少?「查重阈值 5%」是真的吗?查重阈值确实存在,但具体是多少,有很多种说法,、1%、5%……但即使知道了也没多大意义,所以不必纠结这个。比如假设阈值是 1%,知网查重会分段落(按章节或随机分),如果一个段落 10000 字,那么理论上单篇抄袭 100 字不会标红。那么实际操作是这样的,你先假定一个阈值(可能是错的),看每个章节字数(系统可能不按章节分),算出单篇可抄袭字数(最多也就一小段),找多篇文献每篇抄一小段(某些文献可借鉴的很多,而有些文献一段也用不上),最后你得确保除了抄袭的这段,其他内容不会和这些文献重复(有时自己写的也判定重复),以上条件都满足,抄袭而不标红的「阴谋」才能得逞,太累了……当然你每篇抄得越少,被查出来的概率就越低,这是肯定的。至于「越少」是多少,没人说得清。3. 那知网到底怎么查重?知网采用模糊算法,分段进行查重(识别出章节就按章节分段)。统计每个段落文字/关键词并与论文库里的文献进行对比,达到一定比率,就把连续重复多的地方标红。看到这里,你是不是很蒙,完全不知道怎么对症下药。你只需要知道的是,系统没有那么智能,不会对比论文表达的意思,它只是一堆很死的代码、算法,按字词的相似比率来判断抄袭,你要做的是尽量改得和别人不同,观点一样没关系,用词、表达方式一定要变。4. 查重后听说有检测记录,知网会不会就入库了,导致学校重复率飙升?先说答案:不会,只要你有钱,查多少次都可以,知网更新时才会收录(通常半年或一年后)。只要学校没说不让提前查,那就放心查随便查。