整个查重报告的相似率是由每一个单独匹配来源的重复率累加所得,例如一篇相似率为20%的论文可能由20个不同匹配来源构成,且对每一组匹配文本都有1%的重复。由CrossCheck数据库对SCI论文查重后给出的相似程度大致可分为三类:第一类:相似率低于10% - Not Likely to Be an Issue (Disregard)这类文章中所检出的相似率一般都是一些来源相对分散的匹配文本或常见短语,通常每一处匹配来源仅仅占据1%~3%的相似率,在期刊允许的合理范围内。那么这类查重结果对鉴定论文是否抄袭影响不大,几乎是可以忽略的。第二类:相似率在10%~50%之间 - Possible Issue (Review Briefly)大部分的作者的查重报告结果可能处于该范围内,属于比较适中的百分比。相似率在此范围内可能存在一部分直接摘抄来的文字,此时有一定可能会被认为抄袭,但是也不一定,主要还是取决于每个匹配来源的相似率,尽管总体相似率偏高,但也有可能仅仅是某个部分的摘抄的比例特别大,因此首先至少需要确认没有一个来源的重复率高于10%,之后再对重复程度较高的部分进行改写。第三类:相似率高于50% - Probable Issue (Review Carefully)相似率超过50%的百分比就显得过高了,这时候说明有一处或多处单独匹配来源存在着高度的重复,即大段语句与数据库中的某几篇文献一致,需要引起警惕。此时有很大概率会被判作是抄袭。因此必须对语言进行重新评估和谨慎地改写。除此之外,对于查重报告的相似率结果,还有两种特殊情况需要注意:第一种情况:总体相似率高,但包含若干个低重复匹配来源。例如一篇论文的相似率超过了30%,也许会被认为有抄袭的嫌疑,但若仔细分析报告却发现每一处匹配来源的重复率均低于5%或更低,此时一般来说不会被指出抄袭,故作简单语言调整即可。第二种情况:总体相似率很低,但仅包含一至两处的高重复率匹配来源。例如一篇相似率12%(近似可忽略)的论文仅具有两处分别为11%和1%的相似来源。那么这篇文章同样需要格外注意,11%重复的部分可能包含了几处大段的摘抄,必须有所警惕,以免在投稿后被期刊指出问题,从而引起不必要的麻烦。总而言之,SCI论文查重标准并不固定,需要具体情况具体分析。查重报告第一眼看到的相似率仅仅是一个参考,就算略微高于20%也不要太担心,主要还是要确定各个匹配来源的相似率合理即可。这就需要作者根据查重报告具体分析,从而进行针对性的语言改写。