PDF格式查重重复率会更高。
中国知网系统会自动识别声明、目录、脚注、参考文献不参与检测,不算重复率。但是PDF格式上传到知网查重系统后,系统会将PDF文档转码为文本格式,会导致检测出错,查重结果不准确。
如非学校硬性要求,还是建议使用word格式,这样系统识别性比较好,这种格式也是对知网最友好的格式。
PDF格式查重率更高的原因:
1、目录排版出错
如果转码,目录被打乱,系统会识别不了目录,就会被当成正文检测,算在重复率里,这样比例会增高。
2、脚注容易参与正文检测
一般PDF转成Word后,PDF脚注内容就失去格式了,和正文混在一起,会和正文一起参与检测,检测脚注一般都会重复的,这整篇文章比例自然会变高。
3、参考文献会被识别为正文
同样道理,参考文献由于转码出现文献格式混乱,也会导致系统是识别不好,也会把后面的参考文献内容当成正文检测了,这样肯定不科学的。
4、图片识别不了会乱码
有的PDF内容为是图片格式的,这样会导致转码识别更不好,会出现乱码现象,这样检测整篇文章都不会准确。