论文无意重复的六大「罪魁祸首」:
3-1 容易造成论文重复的潜在「地雷」
我们在写作时该如何有效避开这些地雷,降低论文重复率呢?这就需要我们了解论文完成后查重的基本流程、学校老师和期刊编辑选用的查重软件以及它们背后蕴含的查重原理。
查重流程
查重的基本流程,一般有以下三种情况:
情况一:学校提供一次免费的毕业论文查重机会
3-2 查重情况一
情况二:学校不提供免费的查重机会
3-3 查重情况二
在第一步时,有些同学贪图便宜,会使用其他软件进行查重,但是由于两者的数据库和查重原理不同,最后的结果和知网查重相去甚远,导致最后的重复率不满足要求,白白花了冤枉钱。
此外,免费的查重软件更需要警惕,天下没有免费的午餐,使用其他软件存在很大的论文泄露风险。
情况三:投稿中文期刊的论文
3-4 查重情况三
需要注意的是,知网查重是不对个人用户开放的。真正有官方查重名额的,绝大部分是和知网有密切合作的第三方机构或者高校,除非个人在某宝上购买查询。
知网查重软件
从上述查重流程中,我们不难发现,知网查重具有举足轻重的地位。作为国内三大学术论文数据商(知网、万方、维普)之一,在论文检测市场中,知网是绝大多数高校和中文期刊定稿论文必用的查重系统,搜索量最大,万方次之,维普最小。
越来越紧的学术政策下,高校毕业论文或者杂志社的投稿期刊文章,都要首先经过知网学术不端系统的检测,只有查重比例合格了才能进入下一环节。
从权威程度、知名度、市场口碑看,知网查重是名副其实的江湖老大哥。
知网是如何「查重」的
中国知网的 CNKI 工程是以实现全社会知识资源传播共享与增值利用为目标的信息化建设项目,从硕博研究生学术论文强制使用开始,几年的发展快速延伸到所有 211 和 985 院校,其他高校也开始以抽检的方式在陆续使用,使用范围包括出版社的审稿、职称评定、科研成果的查重等。目前,知网学术不端系统的数据库包含博士和硕士学位论文、期刊和会议论文、专利、网页数据、图书等文献资源。
起初,各个领域使用的知网数据库是一样的,后来随着社会发展和市场的需求,知网检测系统针对性越来越强,不同领域的数据范围开始细分,使用对象不同,数据库也有所差别:
知网学术不端系统分类及特征
知网查重的原理分析
关于知网的查重原理,网上众说纷纭,有谣传,有谬误,笔者搜集整理相关资料,并结合自己近十年的学术论文写作和论文查降重经验,概括了以下三条原理:
查重原理 1:句群语义模糊算法
知网论文查重采用最先进的语义模糊算法,关注句子中心意思和关键词,「了、着、的、可以」等虚词的修改并不会降低重复率。从图 3-5 可以看出,虽然查重报告左右两边红色部分内容并不完全一致,但是系统会智能判定为语句重复。
3-5 知网查重报告
其他片段:
酝酿已久的个人存款账户实名制度终于颁布实施,这表明我国个人存款管理制度日趋向国际惯例靠拢。个人到金融机构办理存款时需要出示个人身份证。
疑似文章片段:
1、毕业论文结构简单,表述单一,实质性内容少,只是为了满足论文篇幅和字数的要求,摘录大量文献资料和互联网上的内容。通过对论文查重系统的识别,论文查重率过高。
2、很多本科生写毕业论文原创内容太少,很多内容都是“借鉴”其他人的论文内容,整个论文的立意和具体设计都是别人的。因此,论文中存在大量相似的重复内容,无法避免论文查重系统的检测,最终导致论文查重率过高。
3、有人能完成高水平的毕业论文,能很好地表达论文主题,能很好地贯彻。然而,由于他们的创作能力有限或科学思维薄弱,有些内容无法用图像表格更生动、更恰当地描述。他们只是简单地用引用材料和介绍内容来填补这方面的空白,最后论文查重系统检测出很高的查重率。
原因一、引用不标脚注
在论文文献综述中大家一般需要总结出该论点的学界通说以及不同专家的观点,论文中引用他人论文内容是很正常的,不过对于引用的内容应该注明来源和出处,这样才不会对论文查重造成不良影响。
原因二、格式排版不合规范
论文格式应该按照要求来,不要盲目借鉴其他版本,特别是不要自己发明独特的格式;在修改论文时,可以多用Word文档的格式刷,能节省大量时间;在写论文时要注意保存文档,设置自动保存时间,防止文件损坏丢失。
原因三、直接大量引用数据
写论文时引用数据是很常见的,但是引用大量数据的话,查重时被标红部分自然也会很多,对于数据可以做成表格形式。
原因四、直接用别人的脚注
在搜集整理论文素材时,部分同学会直接把文献中的内容复制到自己论文里,但是有些论文的脚注并不规范,甚至有可能是作假的。
原因五、直接用翻译软件完成英文摘要
中英文摘要不要随随便便使用翻译软件直接汉译英,翻译出来的东西很容易语法不通,所以一定要留出足够的时间认真对待。
原因六、文献综述堆砌冗余
论文文献综述不要太繁太多,自己分析概括少的话,不仅会导致重复率高,而且也很难看出作者个人研究的认识以及观点等。