看你的论文中,是否包含了C代码如果在论文中包含完整C代码或者部分C代码 那么这部分代码必然会被查重如果C代码本身不在论文中,而是作为附件形式存在,就看学校严不严了,有的查有的不查。
在之前的知网系统里面没有这个库,以往知网系统把声明、目录、参考文献自动排除,不算作正文查重,并根据目录和参考文献,判断文章的分段及引用情况。致谢作为正文,参与检测。支持文字、公式、表格、图片格式的内容的检测。
在最新版本的知网查重系统5.3版本的报告单中,新增加了“源代码库”,支持进行cpp、java、py等源码的检测比对。源代码库是在2019年10月末最新的5.3版本中加入的新比对库,增加“源代码库”后,论文中代码也需要查重。可以说升级后的知网系统,查重范围更广了。
当然能了,它的原理是字符匹配。只要是字符就会查出来,你可以试着把它变成图片,或者把文字的前后顺序换一下,更或者换一种说话。
我个人为我们课程DIY过一个知网查重的软件工具,是基于数据流分析的,效果还不错,反正修改变量名,提取函数这些小伎俩是完全无用的,甚至可以做到一定的跨语言查重(只把c#代码copy到java里,然后改一改跑起来是会被发现的)。说明程序代码也会进行对比查重算抄袭重复率。下面具体说说程序代码进行知网查重的方法,具体如下:以c为例,具体流程大概是,先调用预处理器把注释干掉,把macro展开,因include <>而弄进来的那波标准库头文件特殊标记一下,然后建立CFG(control flow graph)进行知网查重。因为CFG关心的是变量的值会怎么传播,所以在中间插入一大堆无副作用的语句是不会有任何效果的,把变量换个名或挪个位置(比如加多一层block)也没啥卵用。c++的话就会麻烦很多,毕竟在c++里就算a + b这么个简单语句,因为operator+可以重载,所以指不定执行完这个语句就可以把地球都炸了呢,而且这个重载在不同namespace里还可能不同,比如namespace A是用地球,namespace B是对整个地球播一段爱的供养神马的……在c++里建立CFG会是个噩梦……程序代码进行知网查重的方法比较复杂吧!!程序代码被知网查重很复杂不过说起来我们的课程比较特殊,因为作业用的是类ACM的提交系统,所以对运行环境有比较严格的限制,这保证了程序代码知网查重查重的准确率。如果是完全开放性的程序代码知网查重(即对语言和第三方lib等等都不做限制的话)恐怕会很困难。 === 举个例子 ===以下是前几天刚刚检测到的抄袭代码片段……下面两段java代码被检测出有高度匹配(右图里getARGBData函数只是把二维数组给复制4份凑成一个三维数组而已,没干其他事)……知网查重时程序代码一样被算重复另外一点,为了减少漏网之鱼,知网查重时一般都会用低阈值初筛,再人工介入复核。此外建立回溯机制,比如如果某人现场考试的成绩和作业排名差异较大的话,会触发重查,专门为他调低阈值重查一遍+人工复核。不过正因为有人工复核,所以思路相同一般是不至于误判的,毕竟只要代码行数一多,思路再相同,代码风格上也会有很大差异。
应该会。毕竟我当年毕设论文用PP查重的时候,化学药品名称、出厂公司都算是重复的。修改后终稿PP查重大概还是在5%,上交的时候学校用知网查重后是1.1%。
82 浏览 2 回答
102 浏览 5 回答
348 浏览 5 回答
201 浏览 4 回答
178 浏览 3 回答
351 浏览 5 回答
161 浏览 5 回答
261 浏览 6 回答
189 浏览 6 回答
195 浏览 5 回答
256 浏览 4 回答
84 浏览 2 回答
356 浏览 5 回答
222 浏览 6 回答
245 浏览 4 回答
258 浏览 5 回答
264 浏览 5 回答
241 浏览 2 回答
304 浏览 4 回答
195 浏览 4 回答
129 浏览 3 回答
269 浏览 5 回答
107 浏览 2 回答
354 浏览 7 回答