给定一个或多个搜索词,如“高血压 患者”,从已有的若干篇文本中找出最相关的(n篇)文本。 文本检索(text retrieve)的常用策略是:用一个ranking function根据搜索词对所有文本进行排序,选取前n个,就像百度搜索一样。 结巴分词后的停用词性 [标点符号、连词、助词、副词、介词、时语素、‘的’、数词、方位词、代词] 对一篇文章分词、去停用词 对目录下的所有文本进行预处理,构建字典
Papertime 拥有海归博士多年研发基于大数据指纹比对算法,相比常规比对速度提升10倍,在保证查重质量的情况下,几秒钟就可以出查重结果。系统采用自主研发的动态指纹越级扫描技术检测的主要步骤有:文本预处理、语义挖掘、深度识别并且检测准确率高达99%以上
知网,维普,万方
paperfree和papertime
334 浏览 10 回答
141 浏览 4 回答
298 浏览 4 回答
270 浏览 2 回答
154 浏览 3 回答
113 浏览 2 回答
178 浏览 3 回答
282 浏览 3 回答
249 浏览 3 回答
202 浏览 2 回答
264 浏览 9 回答
224 浏览 5 回答
177 浏览 7 回答
82 浏览 7 回答
272 浏览 4 回答
86 浏览 2 回答
89 浏览 5 回答
246 浏览 3 回答
170 浏览 6 回答
188 浏览 6 回答
210 浏览 2 回答
203 浏览 4 回答
149 浏览 4 回答
345 浏览 3 回答