文献信息检索与利用基本知识介绍 第二届华侨华人文献信息检索与利用讲座讲义(二)主讲人 覃建宁一、网上电子资源检索与利用l 检索方法的使用1、布尔逻辑检索所谓布尔逻辑检索(Boolean Logical)是用布尔逻辑算符将检索词、短语或代码进行逻辑组配,指定文献的命中条件和组配次序,凡符合逻辑组配所规定条件的为命中文献,否则为非命中文献。常用的布尔逻辑运算有三种,分别是逻辑或、逻辑与、逻辑非。逻辑或:运算符为“OR”、“or”、“+”,有时也可以用“|”表示。检索式A OR B ,表示包含检索词A的文献或包含检索词B的文献或者同时包含A和B的文献均为命中文献。使用逻辑或相当于增加检索主题的同义词与近义词,扩大了检索范围。例:华侨 OR 华人逻辑与:运算符为“AND”、“and”、“*”,有时也可能用“&”表示。检索式A AND B,表示文献中同时包含检索词A和检索词B的文献才是命中文献。使用逻辑与缩小了检索范围,增强了检索的专指性。例:华侨 AND 马来西亚逻辑非:运算符为“NOT”、“not”、“-”,有时也可能用“!”表示。检索式A NOT B,表示包含检索词A同时不包含检索词B的文献为命中文献。逻辑非排除了不希望出现的检索词,增强了检索专指性。但在使用时要特别注意,因为它同时排除了有用的文献。例:华侨 NOT 马来西亚上述三种逻辑运算的关系见图1。对于一个复杂的逻辑检索式,检索系统的处理是从左向右进行的。在有括号的情况下,先执行括号内的运算;有多层括号时,先执行最内层括号中的运算,逐层向外进行。在没有括号的情况下,And、Or、Not的运算次序,在不同的系统中有不同的规定,例如DIALOG系统中依次为Not→And→Or;STAIRS系统和ORBIT系统中依次为And和Not按自然顺序执行,然后执行Or运算。检索时应注意了解各机检系统的规定。每个搜索引擎可以使用的布尔运算符是不同的,有的只允许使用大写的“AND”、“NOT”、“OR”运算符,有的大小写通用,有的可支持“&”、“|”、“!”符号操作,有的不支持或仅支持其中的一个等等。例如,Google和"Yahoo!中国"都支持布尔逻辑检索。Google可用"AND"、"and"、"&"进行逻辑"与"运算,但只能用大写"OR"表示逻辑"或",不支持"NOT"逻辑符操作,允许使用"-"符号代替逻辑"非"运算;"Yahoo!中国"可用"AND"、"and"、"&"进行逻辑"与"运算,以"OR"进行逻辑"或"运算,以"NOT"、"not"进行逻辑"非"运算。确切地知晓每一种搜索引擎的检索功能与特性,无需死记硬背。只要在使用时,查看帮助信息便是了。2、词组检索词组检索(phrase),也称为短语检索,或字符串检索。它是将一个词组或短语用双引号“""”括起作为一个独立运算单元,进行严格匹配,以提高检索准确度的一种方法。检索结果必须含有与提问式完全一样 ( 包括次序 ) 的字串。几乎所有的搜索引擎都支持词组检索。例如,以"侨务新闻"作为提问关键词检索时,检索结果则仅反馈侨务新闻的内容。3、 位置检索位置检索(Proximate)是在检索词之间使用位置算符(也称邻近算符Adjacent Operators),来规定算符两边的检索词出现在记录中的位置,从而获得不仅包含有指定检索词而且这些词在记录中的位置也符合特定要求的记录。这种方法能够提高检索的准确性,当检索的概念要用词组表达,或者要求两个词在记录中位置相邻/相连时,可使用位置算符。机检系统中常用的位置算符(按限制强度递增顺序排列)如下:(1)(f)算符Field:要求被连接的检索词出现在同一字段中,字段类型和词序均不限。例如 happiness(f)sadness and crying(2)(s)算符Sub-field/Sentence:要求被连接的检索词出现在同一句子(同一子字段)中,词序不限。例如 machine(s)plant(3)(n)算符near:(n)要求被连接的检索词必须紧密相连,词之间除允许有空格、标点、连字符外,不得夹单词或字母,词序不限;(Nn)表示两个检索词之间最多可以夹N个词(N为自然数1、2、3…),且词序任意。例如 information(n)retrieval 可以检出 information retrieval 和 retrieval information,又如econom ?? ?(2n) recovery 可以检出economic recovery、recovery of the economy 、recovery from economic troubles(4)(w)算符With:(w)要求检索词必须按指定顺序紧密相连,词序不可变,词之间除允许有空格、标点、连字符外,不得夹单词或字母;(Nw)表示连接的两个词之间最多可夹入N个词(N为自然数),词序不得颠倒。例如 input(w)output可检出input output而wear(1w)materials可检出wear materials、wear of materials采用位置算符检索时,通常最严谨的算符放在最左面,例如:european(w)economic(w)community(f)patio,redwood(3n)deck?(s)(swimming(w)pool?)注意:不同的机检系统,位置检索的功能及算符不同,应参看机检系统的说明。4、截词检索截词检索(Truncation)是指用给定的词干做检索词,查找含有该词干的全部检索词的记录,也称词干检索或字符屏蔽检索。它可以起到扩大检索范围,提高查全率,减少检索词的输入量,节省检索时间,降低检索费用等作用。检索时,若遇到名词的单复数形式,词的不同拼写法,词的前缀或后缀变化时,均可采用此方法。截词的方式有多种,按截断部位可分为右截断、左截断、中间截断、复合截断等;按截断长度可以分为有限截断和无限截断。(1)右截断:截去某个词的尾部,是词的前方一致比较,也称前方一致检索。例如:输入geolog?(?为截断符号),将会把含有geological、geologic、geologist、geologize、geology等词的记录检索出来。若输入PY=199?,会把90年代的记录全部查出来。(2)左截断:截去某个词的前部,是词的后方一致比较,也称后方一致检索。例如:输入?magnetic 能够检出含有magnetic、electromagnetic、paramagnetic、thermo-magnetic等词的记录。(3)中间截断:截去某个词的中间部分,是词的两边一致比较,也称两边一致检索。例如:输入organi?ation可以检出organization、organisation;输入f??t可查出foot、feet。(4)复合截断:是指同时采用两种以上的截断方式。例如?chemi?可以检出chemical、chemist、chemistry、electrochemistry、electrochemical、physicochemical、thermochemistry等。(5)有限截断:是指允许截去有限个字符。例如“acid? ?”表示截去一个字符,它可检出acid、acids,但不能检出acidic、acidicity、acidity等词。又如comput??? ?可检出compute、computer、computers、computing等词,不能检出computable、computation、computerize等词。注意:词干后面连续的数个问号是截断符,表示允许截去字符的个数,最后一个问号是终止符,它与截断符之间要有一个空格,输入时一定要注意。(6)无限截断:是指允许截去的字符数量不限,也称开放式截断。上面右截断、左截断所举的例子均属此类型。由上述可见:任何一种截词检索,都隐含着布尔逻辑检索的“或”运算。采用截词检索时,既要灵活、又要谨慎,截词的部位要适当,如果截得太短(输入的字符不得少于3个),将增加检索噪声,影响查准率。另外,不同的机检系统使用的截词符不同、各数据库所支持的截断类型也不同,例如DIALOG系统和STN系统用?、ORBIT系统用:、BRS系统用$、ESA-IRS系统用+等。5、 字段检索字段检索(field)是一种用于限定提问关键词在数据库记录中出现的区域,控制检索结果的相关性,提高检索效果的检索方法,多以字段限定方式实现。搜索引擎常用的字段有:Title/t、Subject、Text、host(主机)、URL/u、domain(域名)、link(链接)等。 Title:(或t:)表示查找标题中包含检索提问式的页面;URL:(或/u:)表示查找URL中包含检索提问式的页面;Link:表示查找含有链接至URL的页面;host:表示在指定的服务器上查找页面;domain:表示查找指定域名的各页面;subject:表示查找主题中包含检索提问式的页面;text:表示文本中包含检索提问式的页面。l 数据库检索的常用方法和技巧1、数据库常用的检索字段有哪些?数据库常用的检索字段列表:西文数据库常用字段 中文数据库常用字段 字段名称 字段代码 Abstract AB 文摘 Author AU 作者 Corporate CS 机构名称 Descriptor/Subject DE 叙词/主题词 Document Type DT 文献类型 Full-text FT 全文 ISSN ISSN 国际标准连续出版物号 Journal Name/Publication Title JN 期刊名称 Keyword/Topic KW 关键词 Langage LA 语言 Publication Year PY 出版年 Title TI 题名2、如何扩大检索范围?对检索数量比较少的结果,可以进行扩检,提高查全率。常用措施有:增加一些检索词,或将查询检索词的上位类词、近义词等补充进去; 调整组配算符,如改AND为OR; 使用截词检索,如改center为cent*; 取消或放宽一些检索限定,如年限、学科、文种等; 增加或修改检索入口,如改题名为文摘或全文等。3、如何进行缩小检索范围?检索结果过多是信息检索过程中一个常见问题,从中挑选出相关度高的资料还要花费很长时间。当检索结果过多时可考虑进行缩检,提高查准率。常用措施与扩检相反,如减少一些相关性不强的检索词,增加AND组配算符,增加检索限定,减少检索入口等。4、数据库比较通用的检索功能主要有哪些?比较通用的检索功能主要有三种:简单检索:为用户提供一个简单的检索界面,页面上通常只有一个检索框。 复杂检索:为专业用户、资深用户提供的比较复杂的检索界面,可以构建比较细致的检索式,帮助用户进行精确检索。 二次检索:在检索结果内进一步检索,使检索结果更精练、准确。5、科技文献类型有哪些?如何识别?科技文献类型主要包括:科技图书、科技期刊、科技报告、专利文献、会议文献、学位论文、标准文献、产品资料、技术档案、政府出版物等。类型 常用字样 科技图书 Sci-Tech book:Monograph, Anthology, Textbook,Reference book 科技期刊 Sci-Tech Journal:magazine, serial, periodical 科技报告 Sci-Tech Report 专利文献 Patent Document:Patent specification/bulletin/aids 会议文献 Conference paper:Proceedings, compilation, collected paper, records Meeting: workshop, seminar, colloquium, symposium, conference 学位论文 Dissertation, Thesis6、如何找到与课题相关的文献?首先应利用本领域的核心数据库。即根据课题内容归纳出中、英文关键词,尽可能检索可以利用的、与课题相关的文献信息数据库,从而获得相关文献; 其次注意通过引文途径进一步获取相关文献。即利用已有文献中的参考文献作为获取新文献的线索,通过检索引文数据库获得更多文献; 有时通过浏览相关学会和研究机构的网站也能得到一些有用的信息。 最后从检索结果中选出最感兴趣的若干篇文献,根据文献的出处设法获取原文。7、如何识别数据库的学科范围?一般数据库都有自己特定的学科范围、文献类型。选择数据库时,关键是识别所选数据库中是否收录了所查找学科主题范围内的文献,是否有所需要的文献类型。识别方法: 通过数据库收录的来源期刊的学科范围识别; 通过图书馆网站中资源推介栏目中描述的每种数据库的学科范围来识别;8、如何选择最适合自己的数据库?选择数据库时要考虑以下几个因素: 所需信息的水平:广度、深度、专指度、学术性。 文献类型:报纸、杂志、学术期刊、商业期刊、学位论文、会议文献和科技报告等。 数据库主题范围:专业数据库还是综合性数据库。 数据库时间跨度:当你所需信息超出数据库收录文献的时间跨度时,可查图书馆馆藏数据库的印本文献。另外,一定要多试几个数据库,因为不同数据库的收录范围不同,甚至同一学科领域的数据库收录范围也不相同。如果还有疑问,可向图书馆员咨询请他们推荐合适的数据库。l 数据库检索策略所谓检索策略,广义讲是指为实现检索目标而制定的全盘计划和方案;狭义讲是指检索式。检索式是用来表达用户检索提问的逻辑表达式,是检索策略的综合体现,通常由检索词和各种逻辑算符、位置算符及系统规定的其它连接符号构成。在联机检索中,检索策略直接关系到检索结果的成败,需要对检索课题进行深入的分析并能运用各种检索方法和技巧。一般来说,构造检索策略通常包括以下步骤: 分析课题。 选择数据库。 分析概念,选择检索词 构造检索式 进行检索 获取全文 以下举例说明这些过程,假设我们要检索华侨华人文献信息专题数据库建设方面的资料,分析课题 现在,我们分析这个课题并描述之,显然,本课题可描述为:华侨华人文献信息专题数据库建设。另外,在明确了检索课题的主题内容后,还应预期得到什么样的检索结果,是专业文献还是一般性或通俗文章,对文献类型、时间范围及地理范围有无特殊要求等。 显然,课题要求得到有关该主题的专业文献。 选择数据库。选择数据库时要考虑以下几个因素: 所需信息的水平:广度、深度、专指度、学术性。 文献类型:报纸、杂志、学术期刊、商业期刊、学位论文、会议文献和科技报告等。 数据库主题范围:专业数据库还是综合性数据库。 数据库时间跨度:当你所需信息超出数据库收录文献的时间跨度时,可查图书馆馆藏数据库的印本文献。另外,一定要多试几个数据库,因为不同数据库的收录范围不同,甚至同一学科领域的数据库收录范围也不相同。如果还有疑问,可向图书馆员咨询请他们推荐合适的数据库。分析本课题,我们可以选择维普和中国期刊网进行检索。3.分析概念,选择检索词一个检索课题往往涉及多个概念,这一步的任务就是将检索课题涉及的所有概念分离出来,并针对每一个概念选择尽可能多的检索词。分析概念可从课题名称入手。如本例中,“华侨华人”、“文献”、“信息”、“数据库”即为概念词。4.构造检索式构造检索式需要使用各种检索技术,如根据概念之间的逻辑关系需使用布尔逻辑检索技术,根据词与词之间的位置关系需使用位置检索等,关于信息检索技术的详细内容,详见前述内容。本例中,我们根据这几个概念词逻辑关系,构造如下检索式:华人华人*文献*信息*数据库5.入库检索 进入相关数据库,如维普数据库,输入以上检索策略式6.获取全文注意,不同的数据库系统获取全文的方式不完全一致,具体操作请参阅分库使用指南。l 免费电子报刊、电子图书、电子论文的查找1、本馆的电子资源说明:只有校园网用户(包括校园宽带网用户和校园网拨号用户)才能使用本馆的网络数据库;如果设置了代理服务器,请去掉代理服务器后再使用;在网络中心申请的出国代理不影响数据库的使用。本馆数据库都有详细的检索帮助,如有困难,可参看帮助。u 万方数据库学位论文全文、数字期刊都有人文科学类,可以查到华侨华人研究的论文和资料。u PQDD美国博、硕士论文 1861年至今,可看到前24页全文。u UMI博士论文全文库美国博、硕士论文全文 提供PQDD论文全文。时间从1998年起至2003年。 注意:从PQDD中检索到并非都能在此找到全文。u 中国学术期刊网期刊全文 要下载安装CAJ浏览器。u 维普中文期刊全文数据库要下载安装维普全文浏览器。u EBSCOAcademic Search Premier:综合类期刊,可检索到华侨华人方面的文章。u SDOS 期刊全文 包含有社会科学。u Kluwer 期刊全文 涵盖20多个学科专题,包括生物法律、医学、心理学、物理学、航空航天、哲学、数学、计算机科学、工程、电子工程、材料、地学、社会人文、化学、商业管理等u 科学在线 期刊全文 数学 物理 天文学 地球科学 化学 材料科学 生物 医学 计算机 环境科学 经济 教育 历史 哲学 心理学 社会科学,(免费期刊)u 方正Apabi电子图书 图书全文 经济、文学、艺术、数理化、生物、医药卫生、计算机科学u 书生之家电子图书u NetLibrary 电子图书只能在线阅读,不能下载。2、互联网上的电子资源u HighWire Press ()英文网站,需要出国帐号。u CALIS高校学位论文库 CALIS学位论文数据库以合作建设、资源共享为目的,建立为高校师生提供学位论文和会议论文的查询、文摘索引的浏览、全文提供(传递)等配套服务。u 毕业论文网 免费,不需要注册,有相当数量的论文。u 论文库 论文帝国 168论文网 学生大论文 u 无忧论文网 只提供文摘和目录,想获取全文需要交费。u 论文资料网 只提供文摘和目录,想获取全文需要交费。u 超星数字图书馆 有超星数字卡即可使用,要下载安装超星图书阅览器。l 常用搜索引擎简介1、Google搜索引擎 -CN/目前最优秀的支持多语种的搜索引擎之一,也是全球最常用的搜索引擎。约搜索3,083,324,652 张网页。提供网站、图像、新闻组等多种资源的查询。包括35个国家和地区的语言的资源。2、百度中文搜索引擎 全球最大中文搜索引擎。提供网页快照、网页预览/预览全部网页、相关搜索词、错别字纠正提示、新闻搜索、Flash搜索、信息快递搜索、百度搜霸、搜索援助中心。3、 一搜搜索引擎 “一搜”是雅虎中国推出的一个中文搜索网站。目前设立了网页、图片、MP3和网址四个频道。“一搜”采用雅虎花费数十亿美元打造出的搜索技术(YST),用户可以抓取到全球50亿网页(其中3亿个中文网页)、9000万张图片、100多万个免费音乐的海量资料。4、 中国搜索(原慧聪搜索) 中国搜索拥有全球领先的中文搜索引擎技术,现在已被新浪、搜狐、网易、TOM四大门户,以及1400多家联盟成员网站所采用。每天有数千万次的搜索服务是通过中搜的技术实现的。与一般的搜索引擎相比,中国搜索具有网页覆盖率高、数据更新快、支持中文模糊查询、强大的个性化查询、智能查询、内容相关性分析、便利的专业信息查询等优势,被公认为第三代智能搜索引擎的代表。5、 新浪分类搜索引擎 互联网上规模最大的中文搜索引擎之一。设大类目录18个,子目1万多个,收录网站20余万。提供网站、中文网页、英文网页、新闻、汉英辞典、软件、沪深行情、游戏等多种资源的查询。6、 搜狐分类搜索引擎 搜狐于1998年推出中国首家大型分类查询搜索引擎,到现在已经发展成为中国影响力最大的分类搜索引擎。每日页面浏览量超过800万,可以查找网站、网页、新闻、网址、软件、黄页等信息。7、 网易分类搜索引擎 网易新一代开放式目录管理系统。拥有近万名义务目录管理员。为广大网民创建了一个拥有超过一万个类目,超过25万条活跃站点信息,日增加新站点信息500~1000条,日访问量超过500万次的专业权威的目录查询体系。8、 北大天网中英文搜索引擎 由北京大学开发,简体中文、繁体中文和英文三个版本。提供全文检索、新闻组检索、FTP检索(北京大学、中科院等FTP站点)。目前大约收集了100万个WWW页面(国内)和14万篇Newsgroup(新闻组)文章。支持简体中文、繁体中文、英文关键词搜索,不支持数字关键词和URL名检索。9、 一些常用的英文搜索引擎MSN Search、AOL Search、Terra Lycos、Altavista、ASK jeeves二、馆际互借介绍·石牌六校馆际互借到本馆办理石牌六校通过阅览证,即可到其他石牌六校中的任何一校的图书馆阅览图书资料。l 清华大学、国家图书馆的馆际互借·服务内容1、 清华大学图书馆书、刊、会议论文、学位论文、报告、标准等文献的复印件。另清华大学图书馆是国内馆际互借中心,可代用户向国内其他图书馆和国外图书馆申请复印。2、中国国家图书馆馆藏中英文图书的借阅及复印,包含如下文献:u 查询参考工具书:百科全书、工具书、机构名录、外文年鉴。中、英、俄等主要文种的社会及自然科学技术类文摘、索引。u 国际组织和外国政府出版物:联合国系统、欧洲共同体、经济合作与发展组织及美国政府出版(图书、期刊、文件)。u 中国学位论文数据库(1990-)(原文只提供纸本复印)u 中国社科报刊数据库(1993-)u NTIS美国政府报告(1983-)u 声像资料二〇〇四年十月二十八日
CnOpenData专利创新数据库涵盖1985-2020年专利信息,专利申请与授权数据库按照发明公布、发明授权、实用新型、外观设计等四个类别分表列式,并保留了各个专利的所有指标内容。 CnOpenData平台的专利申请与授权数据库区别于其他数据库的另一个重要内容是,我们的数据包含了针对每个专利的所有事务信息,包括专利在申请后何时被授权、是否在申请公布后被撤回、专利是否被质押、专利权人信息变更以及专利权终止等所有关于专利信息变更的内容网页链接
中国专利全文数据库包含发明专利、实用新型专利、外观设计专利三个子库,准确地反映中国最新的专利发明。专利相关的文献、成果等信息来源于各大数据库。可以通过申请号、申请日、公开号、公开日、专利名称、摘要、分类号、申请人、发明人、优先权等检索项进行检索,并一次性下载专利说明书全文。
官方就国知局了,免费的可以用sooPat,适合个人和小企业进行简单的检索,大企业或对于检索要求全而且准的话可以买商业数据库,比如incopat。
做得好的,用起来顺手的也就incopat的数据库,其他的多多少少都有一定明显不足
中国学术期刊网络出版总库中国博士学位论文全文数据库/中国优秀硕士学位论文全文数据库中国重要会议论文全文数据库中国重要报纸全文数据库中国专利全文数据库图书资源优先出版文献库互联网资源(包含贴吧等论坛资源)英文数据库(涵盖期刊、博硕、会议的英文数据以及德国Springer、英国Taylor&Francis 期刊数据库等)港澳台学术文献库互联网文档资源CNKI大成编客-原创作品库个人比对库不同的知网系统包含的数据库是不一样的,上方的数据库是知网初稿系统(知网小论文系统、知网大分解系统)含有的,以此为基础,知网硕博1系统多一个学术论文联合比对库,知网本科大学生论文检测系统多一个大学生论文联合比对库。
IPC的现实作用1、传统作用的延续在《IPC使用指南》中指出:IPC是使各国专利文献获得统一分类的一种工具。借助这种国际统一的专利文献分类系统,可以为各专利局及其他用户建立一种有效的专利文献检索工具,从而对专利申请的新颖性和创造性作出评估。在信息服务方面,IPC还有以下作用:(a)利用分类表编排专利文献,可以使用户方便地从中获得技术上和法律上的信息;(b)作为对专利信息用户进行选择性报导的基础;(c)作为对某一个技术领域进行现有技术水平调研的基础;(d)作为进行工业产权统计工作的基础,从而对各个领域的技术发展状况做出评价。另外,IPC还是各专利局进行审查管理和统计的工具。2、作为实现计算机智能化分类的工具无庸讳言,IPC是基于纸件专利文献和信息技术还不够发达的历史条件下的产物。在其发展过程中的一些方针和原则,以今天的眼光看似乎有点过时。但看问题要看本质,IPC的本质是一种分类导航式索引系统,该系统的应用就是对专利文献进行标引。在信息技术高度发展的今天,一种已经经受实践检验的索引系统对于信息技术的应用仍有其不可或缺的现实意义。对于智能化分类而言,其基本解决方案是将IPC改造成一种可机读的“电子版”。这种可机读的电子版,实际上是一个以IPC作为树结构框架的电子语言表达表,既将IPC现行的技术术语词汇加自然语言或短语的描述方式改造成用技术术语词汇、关系词汇、以及词与词之间关系组配和逻辑关系表达的描述方式。通过计算机编程,对编码申请说明书八大部分中的技术术语词汇(包括同义词)、关系词汇(包括动词、介词等)等进行词频统计、位置统计和关系统计,对词与词之间关系组配和逻辑关系表达进行分析判断,通过加权统计和垃圾处理,最终按与IPC电子版的相关程度列出分类位置。所列出的分类可以是几个,也可以是十几个。因为,这时我们已不简单地把它们看作传统意义上的主分类、副分类,而是将它们当作对申请案的标引来使用,进而为下一步的专利文献智能化检索创造条件。如上文所说,这种改革将是对IPC的结构性改革,难度较大、工作量也相当可观,但一旦建成,意义将十分重大。届时,在专利审查流程上将不需要专门的分类审查员去完成对申请案的人工分类,需要做的事情将主要集中在由若干分类专家在流程外通过收集反馈意见,研究电子表的改进,丰富电子表的内涵等来维护这个电子语言表达表。处理分类纠纷的工作还是放在审查部门,只是要将纠纷处理结果汇总到专家手中即可。此项工作也许会有一条较长的路要走,但笔者认为,专利申请的智能化分类最有可能成为实现专利智能化审查的先驱。3、可作为实现计算机智能检索的重要工具 作为另一个IPC待开发的领域是借助IPC实现计算机智能化检索,包括智能化确定或扩展检索领域,智能化分析、取舍检索记录等。计算机智能检索是目前信息技术业的追求目标之一,也是我局改进中国专利检索系统的努力方向。实现中文专利文献的智能检索可以从根本上解决查全率和查准率问题,从而达到提高审查效率和改进审查质量的目的。要解决智能化检索问题,从软硬件条件分析,似乎都不存在太大问题。目前也有一些商业检索系统初步实现了基于同义词表的智能检索,但碍于先天不足,往往失于泛泛,不适用于专利文献检索。笔者认为使专利文献智能化检索停留在纸面上的主要原因是确定实现智能化检索的技术方案及为实现技术方案需要完成的大量基础性工作。从技术解决方案角度观察,单纯的全文自由词检索和单纯的人工标引或自动分词标引都不能彻底解决专利文献检索问题。因为,中文是以字与字的组合所构成的词作为文字描述单元的,所以造成更多的不确定性。检索一般通用文字,问题也许还不突出。但检索包罗万象的专利文献,显得能力不足。利用IPC进行检索,则可以弥补上述检索的不足。因为IPC是按照科学的分类方法,将具有相同属性的技术主题分入同一类号。在同一类号下,不仅仅可以查找到与发明相同的主题,还可以查找到相似的技术方案。另外,虽然目前许多数据库对其源数据进行了很好的加工,例如进行深度标引,但是其标引也是有一定的原则的,对过于普通的词汇,则一般不作标引。如果采用专利分类作为标引表示,则不仅可以包括这些词汇,还可以从技术内涵上涵盖专利文献的技术特征、技术主题、甚至技术方案。因此必须采用字、词加分类标引的组合检索模式才能解决中文智能化检索问题(人工标引可以保留,但应作为辅助手段,专门针对某些特殊领域做深度标引和源数据的改进提升)。为此,我们可以在两个方面发挥IPC的作用。其一,除了需要采用全文检索技术外,对于词的检索,必须建立一套词表,其中包括同义词表。而IPC及与之配套的《关键词索引》可以成为生产所说的词表的基本框架工具。从某种程度上说,专利局有条件成为中文科技领域同义词库的基本生产基地。这种词表可能具有这样的特征:与每个行业所使用的词表相比,该词表可能都不是最好或最流行的,但与所有行业相比没有比它更好或更流行的。其二,上文提到的电子语言版IPC,以及所确定的分类标引,是丰富检索的重要手段,并将作为一条现实途径,在专利文献的智能化检索中得到应用。利用IPC的领域划分、分类系统、和位置关系可以帮助我们进行智能化检索。如,我们仅在检索式中输入一个主分类或一个技术领域名称,甚至一个关键词,智能化检索系统就能够自动在相关范围内完成检索,得到你希望但并未完整表达,而是通过计算机人工智能模拟分析、确定、整合的检索要求,从海量数据库中提取您所期望的检索记录。
尊敬的笔者你好,非常荣幸可以回答你的问题,目前知网的检测数据库包括:中国学术期刊网络出版总库;中国博士学位论文全文数据库;中国优秀硕士学位论文全文数据库;中国重要会议论文数据库;中国重要报纸全文数据库;中国专利全文数据库;互联网资源(包含贴吧等论坛资源);英文数据库(涵盖期刊、博硕、会 议的英文数据以及德国Springer、 英国Taylor&Francis 期刊数据库;港澳台学术文献库;优先出版文献库;互联网文档资源;图书资源;学术论文联合对比库;CNKI大成编客-原创作品库;个人对比库。希望可以帮到你,纯手打,望采纳。谢谢。
专利的申请类型有三种分别是发明专利、实用新型专利、外观设计专利。只要具备申请条件,然后提交的申请资料也没有问题,那么就可以顺利通过审核。到时候国家知识产权局会授予申请人专利权。
在我国,专利分为发明、实用新型和外观设计三种类型,这三种专利在保护对象、授权难度、权利稳定性等方面均有所不同。(1)实用新型专利:指对产品的形状、构造或者其结合所提出的适于实用新的技术方案。该产品应当是经过工业方法制造的、占据一定空间的实体。一切有关方法(包括产品的用途)以及未经人工制造的自然存在的物品不属于实用新型专利的保护客体。(2)外观设计专利:指对产品的形状、图案、或者其结合以及色彩与形状、图案的结合所作出的富有美感并适于工业上应用的新设计。(3)发明专利:指对产品、方法或者其改进所提出的新的技术方案。比如产品发明(如仪器,设备等)和方法发明(制造方法)两大类。
CnOpenData专利创新数据库涵盖1985-2020年专利信息,专利申请与授权数据库按照发明公布、发明授权、实用新型、外观设计等四个类别分表列式,并保留了各个专利的所有指标内容。 CnOpenData平台的专利申请与授权数据库区别于其他数据库的另一个重要内容是,我们的数据包含了针对每个专利的所有事务信息,包括专利在申请后何时被授权、是否在申请公布后被撤回、专利是否被质押、专利权人信息变更以及专利权终止等所有关于专利信息变更的内容网页链接
在中国知网进行跨库检索时有以下几个库可供选择1、中国学术期刊网络出版总库:《中国学术期刊(网络版)》是世界上最大的连续动态更新的中国学术期刊全文数据库,是“十一五”国家重大网络出版工程的子项目,是《国家“十一五”时期文化发展规划纲要》中国家“知识资源数据库”出版工程的重要组成部分。2、中国优秀硕士学位论文全文数据库:是目前国内相关资源最完备、高质量、连续动态更新的中国优秀博硕士学位论文全文数据库。目前,累积博硕士学位论文全文文献300万篇。3、中国重要会议论文数据库:国内外重要会议论文全文数据库的文献是由国内外会议主办单位或论文汇编单位书面授权并推荐出版的重要会议论文。由《中国学术期刊(光盘版)》电子杂志社编辑出版的国家级连续电子出版物专辑。4、中国重要报纸全文数据库:收录2000年以来中国国内重要报纸刊载的学术性、资料性文献的连续动态更新的数据库。至2012年10月,累积报纸全文文献1000多万篇。5、中国专利全文数据库:包含发明专利、实用新型专利、外观设计专利三个子库,准确地反映中国最新的专利发明。专利相关的文献、成果等信息来源于CNKI各大数据库。可以通过申请号、申请日、公开号、公开日、专利名称、摘要、分类号、申请人、发明人、优先权等检索项进行检索,并一次性下载专利说明书
有官方的,国知局的免费试用,不过用起来没有商用的体验好,我们辗转还是用了incopat,能满足更多检索和分析的需求。
官方就国知局了,免费的可以用sooPat,适合个人和小企业进行简单的检索,大企业或对于检索要求全而且准的话可以买商业数据库,比如incopat。
目前主流的主要是这五大数据库:中国知网:国家知识工程,数据多,实用性不好万方数据:数据比较丰富,入口比较深不好查中国学术期刊网:成立时间比较久2007年,目前刚改版,数据还不是很丰富维普:数据多,网站成旧速度慢龙源期刊网:数据多但有很多非法杂志根据杂志收录的网站不同进行查询,很多杂志都和这些网站签订了独家合作协议,所以可以在其中一个网站能够查询就可以。