首页

> 期刊发表知识库

首页 期刊发表知识库 问题

人工智能文献检索论文

发布时间:

人工智能文献检索

三年硕士? 不是顶尖学校的话, 人工智能专业对口的工作不是太好找, 但是人工智能的应用也挺广的, 说不定什么时候工作中就用上了 所以一般学校的话, 作为过来人, 我靠谱的说一下, 练练编程或者别的什么工作技能, 然后把人工智能的概念和名词搞熟了, 具体专精到什么程度其实无所谓啦, 毕业就好 找工作的话那就是能找到啥公司, 就去做哪一行, 学校的专业就不要太看中了

人工智能应用到生活中,主要具有以下特点:第一、成为你的私人助理以Siri为首的“个人助理时代”大幕正在拉开,最终很可能会成为人们与移动设备、计算机、汽车、可穿戴设备、家用电器或其他要求复杂人机交互技术的主要交互方式。当前市场上已经有了Siri,Cortana,但必须承认,这些产品所在的市场和所用技术仍处于“青春期”。再过几年,人工智能技术进步将帮助虚拟助手理解我们正在从事的工作,像真的私人助手一样提供帮助。给你安排行程、协调时间,告诉你交通情况,给你提供可行性方案。第二、保姆不再是人,而是机器人在家庭生活方面,如果家里拥有保姆机器人,就可以免去苦于找不到保姆的烦恼,解决日常家庭劳务所忧。有些人可能会认为这还很遥远,实际上日本已经开始在试用家庭保姆机器人了。第三、在自然灾害发生时处理海量信息如果发生自然灾害,想要即时处理信息并制定周全的计划是很困难的事。Moore认为,在5年之内,AI将变得足够智能,可以帮助我们进行一些思考。也就是说,它们能处理信息,及时做出判断,例如,决定到底要派多少人去救援。第四、提升医疗技术水平在医疗健康领域,目前已经有很多智能硬件公司推出了智能医疗硬件产品,能够及时地反应出人体的健康状况。比如机器视觉系统自动完成乳房X光检查和其他医学影响的分析,通过模拟医学专家诊断、治疗疾病的思维过程能够让机器人自动诊断病人病情等。人工智能在医疗方面的应用一方面能够改善就医条件和环境,另一方面也能大幅提升医疗技术水平。第五、满大街都是无人驾驶汽车最早将人工智能技术应用到汽车领域的是谷歌,随后国内的百度、华为也先后向无人驾驶技术发起了挑战。未来百度自动驾驶计划的核心方向就在百度大脑,它可实现人与汽车的语言互动,车辆定位,驾驶辅助甚至自动驾驶等功能。

只能减速。智能检索。智能检索必须解决的问题有智能的电脑作用。

科技水平不断增长,人工智能如何更好地融入生活一位26岁的年轻人表示,他有超过一半的记忆来自于网络生活,在日本,一名男性同一个性感撩人的虚拟形象结了婚。一家企业的实验室为一群7岁的孩子们植入虚假记忆,让他们相信曾与海豚一起游泳一一他们甚至回忆得出浑身湿透的场景。即使是对于最伟大的潜意识行学家西格蒙弗洛伊德来说,现实也依然植根于自我和社会。所有这些能力,同时扩大又动摇了我们的自我意识。技术是“第二自我”,就像某理工大学的教授特SherryTurkle所解释的,是我们同其他人之间一个新的接口,所有围绕着“社会技术会否导致与现实的分离”的争论,都没有抓住这一要领:我们正在进入一个新的混合型世界,有关真实性的假设在这个现实中,受到了根本性的挑战。想想看,技术不断增长的能力,操纵了多少我们对于这个世界的认识。Google Glass和即将出现的像素化隐形眼镜,将使我们能够通过叠加的信息来增强现实,其未来版本可能会提供一个更为侵入的视图,比如读取他人的生命体征,并且感知他们的压力水平。这方面技术的提高,可能会令我们感觉自身更进一步地通达了“现实”。然而,这种“现实”是否就代表真实,能会令我们仍然让人难以捉模。就拿增强现实的反面“减弱现实”来说吧:如果身在纽约的或者孟买的行人,不想看到街上的流浪汉,他们便可以从实时视图中屏蔽他们。这时,技术不仅削弱了现实的多样性,还阻碍了我们共情能力的发展。技术不仅改变我们与环境互动的方式还在我们的情感关系中创造出越来越多的真实和半真实的自我表征。新的身体上(而非视觉的)的“自我一他人关系”,正随着增加亲密感的触觉(touch)技术的发展面出现。新加坡的艾德利恩切克将爱情(哲学、心理学、生物学、神经科学)和机器人学(人工能和工程学)结合,创造了“爱情学”这一新的领域。他所设计的“热吻信使”(Kissenger)设备,是一对用来远程接吻的塑料嘴唇,可根据你和恋人的嘴先成型、匹配,并通过联网来激活。使用这种设备,能够将虚拟的交互行为,转换为活色生香的直实体验。

人工智能文献检索论文

兄弟,这下你安逸了。

现代信息检索方法的探讨要想充分利用这些浩如烟海的文献信息资源,必须借助各种各样的检索工具。同时,因特网信息资源的骤增及其异构性、动态性,不断给信息检索带来新的挑战。信息检索已成为现代社会信息化和各种应用的关键。如何更高层次的模拟、应用人脑的智能原理,从本质上变革信息资源检索方法,已成为现代化信息知识检索理论研究的热点。实践证明,将人工智能技术与信息技术结合,发挥人工智能的作用,是一条成功的经验。下面就知识检索与信息检索的关联和发展,作初步的探讨。一、布尔检索利用布尔逻辑算符进行检索词或代码的逻辑组配,是现代信息检索系统中最常用的一种方法。常用的布尔逻辑算符有三种,分别是逻辑或“OR”、逻辑与“AND”、逻辑非“NOT”。用这些逻辑算符将检索词组配构成检索提问式,计算机将根据提问式与系统中的记录进行匹配,当两者相符时则命中,并自动输出该文献记录。下面以“计算机”和“文献检索”两个词来解释三种逻辑算符的含义。①“计算机”AND“文献检索”,表示查找文献内容中既含有“计算机”又含有“文献检索”词的文献。②“计算机”OR“文献检索”,表示查找文献内容中含有“计算机”或含有“文献检索”以及两词都包含的文献。③“计算机”NOT“文献检索”,表示查找文献内容中含有“计算机”而不含有“文献检索”的那部分文献。检索中逻辑算符使用是最频繁的,对逻辑算符使用的技巧决定检索结果的满意程度。用布尔逻辑表达检索要求,除要掌握检索课题的相关因素外,还应在布尔算符对检索结果的影响方面引起注意。另外,对同一个布尔逻辑提问式来说,不同的运算次序会有不同的检索结果。布尔算符使用正确但不能达到应有检索效果的事情是很多的。二、信息检索信息检索起源于图书馆的参考咨询和文摘索引工作,从19世纪下半叶首先开始发展,至20世纪40年代,索引和检索已成为图书馆独立的工具和用户服务项目。信息检索通常指文本信息检索,包括信息的存储、组织、表现、查询、存取等各个方面,其核心为文本信息的索引和检索。它是基于信息组织形式,如字符串、结构化数据库,应用信息处理方法,如排序数据查找、字符匹配,实现效率不高的检索。信息检索综合应用布尔检索方法和基于超链的检索技术,改进了基本检索功能,但缺点是对精确的提问不能给出精确的回答。从历史上看,信息检索经历了手工检索、计算机检索到目前网络化、智能化检索等多个发展阶段。目前,信息检索已经发展到网络化和智能化的阶段。信息检索的对象从相对封闭、稳定一致、由独立数据库集中管理的信息内容扩展到开放、动态、更新快、分布广泛、管理松散的Web内容;信息检索的用户也由原来的情报专业人员扩展到包括商务人员、管理人员、教师学生、各专业人士等在内的普通大众,他们对信息检索从结果到方式提出了更高、更多样化的要求。适应网络化、智能化以及个性化的需要是目前信息检索技术发展的新趋势。三、知识检索知识检索的基本思想是,模拟扩展人类关于知识处理与利用的智能行为和认识思维方法,是充分利用在线图书馆和数字图书馆的文献信息资源的有利工具。例如:抽象思维方法,形象思维方法。知识检索具有明显的优势:①实现信息服务向知识服务的转化,向用户提供潜在内容知识,以及分析预测后的超前性领域成果或知识。②提供主动服务方式,自动优化用户需求,主动提供个性化检索。③面向用户,依据用户的需求及其变化,能灵活选择理想的检索策略和技术,并且将繁重的知识信息存取工作从用户移向了计算机。④综合应用各类知识和各种高效的智能技术,全面提高检索效率。知识检索是综合应用信息管理科学人工智能认知科学及语言学等多学科的先进理论与技术,基于知识和知识组织,融合知识处理和多媒体信息处理等多种方法与技术,充分表达和优化用户需求,能高效存取所有媒体类型的知识源,并能准确精选用户需要的结果。

三年硕士? 不是顶尖学校的话, 人工智能专业对口的工作不是太好找, 但是人工智能的应用也挺广的, 说不定什么时候工作中就用上了 所以一般学校的话, 作为过来人, 我靠谱的说一下, 练练编程或者别的什么工作技能, 然后把人工智能的概念和名词搞熟了, 具体专精到什么程度其实无所谓啦, 毕业就好 找工作的话那就是能找到啥公司, 就去做哪一行, 学校的专业就不要太看中了

人工智能文献检索报告

人工智能课程报告 摘要:自上世纪五十年代以来,经过了几个阶段的不断探索和发展,人工智能在模式识别、知识工程、机器人等领域已经取得重大成就,但是离真正意义上的的人类智能还相差甚远。但是进入新世纪以来,随着信息技术的快速进步,与人工智能相关的技术水平也得到了相应的提高。尤其是随着因特网的普及和应用,对人工智能的需求,变得越来越迫切,也给人工智能的研究提供了新的更加广泛的舞台。本文强调在当今的网络时代,作为信息技术的先导,人工智能学习在人工智能科学领域中是一个着非常值得关注的研究方向,要在学科交叉研究中实现人工智能学习的发展与创新,就要关注认知科学、脑科学、生物智能、物理学、复杂网络、计算机科学与人工智能之间的交叉渗透点,尤其是重视认知物理学的研究。自然语言是人类思维活动的载体,是人工智能学习研究知识表示无法回避的直接对象,要对语言中的概念建立起能够定量表示的不确定性转换模型,发展不确定性人工智能;要利用现实生活中复杂网络的小世界模型和无尺度特性,把网络拓扑作为知识表示的一种新方法,研究网络拓扑的演化与网络动力学行为,研究网络化了的智能,从而适应信息时代数据挖掘的普遍要求,迎接人工智能学习与应用领域新的辉煌。概述 自20世纪90年代以来,随着全球化的形式与国际竞争的日益激烈,对人工智能技术的研究与应用变的越来越被人们关注,且人工智能在制造中的运用以成为实现制造的知识化、自动化、柔性化以实现对市场的快速响应的关键。 人工智能是一门研究人类智能的机理以及如何用机器模拟人的智能的学科。从后一种意义上讲,人工智能又被称为“机器智能”或“智能模拟”。人工智能是在现代电子计算机出现之后才发展起来的,它一方面成为人类智能的延长,另一方面又为探讨人类智能机理提供了新的理论和研究方法。学习机制的研究是人工智能研究的一项核心课题。它是智能系统具有适应性与性能自完善功能的基础。学习过程具有以下特点:学习行为一般具有明显的目的性,其结果是获取知识;学习系统中结构的变化是定向的,要么由学习算法决定,要么由环境决定;学习系统是构造智能系统的中心骨架,它是全面组织与保存系统知识的场所。因此,人工智能学习研究的一个主要目的是使机器能够胜任一些通常需要人类智能才能完成的复杂工作。但是,不同的时代、不同的人对这种“复杂工作”的理解是不同的。一人工智能学习的历史性基础和发展步伐 人工智能学习的发展历史是和计算机科学与技术的发展史联系在一起的。除了计算机科学以外,人工智能还涉及信息论、控制论、自动化、仿生学、生物学、心理学、数理逻辑、语言学、医学和哲学等多门学科。 一般认为,人工智能的思想萌芽可以追溯到德国著名数学家和哲学家莱布尼茨(Leibnitz,1646-1716)提出的"通用语言"设想。这一设想的要点是:建立一种通用的符号语言,用这个语言中的符号表达“思想内容”,用符号之间的形式关系表达“思想内容”之间的逻辑关系。于是,在“通用语言”中可以实现“思维的机械化”这一设想可以看成是对人工智能的最早描述。 计算机科学的创始人图灵被认为是“人工智能之父”,他着重研究了一台计算机应满足怎样的条件才能称为是“有智能的”。1950年他提出了著名的“图灵实验”:让一个人和一台计算机分别处于两个房间里,与外界的联系仅仅通过键盘和打印机。由人类裁判员向房间里的人和计算机提问,并通过人和计算机的回答来判断哪个房间里是人、哪个房间里是计算机。图灵认为,如果“中等程度”的裁判员不能正确地区分,则这样的计算机可以称为是有智能的。“图灵实验”是关于智能标准的一个明确定义。有趣的是,尽管后来有些计算机已经通过了图灵实验,但人们并不承认这些计算机是有智能的。这反映出人们对智能标准的认识更深入、对人工智能的要求更高了。                            图灵和冯·诺依曼的上述工作,以及麦克考洛和匹茨对神经元网的数学模型的研究,构成了人工智能的初创阶段,这其实也是人工智能学习的开始。                                                        人工智能早期研究给人的深刻印象是博羿,与自动定理证明的研究意义不限于数学一样,搜索的研究意义也不限于博弈。根据认知心理学的信息处理学派的观点,人类思维过程的很大一部分可以抽象为从问题的初始状态经中间状态到达终止状态的过程,因此可以转化为一个搜索问题,由机器自动地完成。例如“规划”问题。设想一台机器人被要求完成一项复杂任务,该任务包含很多不同的子任务,其中某些子任务只有在另一些子任务完成之后才能进行。这时,机器人需要事先“设想”一个可行的行动方案,使得依照该方案采取行动可以顺利完成任务。“规划”即找出一个可行的行动案,可以通过以其子任务为状态、以其子任务间依赖关系为直接后继关系的状态空间中的搜索来实现。 人工智能的早期研究还包括自然语言理解、计算机视觉和机器人等等。通过大量研究发现,仅仅依靠自动推理的搜索等通用问题求解手段是远远不够的。Newell和Simon等人的认知心理学研究表明,各个领域的专家之所以在其专业领域内表现出非凡的能力,主要是因为专家拥有丰富的专门知识(领域知识和经验)。70年代中期,Feigenbaum提出知识工程概念,标志着人工智能进入第二个发展时期。知识工程强调知识在问题求解中的作用;相应地,研究内容也划分为三个方面:知识获取,知识表示和知识利用。知识获取研究怎样有效地获得专家知识;知识表示研究怎样将专家知识表示成在计算机内易于存储、易于使用的形式;知识利用研究怎样利用已得到恰当表示的专家知识去解决具体领域内的问题。知识工程的主要技术手段是在早期成果的基础上发展起来的,特别是知识利用,主要依靠自动推理和搜索的技术成果。在知识表示方面,除使用早期工作中出现的逻辑表示法和过程表示法之外,还发展了在联想记忆和自然语言理解研究中提出的语义网表示法,进而引入了框架表示法,概念依赖和脚本表示法以及产生式表示法等等各种不同方法。与早期研究不同,知识工程强调实际应用。主要的应用成果是各种专家系统。专家系统的核心部件包括:(a)表达包括专家知识和其他知识的知识库。                    (b)利用知识解决问题的推理机。       大型专家系统的开发周期往往长达10余年,其主要原因在于知识获取。领域专家虽然能够很好地解决问题,却往往说不清自己是怎么解决的,使用了哪些知识。这使得负责收集专家知识的知识工程师很难有效地完成知识获取任务。这种状况极大的激发了自动            知识获取----机器学习研究的深入发展。已经得到较多研究的机器学习方法包括:归纳学习、类比学习、解释学习、强化学习和进化学习等等。机器学习的研究目标是:让机器从自己或“别人”的问题求解经验中获取相关的知识和技能,从而提高解决问题的能力。 80年代以来,随着计算机网络的普及,特别是Internet的出现,各种计算机技术包括人工智能技术的广泛应用推动着人机关系的重大变化。据日美等国未来学家的预测,人机关系正在迅速地从“以人为纽带”的传统模式向“以机为纽带”的新模式转变人机关系的这一转变将引起社会生产方式和生活方式的巨大变化,同时也向人工智能乃至整个信息技术提出了新的课题。这促使人工智能进入第三个发展时期。                                   在这个新的发展时期中,人工智能面临一系列新的应用需求。首先是需要提供强有力的技术手段,以支持分布式协同工作方式,现代生产是一种社会化大生产,来自不同专业的工作者在不同或相同的时间、地点从事着同一任务的不同子任务。这要求计算机不仅为每一项子任务提供辅助和支持,更需要为子任务之间的协调提供辅助和支持。由于各个子任务在很大程度上可以独立地进行,子任务之间的关系必然呈现出动态变化和难以预测的特点。于是,子任务之间的协调(即对分布协同工作的支持)向人工智能乃至整个信息技术以及基础理论提出了巨大的挑战。                 其次,网络化推进了信息化,使原本分散孤立的数据库形成一个互连的整体,即一个共同的信息空间。尽管现有的浏览器和搜索引擎为用户在网上查找信息提供了必要的帮助,这种帮助是远远不够的,以至于“信息过载”与“信息迷失”状况日益严重。更强大的智能型信息服务工具已成为广大用户的迫切需要。另一方面,信息空间对人类的价值不仅在于单独的信息条目(比如某厂家生产出了某一新产品的信息),还远在于一大类信息中隐藏着的普遍性知识(比如某个行业供求关系的变化趋势)。于是,数据中的知识发现也成为一项迫切的研究课题。机器人始终是现代工业的迫切需求。随着机器人技术的发展,研究重点已经转向能在动态、不可预测环境中独立工作的自主机器人,以及能与其他机器人(包括人)协作的机器人。显然,这种机器人之间的合作可以看成是物理世界中的分布式协同工作,因而包括相同的理论和技术问题。       由此可见,人工智能第三发展时期的突出特点是研究能够在动态、不可预测环境中自主、协调工作的计算机系统,这种系统被称为Agent 。目前,正围绕着Agent的理论、Agent的体系结构和Agent语言三个方面展开研究,并已产生一系列重要的新思想、新理论、新方法和新技术。在这一研究中,人工智能呈现一种与软件工程、分布式计算以及通讯技术相互融合的趋势。Agent研究的应用不限于生产和工作,还深入到人们的学习和娱乐等各个方面。例如,Agent与虚拟现实相结合而产生的虚拟训练系统,可以使学生在不实际操纵飞机的情况下学飞行的基本技能;类似地,也可使顾客“享受”实战的“滋味”。 我国也先后成立中国人工智能学会、中国计算机学会人工智能和模式识别专业委员会和中国自动化学会模式识别与机器智能专业委员会等学术团体,开展这方面的学术交流。此外国家还着手兴建了若干个与人工智能研究有关的国家重点实验室,这些都将促进我国人工智能的研究,为这一学科的发展作出贡献。 综观人工智能学习的发展历程,可以看出它始终遵循的基本思路。首先是强调人类智能的人工实现而不是单纯的模拟,以便尽可能地为人类的实际需要服务。其次是强调多学科的交叉结合,数学、信息科学、生物学、心理学、生理学、生态学以及非线性科学等等越来越多的新生学科被融入到人工智能学习的研究之中。 二人工智能学习的主要技术及其发展趋势  目前人工智能学习研究的3个热点是:智能接口、数据挖掘、主体及多主体系统。智能接口技术是研究如何使人们能够方便自然地与计算机交流。为了实现这一目标,要求计算机能够看懂文字、听懂语言、说话表达,甚至能够进行不同语言之间的翻译,而这些功能的实现又依赖于知识表示方法的研究。因此,智能接口技术的研究既有巨大的应用价值,又有基础的理论意义。目前,智能接口技术已经取得了显著成果,文字识别、语音识别、语音合成、图像识别、机器翻译以及自然语言理解等技术已经开始实用化。 数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。数据挖掘和知识发现的研究目前已经形成了三根强大的技术支柱:数据库、人工智能和数理统计。主要研究内容包括基础理论、发现算法、数据仓库、可视化技术、定性定量互换模型、知识表示方法、发现知识的维护和再利用、半结构化和非结构化数据中的知识发现以及网上数据挖掘等。 主体是具有信念、愿望、意图、能力、选择和承诺等心智状态的实体,比对象的粒度更大,智能性更高,而且具有一定自主性。主体试图自治地、独立地完成任务,而且可以和环境交互,与其他主体通信,通过规划达到目标。多主体系统主要研究在逻辑上或物理上分离的多个主体之间进行协调智能行为,最终实现问题求解。目前对主体和多主体系统的研究主要集中在主体和多主体理论、主体的体系结构和组织、主体语言、主体之间的协作和协调、通信和交互技术、多主体学习以及多主体系统应用等方面。 新一代的智能技术是指80年代以来迅速发展起来的以神经网络(ANN)、进化计算、模糊逻辑、Agent为主要代表的计算只能技术,其中主要具有学习进化与自组织的能力。 神经网络也就是模拟人脑中神经元的功能,希望通过模拟人脑最基本的单位神经元功能来模拟人脑的功能。它通过一定的范例训练构成的神经网络,就象教一个小孩子一样,在训练结束后,这个神经网络就可以完成特定的功能了。它是通过范例的学习,修改了知识库和推理机的结构,达到实现人工智能的目的。 最后还有一个应用领域,就是模型识别,我想它应该在知识挖掘中应用不小,因为现在工程中的获得的数据越来越多,要想人为地从这些数据中确定某一规律都不容易,更不要说在这些数据中发现新规律了,因此有必要进行数据挖掘,它的应用对于决策支持系统将有着巨大的意义。 人可以思考,人工智能也需要思考,这就是推理;人可以学习,人工智能也就需要学习;人可以拥有知识,那么人工智能也就需要拥有知识。 人工智能是为了模拟人类大脑的活动的,人类已经可以用许多新技术新材料代替人体的许多功能,只要模拟了人的大脑,人就可以完成人工生命的研究工作,人创造自己,这不但在科学上,而且在哲学上都具有划时代的意义。 学习是指系统适应环境而产生的适应性变化,它使得系统在完成类似任务时更加有效。80年代以来,ANN的学习机制再次得到人们的重视,基于连接机制的亚符号学习又一次成为的当今学习机制研究的热点,提出了竞争学习,进化学习、加强学习等各种新的学习机制。机械式学习。它的另一个名称死记式学习能够直接体现它的特点,这是一种最简单的,最原始的学习方法,也是机器的强项,人的弱项。指导式学习。这种学习方式是由外部环境向系统提供一般性的指示或建议,系统把它们具体地转化为细节知识并送入知识库中,在学习过程中要对反复对知识进行评价,使其不断完善。 归纳学习。我们看到,机器所善长的不是归纳,而是演绎,它适用于从特殊到一般,而不太适应从一般到特殊,从特殊到一般的归纳是人类所特有的,是智慧的标志。具体的归纳学习方法有许多,但它们的本质就是让计算机学会从一般中得出规律。 类比学习。类比也就是通过对相似事物进行比较所进行的一种学习。它的基础是类比推理,也就是把新事物和记忆中的老事物进行比较,如果发现它们之间有些属性是相同的,那么可以(假定地)推断出它们的另外一些属性也是相同的。基于解释的学习。这是近年来兴起的一种新的学习方法。它不是通过归纳或类比进行学习,而是通过运用相关的领域知识及一个训练实例来对某一目标概念进行学习,并最终生成这个目标概念的一般描述,这个一般描述是一个可形式化表示的一般性知识。 增强式学习(ReinforcementLearning)是一种基于行为方法的半监督学习。一般的学习方法分两类,一类是上文提到的基于模型的,在这种方法,智能体需要环境确切的模型,具有较高的智能,但不适合于不确定的动态环境;另一种是基于行为的方法,在这种方法中,不需要环境的确切模型,采用分层结构,高层行为可以调整和抑制低层的行为能力,但每层中都具有其自主的确定权,如[3]中的Holonic智能制造系统。增强式具有这些优点,故常用于机器人足球赛[4]、狩猎问题、甚至战争指挥中[5],但是这些都只是理论上的研究,因为机器人足球赛的本身目的也是为了测试人工智能的可用性,且更不可能去让战争去由电脑而不是人去指挥了。使用强化学习的Agent最早是出现与遗传算法中,使用“Ethogenetics(行为遗传)”的思想,突破了人们长期以来关于一个编码串对应于组合优化问题所有策略变量的一个组合方式的传统、静态的认识,而将一个编码串看成某个智能主体(Agent)主动进行的一系列决策行为的结果。 人工智能学习可能会向以下几个方面发展:模糊处理、并行化、神经网络和机器情感。目前,人工智能的推理功能已获突破,学习及联想功能正在研究之中,下一步就是模仿人类右脑的模糊处理功能和整个大脑的并行化处理功能。人工神经网络是未来人工智能应用的新领域,未来智能计算机的构成,可能就是作为主机的冯·诺依曼机与作为智能外围的人工神经网络的结合。研究表明:情感是智能的一部分,而不是与智能相分离的,因此人工智能领域的下一个突破可能在于赋予计算机情感能力。情感能力对于计算机与人的自然交往至关重要。 通过以上的学习方法就是为了得到知识,通过一种方便的方法得到知识。前面已经说过了,因为机器的思考方式和人类的思考方式大有不同之处,因此让机器通过自己学习生成自己便于理解和使用的知识,也不失为机器学习的目标之一。 人工智能一直处于计算机技术的前沿,人工智能研究的理论和发现在很大程度上将决定计算机技术的发展方向。            由于计算机芯片的微型化已接近极限。人们越来越寄希望于全新的计算机技术能够带动人工智能的发展。目前至少有三种技术有可能引发全新的革命,它们是光子计算机、量子计算机和生物计算机。                结束语 许多科学家断言,机器的智慧会迅速超过阿尔伯特·爱因斯坦和斯蒂芬·霍金的智慧之和。著名物理学家斯蒂芬·霍金认为,就像人类可以凭借其高超的捣弄数字的能力来设计计算机一样,智能机器将创造出性能更好的计算机。最迟到本世纪中叶而且很可能还要快得多,计算机的智能也许就会超出人类的智能。 本文对学习中的一些方法进行基本的叙述并阐述了其发展的趋势,但是在一般的学习中,使用基于行为的方法仍旧是最受人关注的;文中介绍了几种强化学习方法的变形,并对他们的运用进行了一定的叙述。在一定程度上,他们实现仿真的可行行。但是这些仿真大多都是验证性的,真正的人工智能在实际生产中的运用仍旧是一个需要研究的课题。最后,我们来总结一下,人工智能学习的各个研究领域。参照人在各种活动中的功能,我们可以得到人工智能的领域也不过就是代替人的活动而已。哪个领域有人进行的智力活动,哪个领域就是人工智能学习研究的领域。人工智能学习就是为了应用机器的长处来帮助人类进行智力活动。人工智能学习研究的目的就是要模拟人类神经系统的功能。 但随着技术及技术的发展,人工智能学习的方法还会有所变化也更加会引起我们的关注。参考文献[1] 《人工智能简史》孙兴清华大学出版社, 1990年[2] 蔡自兴徐光佑《人工智能及其应用》清华大学出版社 2002年1月[3] 陈万求;黄一;;NBIC会聚技术的“后人类”议题[J];湖南师范大学社会科学学报;2013年04期 [4] 王东浩;;道德机器人:人类责任存在与缺失之间的矛盾[J];理论月刊;2013年11期[5] 机器学习理论为什么实现不了强人工智能[6] 王东浩;;人工智能体的道德确立与伦理困境[J];华南农业大学学报(社会科学版);2014年01期[7] 熊力;媒介道德激励功能及其实践研究[D];湖南大学;2013年[8] 孙志楠;;人工智能在电气自动化控制中的应用[J];现代商贸工业;2013年07期[9] 宋翠萍;;浅析智能化技术在电气工程自动化中的应用[J];电源技术应用;2013年06期[10] 胡琴;;电气自动检测技术的现状与发展[J];硅谷;2013年11期[11] 刘惠彦;;电气自动化工程控制系统的现状及其发展趋势[J];科技创新与应用;2013年18期[12] 朱金芳;;人工智能在电气工程自动化中的运用[J];化学工程与装备;2013年05期[13] 潘伟航;;浅析电气自动化在日常生活中的作用和未来发展趋势[J];科技创新与应用;2013年12期[14] 虞峥;;浅谈人工智能技术在电气自动化中的运用[J];电子制作;2013年05期[15] 赵纲;刘刚;;有关电气控制线路设计的研究[J];电子制作;2013年02期[16] 李俊平;人工智能技术的伦理问题及其对策研究[D];武汉理工大学;2013年[17] 赵艳军;锰粉制备输送控制系统设计与研究[D];兰州理工大学;2012年

四、智能检索智能检索利用分词词典、同义词典,同音词典改善检索效果,比如用户查询“计算机”,与“电脑”相关的信息也能检索出来;进一步还可在知识层面或者说概念层面上辅助查询,通过主题词典、上下位词典、相关同级词典,形成一个知识体系或概念网络,给予用户智能知识提示,最终帮助用户获得最佳的检索效果,比如用户可以进一步缩小查询范围至“微机”、“服务器”或扩大查询至“信息技术”或查询相关的“电子技术”、“软件”、“计算机应用”等范畴。另外,智能检索还包括歧义信息和检索处理,如“苹果”,究竟是指水果还是电脑品牌,“华人”与“中华人民共和国”的区分,将通过歧义知识描述库、全文索引、用户检索上下文分析以及用户相关性反馈等技术结合处理,高效、准确地反馈给用户最需要的信息。五、计算机信息检索随着1946年世界上第一台电子计算机问世,计算机技术逐步走进信息检索领域,并与信息检索理论紧密结合起来;脱机批量情报检索系统、联机实时睛报检索系统相继研制成功并商业化,20世纪60年代到80年代,在信息处理技术、通讯技术、计算机和数据库技术的推动下,信息检索在教育、军事和商业等各领域高速发展,得到了广泛的应用。DiMog国际联机情报检索系统是这一时期的信息检索领域的代表,至今仍是世界上最著名的系统之一。在单语言检索中,计算机检索系统利用网络蜘蛛进行网络信息的收集,然后利用自动标引技术对搜集的信息进行标引形成索引信息库。用户输入检索式后,计算机把检索式与数据库中索引项进行匹配,按索引式与标引项相关性大小降序输出检索结果。跨语言检索中,只要在检索过程中加入语言处理技术,就可以使一种语言与其他语言对应。信息检索是经济生活和科学研究的一个重要组成部分,尤其在今天这个飞速发展的信息时代,如何广泛、快速、准确地获取对自己有价值的信息,特别是如何借助电子化、网络化的手段去获取有价值的信息,直接影响到教学、科研等工作的成败。因此信息检索的方法和技能,越来越成为现代科技工作者和教师所必备的基本技能。目前,计算机信息检索已成为广大用户获取信息的主要方式,而且呈现出联机信息检索、光盘信息检索以及因特网信息检索多元并存的信息检索格局。如何快速、准确及有效地检索到所需信息,已成为日益突出的问题,那么,了解各信息检索系统的特点是实施信息检索最基本的前提。下面就其三种计算机信息检索系统作一介绍。1.联机信息检索系统。所谓联机信息检索,是指信息用户利用终端设备,通过国际通讯网络与世界上的信息检索系统,进行直接的人机对话,从检索系统的数据库中查找出用户所需信息的全过程。一个联机信息检索系统,通常由检索服务机构、国际通讯网络和终端组成。2.光盘信息检索系统。光盘信息检索系统是单机信息检索系统的一种,它解决了单机检索系统数据存储量少的缺点,是目前应用较为广泛的一种计算机信息检索系统。在信息检索领域应用的光盘主要是只读光盘。3.因特网信息检索。作为用户最多、影响最大的计算机网络,因特网堪称世界上资源最丰富的信息库和文档资料库,几乎能满足全球范围内对任何信息的需求。因特网信息检索系统一般由计算机服务器、通信网络、通信协议。网络信息检索服务器、用户终端等构成。六、网络信息检索网络信息检索简单地10说就是网络环境下的信息检索。它与传统信息环境下的检索有很大的不同,网络信息检索具有多样性、灵活性也超出了传统的信息检索。原来传统途径可获得的信息,现在几乎全部可以通过网络检索得到,而且更快、更新、更准确。随着计算机、多媒体和现代通讯技术的飞速发展,以印刷型文献为主的学校图书馆开始向以电子信息和虚拟信息为主的数字图书馆转化,Internet创造了丰富和多元化的学习资源,实现了资源共享。随着学习社会化、终身学习体系的诞生和进一步推进,网络在中小学教育中的应用也日益广泛和深入起来。Internet为我们带来了丰富的学校综合教育信息资源,它是提供Internet上的可用于学校综合教育过程的,在学校教育系统中传递的信息。近几年,Internet的发展使信息采集、传播和利用无论是从规模还是速度都达到了空前的水平。信息内容涉及广泛,几乎包括工农业生产、科技、教育、文化艺术、商业、资讯、娱乐休闲等诸多方面。在Intemet上,购物、在线教育、在线股市、远程医疗、点播电影、网络会议、网络展览都已变成现实,成为人类技术和文明的巨大财富,是全球取之不尽,用之不竭的信息资源基地。丰富信息资源带到人们面前的同时,也带来了问题:人们在蕴含丰富的信息面前无所适从,在浩如烟海的信息海洋中迅速、准确获取自己最需要的信息,变得十分困难。因此,20世纪90年代中期出现了检索万维网信息资源的搜索引擎技术。万维网是目前因特网上最受欢迎的检索服务系统,它利用超链接技术将全球的信息资源连接起来,用户通过浏览器就可以实现对网站页面的访问。21世纪是一个高度信息化的社会,信息就是商品、信息就是财富、信息就是资源、信息就是机会,因此人人都渴望及时获得有用的信息。如果说搜集信息是人类赖以生存、发展的一种本能,那么信息检索则是每个大学生和科研人员必须具备的一种基本技能。在计算机、网络通信技术日新月异,互联网遍及世界各个角落的今天,我们正身置于广袤无垠的信息海洋中。面对这样一个新知识、新技术不断涌现、知识新陈代谢频繁的世界,想要一劳永逸地获取知识是不可能的。我们只有终身学习,不断地获取、更新知识,才能不被社会所淘汰。要有效、快速地获取和利用最新信息,就必须掌握信息检索的技能。大学生在校求学期间所获得的不应该仅仅是“黄金”,更重要的是应获得“点金术”,其中之一就是信息检索的能力。通过检索和利用各种信息,不仅可以深化所学的知识;而且可以开阔视野,拓宽知识面;也为自学前人的知识、不断更新知识以及从事科学研究和发明创造奠定基础。

人工智能文献检索软件

百度旗下应用产品大全搜索导航  网页  视频搜索  MP3  地图  新闻  图片  词典常用搜索  hao123  文档搜索  网站导航搜索社区  知道  百科  贴吧  空间  文库  音乐掌门人  搜藏  经验  百度身边  百度旅游移动互联网  移动搜索  掌上百度  手机输入法  百度快搜  百度地图  网站与企业服务  搜索开放平台  站长平台  百度统计  百度联盟  百度推广  广告管家  数据研究中心  风云榜  百度指数  百度应用  购物和在线娱乐  百度有啊  百度游戏  娱乐  游戏大厅  百付宝  乐酷天软件介绍  百度Hi  百度工具栏  千千静听  软件搜索  百度输入法  百度浏览器  百度浏览伴侣  百度电脑管家更多服务  百度公益  老年搜索  盲道  大学搜索  博客搜索  法律搜索  图书搜索  专利搜索  百度CSR  百度识图  百度影音百度旗下  奇艺  百度乐居  天空软件  乐酷天 [11]百度人才

回答 您好 1、百度地图: 2、百度贴吧: 3、百度文库: 4、百度车联网: 5、百度安全: 百度、百度地图、百度视频、百度翻译、百度糯米、百家号、好看视频、爱奇艺、百度图片、百度新闻、百度网盘、百度贴吧、百度阅读、百度百科、百度知道、百度输入法、百度音乐、有钱花等! 更多5条 

人工智能信息检索论文

计算机检索、网络文献检索将成为信息检索的主流。  网络信息检索,也即网络信息搜索,是指互联网用户在网络终端,通过特定的网络搜索工具或是通过浏览的方式,查找并获取信息的行为。  信息检索的对象包括:文献检索(Document Retrieval),是以文献(包括题录、文摘和全文)为检索对象的检索,可分为全文检索和书目检索两种;数据检索(Data Retrieval)是以数值或数据(包括数据、图表、公式等)为对象的检索; 事实检索 (Fact Retrieval)是以某一客观事实为检索对象,查找某一事物发生的时间、地点及过程的检索。 1990年以前,网络信息检索的现状与发展没有任何人能够检索互联网上的信息。应该说,所有的网络信息检索工具都是从1990年的Alan Emtage等人发明的Archie开始的,虽然它当时只可以实现简单意义上的FTP文件检索。随着World Wide Web的出现和发展,基于网页的信息检索工具出现并迅速发展起来。1995年基于网络信息检索工具本身的检索工具元搜索引擎由美国华盛顿大学的Eric Selberg 等发明。伴随着网络技术的发展,网络信息检索工具也取得了十足的发展,那么这些检索工具的现状和发展趋势如何呢? 基于网页的网络信息检索工具的现状和发展趋势现状。网页是因特网的最主要的组成部份,也是人们获取网络信息的最主要的来源,为了方便人们在大量繁杂的网页中找寻自己需要的信息,这类检索工具发展的最快。一般认为,基于网页的信息检索工具主要有网页搜索引擎和网络分类目录两种。网页搜索引擎是通过“网络蜘蛛”等网页自动搜寻软件搜索到网页,然后自动给网页上的某些或全部字符做上索引,形成目标摘要格式文件以及网络可访问的数据库,供人们检索网络信息的检索工具。网络目录则是和搜索引擎完全不同,它不会将整个网络中每个网站的所有页面都放进去,而是由专业人员谨慎地选择网站的首页,将其放入相应的类目中。网络目录的信息量要比搜索引擎少得多,再加上不同的网络目录分类标准有些混乱,不便人们使用,因此虽然它标引质量比较高,利用它的人还是要比利用搜索引擎的人少的多。

我给你找了一篇,摘要如下:随着Internet在全世界范围内迅猛发展,网上庞大的数字化信息和人们获取信息之间的矛盾日益突出。因此,对网络信息的检索技术及其发展趋势进行探讨和研究,是一个既迫切而又实用的课题。本文通过对网络信息检索的基本原理、网络信息检索的技术及工具、网络信息检索的现状等方面进行分析研究,并对网络信息检索的发展趋势进行了预测,旨在寻找提高网络信息检索的手段和方法的有效途径,并最终提高网络信息的检索效果,使得网络信息资源得到充分有效地利用。 全文主要包括六个部分,第一部分为网络信息检索述评,主要是阐述了网络信息检索所涉及到的有关概念,如信息检索技术、网络信息检索的特点及网络信息检索效果评价。第二部分重点讨论了网络信息检索的基本技术。如信息推拉技术、数据挖掘技术、信息过滤技术、自然语言处理技术等等,旨在弄清网络信息检索的技术支撑,为预测网络信息检索的发展趋势作下铺垫。第三部分对网络信息检索的重要工具——搜索引擎进行了阐述,主要从其检索机制入手,分析了不同种类的搜索引擎的检索特点及功能。其独到之处在于对搜索引擎的基本功能进行了比较全面的概括,并对目前流行的搜索引擎进行科学的分类第四部分分析讨论了检索技术的另一分支—基于内容的检索技术第五部分则分析了网络信息搜索工具的局限,主要从文本信息检索和多媒体信息检索两方面进行阐述。好不容易给转成 xt文本,贴在下面:1网络信息资源网络信息资源是指“通过国际Intemet可以利用的各种信息资源”的总称。随着Intemet的迅速发展,网上信息资源也以指数形式增加,网络信息资源作为一种新型的信息资源,发挥着越来越重要的作用,其内容几乎无所不包,涉及政治、经济、文化、科学、娱乐等各个方面;其媒体形式多种多样,包括文本、图形、图像、声音、视频等;其范围覆盖社会科学、自然科学、人文科学和工程技术等各个领域。2信息检索技术信息检索技术是现代信息社会中非常关键的技术之一。信息检索是指将信息按一定的方式组织和存储起来,并根据信息用户的信息需求查找所需信息的过程和技术,所以信息检索的全称又叫“信息存储与检索”。狭义的信息检索仅指从信息集合中找出所需信息的过程,也就是利用信息系统检索工具查找所需信息的过程。人们获取信息源的方式主要有:①遵循传统的检索方法在浩如烟海的图书馆资料中,通过人工查找索引找到对应的文献索引号再获取文献原文;②联机信息检索。这其中也存在一个发展过程,由检索结果来看,从提供目录、文摘等相关的二次信息检索到可以直接获得电子版的全文;由检索方法来看,从对特定关键词或者如作者、机构等辅助信息作为检索入口的常规检索到以原始文献中任意词检索的全文检索等等。其中,全文检索由于其包含信息的原始性、信息检索的彻底性、所用检索语言的自然性等特点在近年来发展比较迅速,成为深受人们关注的一种非常有效的信息检索技术,它是从大容量文档库中精确定位所需信息的最有效手段l3]。2web信息检索其检索方式有:浏览器方式和搜索引擎方式。(l)浏览器方式(Br,singsystelns)。只要能够进入hitemct就能够通过浏览器,利用HTTP协议提供的WV乃万服务,浏览认触b页面和通过W匕b页面提供的检索方式访问数据库。(2)搜索引擎方式(SearehEngines)。搜索引擎是intemet提供公共信息检索服务的W七b站点,它是以一定的技术和策略在intemet中搜集和发现网络信息,并对网络信息进行理解、提取和处理,建立数据库,同时以认倪b形式提供一个检索界面,供用户输入检索关键词、词组或短语等检索项,代替用户在数据库中查找出与提问相匹配的记录,同时返回结果且按相关度排序输出,从而起到快速查找信息的目的。搜索引擎所处理的信息资源主要包括万维网服务器上的信息,另外还包括电子邮件和新闻组信息。搜索引擎服务的宗旨是为满足用户的信息需要,所以它是面向用户的,采用的方式是交互式的。网络信息检索工具采用主动提交或自动搜索两种方法搜索数据。4网络信息检索效果评价目前,得到普遍认同的检索效果的评价标准主要有以下几个:查全率、查准率、收录范围、输出格式,其中以查全率和查准率最为重要。现代信息科学技术的发展,为人们提供了多种多样的信息获取和传送方法及技术,从“信源”与“用户”的关系来看,可分为两种模式:“信息推送”模式(InformationPush),由“信源”主动将信息推送给“用户”,如电台广播;“信息拉取”模式(InformationPull),由“用户”主动从“信源”中拉取信息,如查询数据库。1信息推送技术“推”模式网络信息服务,是基于网络环境下的一种新的服务形式,即信息服务者在网上利用“Push”技术为特定用户开展信息服务的方式。Push技术之所以成为Intemet上一项新兴的技术,是因为借助该技术使网络信息服务具有主动性,不仅可以直接把用户感兴趣的信息推送给用户,而且可有效地利用网络资源,提高网络吞吐率;再者,Push技术还允许用户与提供信息的服务器之间透明地进行通信,极大地方便了用户。所谓Push技术,又称“推送”技术、Web广播(Webeasting)技术,实质上是一种软件,这种软件可以根据用户定义的准则,自动搜集用户最可能发生兴趣的信息,然后在适当的时候,将其传递至用户指定的“地点”。因而从技术上看,“推”模式网络信息服务就是具有一定智能性的、可以自动提供信息服务的一组计算机软件,该软件不仅能够了解、发现用户的兴趣(可能关心的某些主题的信息),还能够主动从网上搜寻信息,并经过筛选、分类、排序,然后按照每个用户的特定要求,主动推送给用户141。(l)信息推送方式。信息推送方式分两类,即网播方式和智能方式。网播方式有:频道式推送。频道式网播技术是目前普遍采用的一种模式,它将某些页面定义为浏览器中的频道,用户可像选择电视频道那样接受有兴趣的网播信息;邮件式推送,用电子邮件方式主动将所推送信息发布给各用户,如国际会议的通知、产品的广告等:网页式推送。在一个特定网页内将所推送信息发布给各用户,如某企业、某组织、某个人的网页;专用式推送。采用专门的信息发送和接收软件,信源将信息推送给专门用户,如机密的点对点通信。智能推送方式有:操作式推送(客户推送式),由客户数据操作启动信息推送。当某客户对数据进行操作时,把修改后的新数据存入数据库后,即启动信息推送过程,将新数据推送给其他客户;触发式推送(服务器推送式),由ll硕士学位论文MASTER,5THESIS⑧数据库中的触发器启动信息推送过程,将新数据推送给其他客户,当数据发生变化,如出现增加(Insert)、删除(Delete)、修改(update)操作时,触发器启动信息推送过程。(2)信息推送的特征。信息推送的特征有:主动性、针对性、智能性、高效性·灵活性和综合性I5]。主动性。Push技术的核心就是服务方不需要客户方的及时请求而主动地将数据传送到客户方。因而,主动性是“推”模式网络信息服务最基本特征之一。这也是它与基于浏览器的“拉”(Pull)模式的被动服务的鲜明对比。针对性(个性化)。针对性是说,Push技术可以针对用户的特定信息需求进行检索、加工和推送,并根据用户的特定信息需求为其提供个人定制的检索界面。智能性。Push服务器能够根据用户的要求自动搜集用户感兴趣的信息并定期推送给用户。甚至,Push技术中的“客户代理(ClientAgent)”可以定期自动对预定站点进行搜索,收集更新信息送回用户。同时个人信息服务代理和主题搜索代理还可为了提高“推送”的准确性,控制搜索的深度,过滤掉不必要的信息,将认飞b站点的资源列表及其更新状态配以客户代理完成。因而,网络环境下的“推”模式信息服务具有较高的智能性。这也是传统的定题服务(SDI)不能比的。高效性。高效性是网络环境下“推”模式信息服务的又一个重要特征。Push技术的应用可在网络空闲时启动,有效地利用网络带宽,比较适合传送大数据量的多媒体信息。灵活性。灵活性是指用户可以完全根据自己的方便和需要,灵活地设置连接时间,通过E一mail、对话框、音频、视频等方式获取网上特定信息资源。综合性。“推”模式网络信息服务的实现,不仅需要信息技术设备,而且还依赖于搜寻软件、分类标引软件等多种技术的综合[6]。但在当前信息技术的发展阶段,“推”技术还存在很大的缺陷,比如:不能确保信息发送,没有状态跟踪,缺乏群组管理功能等等。因此,国内外的研究者们又提出超级推(BeyondPush)技术的理论。所谓超级推技术是在保留、继承、完善了Push的优点(主动传递和个性化定制),摒弃了Push的诸多缺点之,2硕士学位论文MASTER,5THESIS管后而发展起来的一种新型的Push技术。它的最大特点是在于保证传送。即所有的信息都是在特定的时间送给特定的信息用户,同时保持连续性的用户资料,随时可以知道谁收到了信息,信息是否为该用户定制,用户环境是否适当等等[刀。2信息拉取技术常用的、典型的信息拉取技术,如数据库查询,是由用户主动查询数据库,从数据库中拉取所需信息。其主要优点是:针对性好,用户可针对自己的需求有目的地去查询、搜索所需的信息。Intemet上的信息拉取技术可以说是数据库查询技术的扩展和延伸。在网络上,用户面对的不止是一个数据库,而是拥有海量信息的hitemet环境,因此,各种网络信息拉取(查询)的辅助工具—搜索引擎应运而生了。信息推送与信息拉取两种模式各有其特点,在实际中常常是将两者的结合起来,常用的结合方式为:(1)“先推后拉”式。先及时地推送最新信息(更新的动态信息),再有针对性地拉取所需的信息。这样,便于用户注意信息变化的新情况和趋势,从而动态地选取需要深入了解的信息。(2)“先拉后推”式。用户先拉取所需信息,然后根据用户的兴趣,再有针对性地推送相关的其它信息。(3)“推中有拉”式。在信息推送过程中,允许用户随时中断、定格在所感兴趣的网页上,作进一步的搜索,主动拉取更丰富的信息。(4)“拉中有推”式。在用户拉取信息的搜索过程中,根据用户输入的关键词,信源主动推送相关信息和最新信息。这样既可以及时地、有针对性时为用户服务,又可以减轻网络的负担,并便于扩大用户范围[8]。因此,信息推送与信息拉取相结合是当前Intemet、数据库系统及其它信息系统为用户提供主动信息服务的一个发展方向。3Web挖掘技术随着功temet的发展,W己b已经成为人类社会的公共信息源。在hitemet给人类带来前所未有的信息机遇的同时,又使得人类的信息环境更加复杂,人硕士学位论文MASTER,5THESIS⑧类如何利用信息的问题非但没有如预想的通过信息技术的发展得到圆满的解决,相反,随着信息技术的发展,信息量的激增,造成了个人实际所需信息量与研触b上的海量信息之间的矛盾,因而也就造成了个人利用信息的困难。在这种情况下,虽然出现了叭范b环境下的专门检索工具,但是由于搜索引擎是由传统检索技术发展而来,在当前用户要求不断提高的情况下,传统的搜索技术己经不能够满足人们的需要。为了更加有效地利用网络信息资源,W七b挖掘作为新的知识挖掘的手段,为Web信息的利用提出了新的解决方案叨。3,1姗eb挖掘的内容数据挖掘就是从大量的、不完全的、有噪声的、模糊的、随机的数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。Web挖掘则是从WWW及其相关的资源和行为中抽取有用的模式和隐含信息。其中WWW及其相关资源是指存在于WWW之上的Web文档及Web服务器上的日志文件以及用户资料,从Web挖掘的概念中应当看出Web挖掘在本质上是一种知识发现的手段,它主要从下面3个方面进行仁时。(1)Web内容挖掘。W七b内容挖掘是从W匕b数据中抽取知识,以实现Web资源的自动检索,提高web数据的利用效率。随着Intemet的进一步延伸,Web数据越来越庞大,种类越来越繁多,数据的形式既有文本数据信息,也有图像、声音、视频等多媒体数据信息,既有来自于数据库的结构化数据,也有用HTML标记的半结构化数据及非结构化的自由文本数据信息。因而,对W己b内容信息挖掘主要从下面两个角度进行〔”]。一是从信息检索的角度,主要研究如何处理文本格式和超级链接文档,这些数据是非结构化或半结构化的。处理非结构化数据时,一般采用词集方法,用一组组词条来表示非结构化的文本,先用信息评价技术对文本进行预处理,然后采取相应的模型进行表示。另外,还可以用最大字序列长度、划分段落、概念分类、机器学习和自然语言统计等方法来表示文本。处理半结构化数据时,可以利用一些相关算法给超级链接分类,寻求认七b页面关系,抽取规则。同处理非结构化数据相比,由于半结构化数据增加了HTM毛标记信息及Web文档内部超链结构,使得表示半结构化数据的方法更加丰富。二是从数据库的角度,主要处理结构化的W匕b数据库,也就是超级链接14⑧蕊誉蕊文档,数据多采用带权图或者对象嵌入模型(OME),或者关系数据库表示,应用一定的算法,寻找出网站页面之间的内在联系,其主要目的是推导出Web站点结构或者把W匕b变成一个数据库,以便进行更好的信息管理和查询。数据库管理一般分成三个方面:一是模型化,研究认触b上的高级查询语言,使其不局限于关键字查询;二是信息的集成与抽取,把每个W七b站点及其包装程序看成是一个认范b数据源,通过W七b数据仓库(data~house)或虚拟W七b数据库实现多种数据来源的集成;三是叭几b站点的创建与重构,通过研究web上的查询语言来实现建立并维护web站点的途径[“]。(2)札b结构挖掘。W匕b结构挖掘,主要指的是通过对W七b文档的分析,从文档之间的组织结构获取有用的模式。W匕b内容挖掘研究的是文档内的关系,W七b结构挖掘关注的则是网站中的超级链接结构之间的关系,找到隐藏在一个个页面之后的链接结构模型,可以用这个模型对W七b页面重新分类,也可以用于寻找相似的网站。W七b结构挖掘处理的数据类型为W七b结构化的数据。结构化数据是描述网页内容组织方式的数据,页内结构可以用超文本标记语言等表示成树型结构,此外页间结构还可以用连接不同网页的超链结构表示。文档间的链接反映了文档信息间的某种联系,如隶属平行关系、引用与被引用关系等。对W七b页面的超级链接进行分类,可以判断与识别页面信息间的属性关系。由于Web页面内部存在或多或少的结构信息,通过研究W亡b页面内部结构,可寻找出与用户选定的页面集合信息相关的其它页面信息模式,以检测W己b站点所展示的信息完整程度。③Web行为挖掘。所谓W己b用户行为挖掘主要是通过对认尼b服务器的日志文件以及用户信息的分析,从而获得有关用户的有用模式。W七b行为挖掘的数据信息主要指网络日志中包括的用户行为模式,它包括检索时间、检索词、检索路径、检索结果以及对哪些检索结果进行了浏览。由于W七b自身的异质、分布、动态、无统一结构等特点,使得在认七b网上进行内容挖掘比较困难,它需要在人工智能和自然语言理解等方面有所突破。所幸的是基于W七b服务器的109日志存在着完整的结构,当信息用户访问web站点时,与访问相关的页面、时间、用户ro等信息,日志中都作了相应的记录,因而对其进行信息l5硕士学位论文MASTER,5THESIS⑥挖掘是可行的,也是有意义的。在技术实践过程中,一般先把日志中的数据映射成诸种关系信息,并对其进行预处理,包括清除与挖掘不相关的信息等。为了提高性能,目前对109日志数据信息挖掘采用的方法有路径分析、关联规则、模式发现、聚类分析等。为了提高精确度,行为挖掘也应用到站点结构信息和页面内容信息等方面。2web挖掘技术在网络信息检索中的应用(l)Web内容挖掘在检索中的应用。W匕b内容挖掘是指从文档内容及其描述中获取知识的过程,由于用传统的信息检索技术对W己b文档的处理不够深入,因此,可以利用叭触b内容挖掘技术来对网络信息检索中的W己b文档处理部分进行进一步的完善,具体而言表现在以下几个方面。①文本总结技术。文本总结技术是指从文档中抽取出关键信息,然后以简洁的形式对W匕b文档的信息进行摘要或表示。这样用户通过浏览这些关键信息,就可以对W七b网页的信息有大致的了解,决定其相关性并对其进行取舍。②文本分类技术。W匕b内容挖掘中的文本分类指的是按照预先定义的主题类别,利用计算机自动为文档集合中的每一个文档进行分类。分类在网络信息检索中的价值在于可以缩小检索范围,大大提高查准率。目前,己经出现了很多文本分类技术,如TFIFF算法等,由于文本挖掘与搜索引擎所处理的文本几乎完全一样,所以可以直接将文本分类技术应用于搜索引擎的自动分类之中,通过对大量页面自动、快速、有效的分类,来提高文档检索的查准率。③文本聚类技术。文本聚类与文本分类的过程J险洽相反,文本聚类指的是将文档集合中的文档分为更小的簇,要求同一簇内的文档之间的相似性尽可能大,而簇与簇之间的关系尽可能小,这些簇相当于分类表中的类目。文本聚类技术不需要预先定义好的主题类别,从而使得搜索引擎的类目能够与所收集的信息相适应。文本聚类技术与人工分类相比,它的分类更加迅速、客观。同时,文本聚类可与文本分类技术相结合,使得信息处理更加方便。可以对检索结果进行分类,并将相似的结果集中在一起。(2)Web结构挖掘在网络信息检索中的应用。W匕b的信息组织方式采用了一种非平面结构,一般来说W己b的信息组织方式是根据内容来进行组织的。但是由于W匕b的这些结构信息比较难以处理,所以搜索引擎一般不处理这些信16硕士学位论文MASTER,S竹正515⑧息,而是将叭触b页面作为平面机构的文本进行处理。但是,在从触b结构挖掘中,通过对研触b文档组织结构的挖掘,搜索引擎可以进一步扩展搜索引擎的检索能力,改善检索效果〔3]。(3)脆b行为挖掘在网络信息检索中的应用。认触b行为挖掘是一种通过挖掘总结出用户的检索行为的模式。用户的检索行为一直是信息检索中重要的研究内容,通过研触b行为挖掘,不仅可以发现多数用户潜在共同的行为模式,而且还可以发现单个用户的个性化行为,对这些模式进行研究,可以更好地对搜索引擎的检索效果进行反馈,以便进一步改进搜索策略,提高检索效果。3web挖掘技术的局限及方向(1)孔b内容挖掘。W七b上的数据不管是用HTML还是XML标记语言表示,都不能完全解决W七b数据的非结构性问题,特别是汉语句子格式繁多,虚词、实词没有绝对的界限,切分词难度大,这些是造成无法对数据进行完全自动标引的根本性问题,因此,从七b内容挖掘技术有必要结合数据仓库等信息技术进行信息存储,并最终实现智能化、自动化的数据表示和标引,以供搜索之用。通常数据的表示和数据的利用形式是相互关联的,因此,设计相应的具有高查全率和查准率的挖掘算法也和数据表示一样是未来的方向之一。另外多媒体数据如何进行识别分类标引,这也是未来的研几b内容挖掘研究的难点和方向。(2)梅b结构数据挖掘。随着Intemet的迅猛发展,网站的内容也越来越丰富,结构也越来越庞杂,用有向图表示巨型网站链接结构将不能满足数据处理的需要,需要设计新的数据结构来表示网站结构。由于用来作对比分析发现问题所在的用户使用信息只有日志流,那么,对用户使用日志流中每一链接关系如何识别、采用什么结构表示、如何抽取有用的模式等等,不仅是认飞b行为挖掘的重要研究内容也是网站结构挖掘的重要研究方向之一。(3),eb用户行为挖掘。由于Iniemet传输协议HTTP的无状态性,客户端、代理服务器端缓存的存在,使用户访问日志分别存在于服务器、代理服务器和客户端,因此,从W七b用户访问日志中研究用户访问规律最大的难点在于如何把分布于不同位置的访问日志经过预处理,形成一个个用户一次的访问期间。通常来讲,对于静态W七b网站,服务器端的日志容易取得,客户端和代l7理服务器用户访问日志不容易取得;其次,由于一个完整的W匕b是由一个个图片和框架页面组成的,而用户访问服务器也有并发性,在确定用户访问内容时,必须从服务器日志中甄选出某个用户实际请求的页面和页面的主要内容。另外,由于目前已经有的数据挖掘算法主要是在大量交易数据基础上发展起来的,在处理海量Web用户访问日志中也需要重新设计算法结构〔41。4信息过滤技术hitemet开放式的环境,为人们检索和利用信息提供了极大的方便,但同时,网络环境也为人们及时准确地检索到所需信息带来了麻烦。这是因为,第一,网络环境中信息的来源复杂多样,随意性大,任何人、任何单位不管其背景和动机如何都可以在网络上发布信息,信息的产生和传播没有经过筛选和审定,因此信息的可靠性、质量和价值成为用户普遍担心的一大问题;第二,目前大多数据搜索工具的检索范围是综合性的,它们的Robots尽可能地把各种网页抓回来,经过简单加工后存放在数据库中备检;第三,搜索引擎直接提供给用户的检索途径大都是基于关键词的布尔逻辑匹配,返回给用户的就是所有包括关键词的文献,这样的检索结果在数量上远远超出了用户的吸收和使用能力,让人感到束手无策。这就是人们经常谈论的“信息过载”、“信息超载”现象。信息过滤技术就是在这样的背景下开始受到人们的重视,它的目的就是让搜索引擎具有更多的“智力”,让搜索引擎能够更加深入、更加细致地参与到用户的整个检索过程中,从关键词的选择、检索范围的确定到检索结果的精炼,帮助用户在浩如烟海的信息中找到和需求真正相关的资料。1信息过滤模型信息过滤其实质仍是一种信息检索技术,因此它仍依托于某一信息检索模型,不同的检索模型有不同的过滤方法。51。(1)利用布尔逻辑模型进行过滤。布尔模型是一种简单的检索模型。在检索中,它以文献中是否包含关键词来作为取舍标准,因此,它不需要对网页数据进行深度的加工。最简单的关键词表可以设计成只有三个字段:关键词、包括关键词的文献号、关键词在相应文献中出现的次数。检索时,用户提交关键词。

相关百科

热门百科

首页
发表服务