第1篇:跨语言信息检索中的最关联英文语义翻译选取
0引言
在跨语言的信息检索Web环境中,需要采用语义本体模型匹配和特征提取方法进行各种语义翻译处理和语义信息分析,实现对信息检索库中语义信息资源调度和模型构建。由于跨语义信息检索数据库中存在一定的语义冲突,严重影响了语言翻译和信息检索的准确性,存在语义异构和语义分歧问题,特别是在跨语言数据库中對英文语义翻译的关联性不好,在信息检索、数据集成和数据库重构中导致对关联语义的匹配度和检索的准确度不高[1?2]。因此,需要进行跨语言信息检索中的最关联英文语义翻译选取设计,利用语义分析与提取技术提高跨语言信息检索的准确性[3]。本文以异构英文语义本体模型为研究对象,进行最关联英文语义翻译选取和特征提取研究,找出语义相同或者相似概念对,逐一地对本体之间语义信息素进行相似度信息分析和信息素导引,提高对语言信息数据库的访问和检索能力,并取得一定的研究成果。
1关联英文语义本体结构模型构建
1.1跨语言信息检索的英文翻译语义映射
为了实现跨语言信息检索中的最关联英文语义翻译选取,需要首先构建跨语言信息检索中最关联英文语义本体结构模型,基于语义相似度计算方法进行跨语言信息检索的英文语义翻译的机器学习和训练。首先给出跨语言信息检索的数据访问和语义选取结构图如图1所示。
根据图1所示的跨语言信息检索的数据访问和语义选取结构,进行跨语言信息检索语义映射关系的分类[4?5]。
定义1英文语义映射。针对语法分析方案Ai,跨语言信息检索英文翻译的本体语义映射模型的形式化定义是一个五元组,其中:
C:语义修饰概念集合。C中的语句CS有m种不同的语法分类,从语义上来说,对语义相似度分析,得到跨语言数据库中包含有多个从句。在本体中,AA是后置定语,满足基本单元的语句语义结构。
I:实例集合。I为每次选择一个简单子句的每个实例,通过语义映射得到一个惟一的个体。在本体中,实例是语句语义结构的本体映射表象,因此也称为语义修饰目标。
HC:语句的语义相关度的分类关系集合。这类关系可以求出非语句主干的特征映射关系(Hyponymy),用函数来表示表示本体中父概念(Super?Concept)和子概念(Sub?Concept)之间的不同的语法分析方案。
R:当前跨语言信息检索关联英文数据库本体内元素的分类集合。R所包含的关系可分成两大类:语义指向性信息索引行为关系和概念的隶属关系。
A:语义修饰目标集合。A中的每条语义修饰目标代表英文翻译语义中实词的个数,它可用于语义修饰目标之间的语义相关度来描述概念和实例之间跨语言信息检索的映射关系,或者描述第i种语法分析方案下的语义特征映射的约束关系。
1.2语义本体相关度计算模型
在上述进行了跨语言信息检索的英文翻译语义映射定义基础上,根据跨语言信息检索中英文语句的多种语法分析方案,构建最关联英文语言翻译的语法分析方案,如图2所示。
假设跨语言信息检索数据库中关联英文的本体映射三层集成分布概念集合的数学模型可表示为:
式中:中的是表示语句具有m种语法分析方案的个数,表示语义相关度;语句主干权重系数。英语从句具有m种语法分析方案,最符合语义逻辑的语法分析方案满足所有词汇翻译相关性的约束条件为:
根据跨语言信息检索的词语知识(Lexicalknowledge)得到语义映射关系的差异性特征。通过对不同本体进行英文翻译的语法分析,对概念的上下文(Context)进行关联匹配度分解,在概念节点Mountain中考虑等价的语义映射,根据语义本体相关度计算,得到语法分析的最佳方案[6]。
定義2语义本体模型。跨语言信息检索关联英文翻译的本体与之间的语义修饰互信息特征通过一个映射函数M表示,。其中,C是本体的语义关联度,rel是跨语言信息检索数据库中的英文资源信息一个实词集合,被称之为英文从句的归结关系。
采用语义指向性信息索引方法进行英文翻译的上下文语义映射,可进行从句范围选择中预期使用的词汇能有效反映英文语义翻译的单语义。根据简单语义单元建立英文翻译的语义修饰关系[7],如图3所示。
由于建立本体之间英文翻译的语义修饰关系存在异构性,语义结构为:,概念节点(Cs和Ct′)对英文翻译中的语义关联句属于主句,还是从句进行判断,判断准则为:Cs与Ct′之间内部语法结构映射关系()、Cs与Ct′之间简单语义单元的语义特征映射关系()、Cs与Ct′之间的自组织映射泛化关系()、Cs与Ct′之间的从句权重关系()和Cs与Ct′之间的每种语法分析方案的映射关系()。计算每个简单语义单元的语义本体相关度,得到异构本体之间的语义相关度值,例如:把语义块的n个英文翻译词汇进行信息素浓度聚焦,实现知识共享、重用,得到跨语言信息检索中英文翻译词句集合rel中的语义指向性信息索引的语义相关度表示为:
式中:表示语句CS中关联英文语义翻译的相似度;表示两组本体片段之间进行跨语言信息检索的语义关联度,且系数。
2最关联英文语义翻译选取实现
2.1英文语义翻译的上下文语义映射
在上述进行了关联英文语义本体结构模型构建的语义本体相关度计算的基础上,进行跨语言信息检索中的最关联英文翻译的选取。针对当前方法存在的弊端,本文提出一种基于最关联语义本体模型匹配的跨语言信息检索英文翻译选取方法,采用语义指向性信息索引方法进行英文翻译的上下文语义映射[8]。在一个概念词语知识的英文语义本体模型中,语义词典库用一个三元组的形式K=(O,A,R)表示。其中,O是语义词典库的英文语义对象集合,A是跨语言检索的属性集合,R是O和A之间的词语选择语义用二元素表示。设本体模型的拓扑结构中英文翻译的从句属性总数为m,各个分词的语义信息流在翻译采样信息时间间隔的自相关函数为:
式中:英文语义翻译的上下文语义映射的提取率与的差别越来越大,则解释信息与概念信息流与完全无关;作为所包含的元素节点集合的自相关函数,趋于0。通过英文语义翻译的上下文语义映射模型构建[9],得到英文语义翻译的上下文语义映射的规则如下:
(1)将跨语言信息检索中英文的连接词和谓词逻辑表示成概念上下文形式;
(2)将介词,如“in”或者“of”,表示成相应的逻辑公式;
(3)将带有包含关系从句如“except”或者“butnot”表示成否定形式。
根据上述规则构建英文语义翻译的上下文语义映射,进行最关联英文语义翻译选取。
2.2跨语言检索最关联英文语义翻译选取
在本体模型O=中采用关键词索引方法,给定逻辑公式W,通过上下文语义映射进行词频信息X,Y特征提取,根据语义本体之间的词语知识和本体片段映射方法进行英文语义翻译的特征提取,分别为:
式中:,是分别是语义标识过程中英文实词X,Y的语义修饰目标集;是联合访问语义相似度词频信息,表示X,Y所得到的准确的语义信息召回的联合概率密度函数。
在进行跨语言检索最关联英文语义翻译选取中,假设V是形容词,S是V的后置虚词,O是V的最佳语义相关度,L是S,V,O中间的简单子句,AB是前置定语,AA是跨语言信息检索的后置谓语,PD是实词的个数,通过语义关联度匹配,实现英文语义翻译选取,步骤表述如下:
步骤1(数据预处理):根据词汇语义进行本体映射中英文从句的分词选择,并获得其词性,为进行准确的英文翻译提供目标从句;
步骤2(找到词汇语义的子句):针对语句CS,对应于n个词汇所形成的概念树,可以找出最佳语义相关度值,对简单子句集合进行从句范围选择;
步骤3:计算分段L的语义结构,选择计算结果最佳的简单子句CSi,乘以权重系数KS,进行查准率优化,语义修饰CSi;
步骤4:选择具有最佳语义相关度值的简单句,如果满足约束条件,则重复步骤2,3;否则,计算所有子句的最佳语义相关度;
步骤5:针对语法分析方案Ai,选择前置虚词,计算一次值,当满足英文语义翻译的上下文语义映射的规则,算法结束。
3实验测试分析
在进行跨语言信息检索的最关联英文语义翻译选取的实验中,以KDDP2015跨语言数据库作为词汇语义资源,采用Matlab7编程软件进行英文语义翻译选取的编程设计。测试英文翻译问题来自于KDDP2015的CWT200G数据测试集,测试集中包含21个语义等价概念集、46个不同语言的从句属性集和358个实例集。测试通过跨语言信息检索实现最关联英文语义翻译的查全率、查准率和最佳语义相关度值测试结果见表1。
分析表1中结果得知,采用本文模型进行跨语言信息检索的最关联英文语义翻译,能达到最佳语义相关度配准,提高英文语义翻译的查全率和查准率。图4为不同方法进行英文语义翻译选取的查准率对比结果,结果表明,采用本文方法进行关联英文语义翻译的查准率高于传统模型,具有优越性。
4结语
为了提高跨语言信息检索中的英文语义翻译准确性,本文提出一种基于最关联语义本体模型匹配的跨语言信息检索英文翻译选取方法。构建跨语言信息检索中最关联英文语义本体结构模型,采用语义指向性信息索引方法进行英文翻译的上下文语义映射,根据语义本体之间的词语知识和本体片段映射方法进行英文语义翻译的特征提取,实现最关联英文语义翻译选取。仿真测试结果表明,采用本文方法进行跨语言信息检索,英文语义翻译选取的召回性能较好,查全率、查准率较高,在英文跨语言检索和翻译中具有较好的应用价值。
作者:方茜
第2篇:试论大数据环境下信息检索技术在数字图书馆中的应用
数字图书馆的信息检索技术,是图书馆发挥信息服务功能的核心部分,数字图书馆的易用性很大程度上取决于信息检索系统设计是否科学、合理。据专家考证,18世纪以前,知识更新速度为80至90年翻一番,20世纪90年代以来,知识更新加速到3至5年翻一番。近50年来人类社会所创造的知识比过去3000年的总和还要多,知识总量呈几何级数增长。这些信息都是以数据的形式分布于飞速发展的因特网,而因特网中的数字图书馆则是信息储存的主要基地,这就使得如何在庞杂浩繁的信息资源中找到用户想要的信息,最大限度地在科学性、合理性的前提下进行信息检索服务,成为必须面对且急待解决的问题,即基于大数据环境下,数字图书馆信息检索技术的研究问题。目前关于数字图书馆的研究和信息检索研究都已经比较完备,但是针对如何在大数据环境下,满足数字图书馆用户的多样需求的信息检索技术的研究并不多,这也是现代数字图书馆发展急需解决的问题之一。
一、信息检索技术的优缺点对比
目前,从对数字图书馆的信息检索技术研究成果来看,主要有三个时间段:传统的信息检索、全文检索、基于内容的信息检索。这三种技术各有优劣。
1、传统的信息检索技术优缺点分析
信息检索技术开始时基于对关键词、概念知识的检索,或者是仅仅针对一个个单字进行的检索,主要按照关键字的方法进行匹配检索。如果是针对单字、单词进行检索的话,能够比较准确地完成检索需求;如果是需要根据内容相关性进行检索的话,检索的结果误差大、耗时长,基本上不能满足用户需求,而且检索的适应度非常差。如果是针对一个只有几百本书的图书馆来说,这种检索技术还勉强可用,但是绝对不能适应现在动辄几百万本以上存储量图书馆的检索需求。
2、全文检索技术优缺点分析
一般来说,按照自由词进行检索的一种检索方式就是所谓的全文检索。全文检索技术检索的侧重点和传统检索技术的侧重点不同,它检索的主要内容不是对象的外在表征,而是对象表达的内在信息。所以說,全文检索技术克服了传统检索技术精度差、适应度差的问题,使得用户每次检索的结果的匹配度都比较高,基本上能满足用户的需求。但是由于全文检索技术内在查询机制的缺陷,导致在查询过程中会出现效率低下,查询的数据量太大,造成资源利用不合理,因而也越来越不能被用户所认可。
3、基于内容的信息检索技术(简称CBR)优缺点分析
CBR技术就是指综合运用计算机模拟视觉技术、图像分析处理技术、图像智能理解技术、模式分析识别等学科中的一些方法作为部分基础技术,从数据中提取特定的信息线索,然后根据这些线索从大量存储在数据库中的信息中进行查找,检索出具有相识特征的内容。从本质来讲,CBR技术只关心对用户检索信息的快速扑捉,并不会在分析用户检索信息的本身上下功夫。
也就是说,作为不以字和具体内容为关注点的检索技术,CBR技术的检索特点就是基于特征的信息检索技术。它能够在用户需求指引下,针对需要检索的数据目标进行分析处理,形成检索目标特征,然后根据这些特征在数据库中进行近似匹配。因而相对于前两种方法来说,检索的效率和精准度更高,更能满足用户的需求。但是,随着人类知识基数的不断增大,专业分工的细化,这种信息检索技术在面对未来信息检索更加精确化的要求时,显得越来越力不从心。
二、大数据技术在数字图书馆信息检索技术中的应用
对于“大数据”(Bigdata),研究机构Gartner给出了这样的定义:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力来适应海量、高增长率和多样化的信息资产。[1]
麦肯锡全球研究所给出的定义是:一种规模大到在获取、存储、管理、分析方面大大超出了传统数据库软件工具能力范围的数据集合,具有海量的数据规模、快速的数据流转、多样的数据类型和价值密度低四大特征。[2]
从本质上来讲,大数据技术的目标不是建立占有人类的知识海,而是面向知识海洋的庞大数据信息进行有目的的处理、利用和管理。显然,大数据技术必然是和网络技术、云计算以及人工智能技术密切相连的集成技术。也就是说,它是一种依靠网络技术、人工智能技术和云计算,利用网络上众多硬件进行信息的高效利用、处理和管理。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。[3]
随着互联网时代的到来,云计算、云存储的不断深入发展,人类的知识越来越被网络连接在一起。那么,如何高效地发现和检索出用户需求的信息,快捷、精确地在知识海中捕获被埋藏的数据,成为一个被关注的焦点。在这种需求之下,多种关于检索技术的研究都在如火如荼地进行之中。随着这些研究的深入进行,研究者们认识到,如果最终能够实现大数据和人工智能技术的完美融合,这将使未来信息检索技术更加智能化,也将使人类对于知识海洋的利用更加充分有效,对知识的管理更加智能化。建立于人工智能基础上的大数据技术的研究,必然带来其它各个学科的变革,从而有力地推动信息检索技术的飞速发展。因而,大数据技术的应用是对数字图书馆信息检索技术的革命性推动,它充分利用人工智能技术,使数字图书馆的信息检索服务更加人性化,检索方式更加智能化,结果更加精确化,查询颗粒更加模糊化。
三、大数据技术对数字图书馆信息检索的影响
为了满足数字图书馆的用户信息检索的多样需求,大数据技术必须也必然会促进信息检索技术的变革,而且这种变革会带来诸多更适应未来信息利用和管理的影响。
1、独特用户化
独特用户化指的是针对用户的信息检索历史,为用户建立独特的检索特征,从而匹配出检索的数据库。这种信息检索的方法主要是立足于对用户历史检索数据库的收集和分析基础上,采用智能化的分析手段,实时为用户量身打造适合其某一阶段需要的检索信息库,并能够随时更新,给用户提供检索建议,从而精准计算用户的检索需求。同时,这种检索技术还需要具备较高的智能化,它能在和用户的交互过程中,不断地分析用户需求的信息目标,并将所有可能的目标按照用户可能关注度的高低实时反馈给用户,供用户取舍,在用户的取舍中不断修正和定位,及时高效地帮助用户发现目标信息,最终实现独特用户化的信息检索。
2、定期更新性
大数据环境下,数字图书馆的数字化信息数量大、种类多,数据价值联系低,处理速度快、效率高,而且数据结构复杂,不仅有结构化的数据、半结构化的数据和非结构化数据,而且非结构化的数据所占的比例越来越大,使信息更新的速度越来越快。[4]因而,为了更好地满足用户的需求,适应图书馆非结构化数据的不断增加,提高图书馆的信息检索效率,必须相应地对信息检索的引擎进行定期优化。
一般来说,定期优化主要指的是,信息检索引擎的技术人员,定期根据信息检索的检索效率和检索出的结果的精准程度进行评价,从而进行改进提高,使用户始终能够在每一次的检索中得到自己期望的结果,满足客户需求。同时,由于非结构数据的比例不断变大,使信息更新的数据飞速增加,如何对这些新增加的数据进行有效管理,是信息检索效率高低的关键所在。因此,信息检索引擎应该根据用户不同的需求和特点,按照对客户需求分析的结果,对全库数据进行分类排队,保证信息检索引擎的检索结果始终能满足用户需求。
3、自我学习性
图书馆的信息检索服务的最终目标就是要准确定位用户的需求,实时完成不同用户的检索方案,快速将匹配的结果按照精准程度的高低排序,让用户能够根据自身需求,选择获取。要达到这一目的,数字图书馆的信息检索引擎要具备自我学习的能力。这种自我学习能力主要指的是信息检索引擎能够根据用户的检索历史,不但能对用户的需求根据分析进行准确预判,还能实时将信息检索的有关信息进行排列和反馈,并对用户检索历史进行分析判断,反馈最适合用户需求的检索信息。同时,信息检索的学习应该是全范围的检索。随着电子化产品的不断发展,对知识的储备不再像以前那样局限于文字或声音,越来越多的图片、视频性信息数据已经进入数字图书馆,也渐渐成为知识储备的主题。作为信息检索技术,就要能满足对这些信息的检索,根据用户的需求,实时高效地完成信息检索任务。当然,信息检索还要能在数据更新过程不断进行改进和提高。数字图书馆中的信息数据在不斷飞速更新,作为信息检索技术来说,要面对越来越庞杂的知识库和多样用户需求的挑战,更要不断改进和完善,使数字图书馆的用户保持较高的满意度,信息检索更加精准、高效。
作者:刘燕
第3篇:浅析信息检索在公安管理中的作用
科學技术的不断成熟一方面极大的推动了社会的进步和发展,但是另一方面许多技术也被不法分子所利用,进行新型的违法犯罪活动,在当下的时代背景下对正常的社会秩序带来了严重的隐患,而作为维护社会稳定的国家行政执法机关,公安机关必须顺应时代发展的形势,积极履行职责和使命。将信息检索技术应用于公安管理之中能够提高公安机关打击违法犯罪活动的能力,而且应用信息检索技术进行公安管理也是保障公安管理工作持续健康发展的内涵要求。由于信息检索技术已经在多个社会领域进行了应用,公安管理应该借鉴相关的经验将信息检索技术更好的与公安管理相结合,以实现信息检索技术在公安管理中作用的最大化。
一、信息检索技术在公安管理中的应用
(一)信息检索在公安信息整合中的应用
由于公安管理涉及较多的信息数据,而且对其管理难度较大,常常需要花费更多的人力、物力去进行所需信息的查询和调取,严重影响了公安机关的办案效率和管理效率。在公安管理中应用信息检索技术,建立一个庞大的数据信息整合平台或者是数据库,然后通过相关技术人员的计算机操作实现对相关公安管理信息的有效管理。随着云计算技术的发展,利用云技术建立起更加强大的数据库成为可能,而且数据的实效性和准确性将更有保证。此外,数据库的建立还能够为公安机关的决策部署提供可靠的信息依据,提高决策的科学性。
(二)信息检索在警察公共关系中的应用
警察公共关系在现代公安管理中具有十分重要的作用,良好的警察公共关系不仅能够迅速发现涉警舆情,而且能够有力的维护和谐的警民关系。基于公安机关在社会管理中的特殊性,应用信息检索技术进行公安管理具有直接的现实意义。因为现代网络技术也已经比较成熟,所以结合网络技术进行信息检索技术的应用能够建立起良好的涉警舆情预警机制,及时的发现和妥善处理涉警舆情,维护公安机关的社会形象和权威。要建立舆情预警机制就应该重点考虑信息收集以及信息分析,可以通过建立起关键词数据库检索应用,实现对涉警舆情的实时监控,这样能够保证公安机关在处置紧急情况时做出及时而准确的反应。
(三)信息检索在科研及文秘工作中的应用
信息检索技术还能够应用在公安科研之中,由于现在的犯罪手段更加智能化和网络化,如果公安机关的相关破案手段跟不上时代发展的要求,必然会影响到公安机关在维护社会稳定中的积极作用。加强公安科研是解决这一问题的重要途径,而应用信息检索技术,建立大数据平台能够帮助公安局科研人员找到科研突破口,在对数据信息分析的过程中不断提高科研实力,从而更好的为公安管理服务。
由于公安管理还涉及到公安的文秘工作,这项工作在公安管理中也具有举足轻重的作用。公安文秘人员的日常工作就是为公安机关的领导处理繁杂的工作事物,在这个过程中工作人员会接触到大量的数据信息,如何能够更好的利用这些信息,以及那些信息能够帮助领导做出正确决策等等问题,都需要文秘人员进行认真的鉴别和妥善处理。这常常需要花费大量的时间和精力,且一旦出现疏忽就会产生严重的后果。应用信息检索技术,将日常事务通过计算机技术传输至数据处理平台,经过处理之后再进行文秘工作就能大大提高工作效率,而且也促进了公安管理的信息化建设。
二、信息检索技术的优势和作用
信息检索技术是一种基于现代信息技术手段和一定的逻辑组织方式建立起来的帮助用户进行数据管理和实现数据分析的过程和技术。从目前信息检索技术的应用来看其作用主要体现在以下两方面:
(一)能够获取更加全面的数据信息
信息检索技术的应用主要是依靠数据库的建立和运行,在信息检索的后台常常是由多个数据库进行整个技术运行和支撑,在不同的数据库中存储了大量的数据信息,其本身能够容纳庞大的信息量,用户通过相应的技术操作能够快捷的检索出相应的信息,以此进行相应的决策。随着信息时代的到来和发展,掌握一定规模的有效数据信息是做好各项工作的基础和前提,信息检索技术能够很好地实现这一点。
(二)能够快捷的获取信息以及提高信息的应用效率
信息技术能够全面的将搜集起来的数据信息呈现给用户,首先一点就是帮助用户节省了信息获取的时间,另外就是能够保证信息数据的准确性。另外,由于信息检索技术已经在内部对庞杂的数据信息实现了一定逻辑序列的整合,因此用户能够实现对所需信息的快速检索和有效信息的筛选工作,这就大大提高了信息的利用率。
总之,信息检索技术能够通过对庞杂信息的逻辑处理,为用户提供更加全面、更加准确的数据信息,帮助用户依据这些客观真实的信息进行正确的决策。
三、信息检索在公安管理中的作用
公安管理是社会管理的重要组成部分,是通过对公安机关以及警务人员的有效组织和管理从而实现公安机关在维护社会秩序以及履行相关行政职责的顺利开展,最大化的发挥其在社会管理中的作用。在公安管理中应用信息检索技术是实现公安管理信息化、智能化的必然选择,也是在新形势下提高公安管理水平的正确尝试。笔者结合从业经验在查阅相关文献资料的基础上对信息检索技术应用于公安管理的作用与价值进行如下分析。
(一)最大限度的解决公安管理中面临的信息处理问题
随着网络时代的到来和发展,各种信息更加繁多,而作为公安机关又必须对诸多信息实现完全的掌握,只有掌握了社会各方面的信息资料才能够在面对违法问题和进行社会秩序维护时做到及时妥善的处理,才能从根本上维护公安机关在社会管理中的权威形象,也才能切实的维护广大人民群众的核心利益。传统的公安管理中对于数据信息的管理常常依靠人力进行解决,不仅花费了大量的人力成本,而且严重影响了办事效率,甚至直接影响公安机关的案件侦查,另外由于依靠人力进行数据信息的检索,无法保证信息的准确性。而信息检索技术的应用能够很好的解决这一问题,通过基础数据库的建立,在信息处理技术的支持下,为相关人员进行数据信息的查询和调取提供便利,最大限度的解决公安机关在处理庞杂数据信息上的困境。
(二)提高公安机关决策的科学性
信息检索技术能够实现对复杂信息的搜集和整合处理,这也是信息检索技术的核心所在。公安机关在进行决策的过程中需要依据一定的数据信息进行决策的开展,也就是说,在进行决策时需要对已经掌握的数据信息进行综合的归纳分析,并依据分析结论进行相关决策的做出和实施。信息检索技术能够最大限度的收集到各种社会信息,并且通过技术手段实现对这些数据信息的加工处理,自动化的得出相应的分析结论,直接的提供给用户进行决策。信息检索技术最核心的部分就是数据库的建立,工作人员能够通过对数据库的主要信息检索搜集有用的信息进行再处理,从而确保了信息的准确性,数据的准确性直接影响到决策的准确性,公安机关能够根据这些准确的数据信息进行正确决策的制定和实施,提高了公安管理的效率和针对性。
(三)能够帮助公安机关迅速发现涉警舆情
鉴于目前我国正处于社会大变革的历史发展阶段,社会改革进入深水期,各种社会矛盾日益尖锐,这就要求公安机关能够更好的发挥维护社会稳定的职责。事实上广大的警务人员以及各级公安管理部门在党的正确领导下正在进行积极的管理工作,对社会稳定的维护起到了良好的作用。但是由于公安管理的特殊性,对于一些涉及公安机关或者警务人员的负面消息如果不及时的进行发现和处理,就很容易演变成涉警舆情,严重时直接影响到公安机关在维护社会稳定中的权威形象,影响社会秩序的正常运转。所以公安机关必须建立起及时的涉警舆情预警机制,通过将网络技术和信息技术的结合,实现对涉警舆情的实时监控和掌握,同时能够帮助公安机关建立完善的应急预案,在面对突发状况时能够进行及时的处理。涉警关键词检索应用能够通过对社会涉警舆情的实时监控,在出现问题时能够及时的发出预警,帮助公安机关及时的化解隐患。
四、结语
随着科学技术的不断发展以及社会的进步,公安管理在社会管理中的作用日益凸显,在新形势下实现公安管理水平的提高具有十分积极的现实意义。而信息检索技术能够解决当前公安机关在处理复杂信息中的困境、帮助公安机关进行正确决策的制定以及对于涉警舆情的及时发现也具有积极作用,所以在公安管理中应用信息检索技术是十分必要的。尽管当前信息检索技术在公安管理中的应用技术还不是十分成熟,但是我们也应该看到相关的技术人员以及管理部门正在进行积极的探索和应用,因此,笔者希望更多的专业人士能投入到该课题研究中,针对文中存在的不足,提出指正建议,为提高信息检索技术在我国公安管理中的应用做出重要的贡献。
作者:王朱珊
第4篇:慕课背景下信息检索课程教学探讨
信息检索课是一门注重实践、操作性很强的课程,课程中设置的操作、演示环节较多,特别适合学生利用网络环境,反复观摩视频资料进行自主学习。而信息检索课要求学生利用文献来解决特定信息问题的教学思路也与MOOC的特点非常契合。MOOC教学中教师会将课程资料(课件、视频、问题等)放在教学平台上,供学生预习,学生带着问题学习,课堂上侧重学习分享、问题探讨和创新思考。
一、基于MOOC环境的校内信息检索课建设的可行性
1.个性化平台建设
除了利用国内外优秀的MOOC教学平台外,不少学校也独立建立了网络在线教学平台。平台分为教学管理(教师管理、学生管理、课表管理、考试管理、作业管理等)、课程内容管理课程编辑、课程学习进度管理)、教学互动(师生互动、学生之间、PBL教学)等功能模块。因此,MOOC不仅仅可以是名师名校开设的大规模网络公开课,其教学理念也可以延伸到校内信息检索课的日常课堂教学。
2.课程设计的可行性
基于MOOC环境的校内信息检索课建设,可以借鉴网络上现有的信息检索课MOOC的教学思路。如可以学习和借鉴中科大罗昭锋老师的“文献管理与信息分析”和武汉大学黄如花教授的“信息检索”MOOC。近两年石河子大学图书馆校内信息检索MOOC的实践和取得的成效,也给了我很大启迪。把传统的课堂教学与网络MOOC的精髓进行深度融合,通过翻转课堂的形式进行呈现,是校园信息检索课的设计思路。在课程设计时,不能盲目模仿,还必须保持本校的信息检索教学特色,满足本校学生的个性化需求。
二、基于MOOC环境下的本校信息检索课
1.教学内容安排
课程进度分四阶段进行,第一,课程引导,由教师向学生介绍课程内容、教学方法、课程安排、教学平台的使用方法及考核要求等。第二,理论知识学习阶段。以网络课程自学为主,面授教学为辅,教师在平台上发布教学课件、视频、学习要求等。学生通过阅读教材和观看课件、视频进行自学。第三,检索实习阶段,安排五次实习,教师指导学生联机实际操作,学生结合所学的专业及课程选择检索课题,完成实习作业与撰写文献综述。第四,联机考试阶段。统一考试,学生从试题库中随机抽取考题,在规定时间内完成答题。
2.教学思路
在MOOC教学内容设计中,引起注意是设计的关键。MOOC内容设计应注重短小精悍、生动有趣,适合学生“碎片化”学习。因此,就要把完整的教学内容拆分成干个知识点,每一个知识点制作成最多十几分钟的短视频、PPT、动画等来吸引学生,中间穿插问题和小测验,这样可抓住学生的注意力,有利于学生记忆与理解学习内容。建立关联是信息检索课教学的重要环节。把检索知识与日常生活、课程学习、专业学习、考试、考研、毕业论文写作建立关联,同样会激发学生们的学习动机和需求。
3.教学效果
通过课程内容由浅入深的设置和组成学习小组等方式来提升学生信心。教学内容从信息检索基础知识入手,接着介绍图书馆和网络搜索引擎、中文综合型数据库检索、外文综合型数据库检索、专业数据库检索、特种文献检索,最后介绍信息检索的综合应用。遵循由易到难、循序渐进的原则,让学生增加学习信心。同时多安排小组研讨课,鼓励学生按学科专业、课程、专题组成一起学习、交流,让学生感受到学习不再是单独的个体行为,可增加学生们的学习信心。
4.教学方法上的创新
缪静敏等认为,MOOC的兴起为高校教师实施翻转课堂提供了优质的教学资源,间接推动了实践的开展。翻转课堂教学法彻底改变了传统灌输式的课堂教学方式,让教师把更多的精力投入到培养学生自主学习、思考问题和解决问题的能力上,真正做到“授人以鱼,不如授之以渔”的教学实践。
实施慕课教学法,教师需提前布置下次课的学习任务,学生課下完成视频内容的学习、完成相关作业和测试,课堂上,教师不再长篇大论,而是以问题为导向,根据问题进行集中答疑和讲解。如果需要实际操作的内容,教师可在线进行操作演示。在此基础上,教师可引入PBL教学法,即基于问题的学习(Problem-BasedLearning,简称PBL)教学模式。通过提出问题、思考、检索、分析、讨论和交流等活动,学生找到了解决问题的办法,真正做到了知识内化,也大大提高了学生们的课堂学习积极性。
5.师生角色的转变
如何实现从“以教师为中心”到“以学生为中心”的角色转换,是长期以来教学改革的一大难题。基于MOOC环境的校内信息检索课,课堂教学可实施传统与翻转教学的有机结合,让教师和学生有时间去适应,在实践中实现真正的转变。教师不仅要熟练掌握信息检索的知识和技能,还应具备扎实的相关学科能力,并要具备提出问题、解决问题、应用知识的能力,以及具备严密的逻辑思维能力和良好的组织管理能力,善于调动学生学习积极性、调节课堂气氛、控制课堂节奏。因此,MOOC环境下的教师角色不再是单纯的授课者、课堂主宰者,而是引导者、组织者、观察者。教师只有多与同行交流,多听名师名校的课程,多学习课内课外的知识,才能快速接受角色的转变。
6.学生如何转变角色
相对传统课堂的授课方式,MOOC学习完全需要自觉,学与不学、怎么学完全取决于学生自己,如果没有严格的监督机制,学生可能会应付了事,甚至效果比传统的课堂教学更差。因此,如何让学生从被动接受者变成主动学习者,需要严格的考核机制和推动机制。首先,作业、考试、交流必不可少,都与最终成绩挂钩。其次,小组任务要层层分解到每个成员,让学生无路可退。最后,还是要培养和激发学生的学习需求和兴趣,关键点还在于课程设计、教师讲授、多媒体制作都要精良。
三、结论
MOOC的兴起使传统的课堂教学面临着巨大的挑战,但也带来了新的发展机遇。利用校园网络教学平台,把MOOC先进的教学理念和技术引入到传统的信息检索课课堂教学,探索新形势下信息检索课教学改革的新思路和新方法,必将对信息素养教育及图书馆服务带来一系列深刻的变化和影响。
作者:徐慧玲
第5篇:信息检索技能对大学生群体学习能力影响的研究
一、引言
怎样在浩瀚的信息资源中,使用恰当的方法,准确地找到自己想要的信息,并将信息合理地分类、管理,甚至利用信息生产价值,完成这个过程是本科生最基本的素质之一,即信息素养。“选择信息方法与工具,找到自己想要的信息”即是信息检索技能,亦是良好信息素养的必要条件,具备这种技能的人知道需要信息,了解知识构成,积极主动学习,擅长解决问题,寻求正确答案,而大学阶段正是大学生由接受被动式教育向自主性学习进而终身学习的过程,因此具备良好的信息检索技能,是完成这一过程的必要条件。比较当前国内外学者的研究,国内学者对信息检索技能的研究往往置于信息素养框架之内,而国外O’Brien、Korobili等学者对本科生、研究生信息检索能力进行了持续研究,相关研究大多集中在信息检索技能对个体的学习能力与效率影响方面,而对于群体学习能力的影响研究还比较少。当前研究关于群体学习的定义还未达成共识,代表人物是Edmondson,他提出了群体学习行为这一概念,其后续研究又将该定义扩展为采取行动、获得反馈与反思反馈、做出变化的过程。
二、信息检索技能与大学生群体学习能力的关系研究
在当前信息时代,从复杂的网络资源中获取有用的信息或知识,对提升学生的学习能力至关重要,同时信息获取能力也是决定群体学习能力的一个关键因素。在现代信息社会中,成员信息获取能力是一种普遍的掌握能力,尤其以搜索引擎为代表的信息检索技术给成员带来了更便捷广泛的信息搜索途径。相关研究表明搜索引擎获取信息的效率是传统方式的3.5倍。基于此考虑,本研究认为信息检索技能对提升群体学习能力具有重要的作用。通过本研究,希望可以提高群体成员获取学习信息的能力与自主学习能力,以及在没有教师指导的情况下,减少无效学习,培养成员较强的独立思维的能力等。
(一)信息检索技能的测量体系研究
该研究要解决的第一个问题是:信息检索技能包括哪些测量指标以及怎样对其测量?对不同专业与年级的班级群体访谈,收集搜索引擎使用水平数据,建立信息检索技能测量体系,设计具有较高信度与效度的信息检索技能测量量表。
(二)信息检索技能与群体学习能力关系研究
该研究要解决的第二个问题是:信息检索技能怎样影响群体学习能力?主要研究信息检索技能是否影响群体学习能力以及不同水平的信息检索技能是否会对群体学习能力产生不同的影响。根据以前对文献的分析与对实际案例的研究认为,信息检索技能与群体学习能力间的关系均存在调节作用,但调节方向不同。
(三)建立训练信息检索技能提高群体学习能力的方法研究
本研究将在上述研究的基础上,探讨可以通过哪些方法来训练信息检索技能以提高群体学习能力,拟以本校公安管理专业学生为研究应用对象,作为班级群体运作的标杆,为教学提供案例。
三、结束语
本研究以国内警察学院公安管理专业本科生为研究对象,采用基于共同学习体的教学模式,以公安信息管理课程为改革点,让学生主动参与,激发学生的学习兴趣,让学生在共同学习的过程中理解、掌握知识,提高分析问题与解决问题的能力。关于学习共同体的教学思想具有普遍的推广价值,可以应用到许多课程教学中,而且研究方法对于其他教学模式的研究者也具有一定的参考价值。
作者:胡亮
第6篇:中文拼音首字母在标准信息检索中的应用
“信息检索”一词出现于20世纪50年代,来源于人们对图书馆图书信息的参考咨询和文摘索引工作。从19世纪下半叶的手工检索,到20世纪50年代的脱机批量检索及60年代以后的联机检索,发展到90年代以后的网络化联机检索,信息检索成为人们获取知识、丰富生活的重要方式。标准信息作为信息行业的一个分支,在检索方法上也在不断发展变化。
标准题录检索是我国标准信息检索的主要内容,根据输入内容可分为数字、英文字符、中文字符、其他可显示的字符(如“-”)等。例如,检索国家标准《GB/T1.1-2009标准化工作导则第1部分:标准的结构和编写》时,按照标准号检索,需输入数字、英文字符、空格、横线“-”、点“.”;按照标准名称检索,需输入数字、中文字符、空格和冒号“:”。除中文字符外,其他符号或字符都可以直接从键盘上找到并输入,中文字符则需要转换成中文输入法后,再输入拼音找到相应汉字,并且输入的字符数量较多,国标GB/T1.1-2009的中文名称按全拼方式需输入55个英文字符。有没有更直接、更简单的输入方式代替中文输入呢?答案是有。中文拼音首字母是一种代替中文字符进行检索的更好方式。目前,主要的标准综合服务平台还没有使用拼音首字母进行检索,希望拼音首字母能成为今后标准检索的必备方式。
1中文拼音首字母检索原理
我们以最常用的GB2312字符集为例,说明拼音首字母代替中文字符进行检索的原理。GB2312字符集是ASCII字符集的扩展,有一级汉字3755个,按拼音排序,二级汉字3008个,按部首排序,覆盖国内汉字99.75%的使用频率。它采用国标码或者区位码对应一个唯一的汉字或符号,国标码是一个4位十六进制数,区位码是一个4位十进制数。汉字的国标码范围从B0A1到F7FE,如“标准”两个字的国标码分别是B1EA、D7BC。在一级汉字中,找到每个拼音首字母汉字所在的国标码位置,其余汉字与相邻两个拼音首字母汉字的国标码位置进行比较,就能获得该汉字的拼音首字母。一级汉字中,不同拼音首字母的第1个汉字在GB2312字符集中的位置参见表1。二级汉字则需采用国标码位置与首字母一一对应方式查找,因数量较多,本文不再一一列出。
2实现方法及相关技术
使用中文拼音首字母检索標准的具体过程如下:首先在标准题录信息表中添加要检索的中文拼音首字母字段,根据要检索的中文内容确定增加的字段数量,如中文标准名称、中文摘要、起草单位、起草人等都可增加对应的拼音首字母字段。在检索界面中,可以增加独立的拼音首字母输入栏,也可和中文输入栏同时使用而用软件判断输入的是中文还是英文。标准检索软件根据输入的拼音首字母,直接检索对应的拼音首字母字段,找到匹配的标准信息,展现给使用者。
通过获取汉字国标码数值,取得该汉字的拼音首字母。在不同的软件语言中,获取一个汉字的GB2312国标码位置的函数和数值不尽相同,因此,表1中列出了3种数值供参考。如C#编程语言使用short函数获取某个中文字的国标码位置(十进制数值);而powerbuilder编程语言使用asc函数获取单字节字符的国标码位置,汉字是双字节字符,因此要获取2个数值,使用十进制二维数组数值。常用计算机编程软件获取中文国标码的函数参见表2。
以国家标准GB/T1.1-2009为例,检索中文“标准化工作导则”和拼音首字母“BZHGZDZ”信息,采用目前较流行的ACCESS和SQLSERVER作为标准题录信息数据库,安装在同一台计算机上,笔者做了一组对比试验。Stdinfo1_t、Stdinfo2_t、Stdinfo3_t表存放标准题录信息,分别有6万、16万、26万条数据量,有标准号、标准中文名、拼音首字母3个字段。检索标准中文名称和拼音首字母的效率参见表3。
从表3可以看出,在Access和SQLServer数据库中,无论有无索引,检索拼音首字母信息均比检索中文信息的速度快,无索引时,提升的检索效率更高。设无索引的中文检索速度为Va,有索引的为Vb;无索引的拼音首字母检索速度为Vc,有索引的为Vd。无索引且数据量分别为6万、16万、26万时,Access中的提升效率按(Va-Vc)/Vc[×]100%计算,分别为27%、6%、194%;SQLServer中的提升效率按(Vb-Vd)/Vd[×]100%计算,分别为181%、77%、72%。有索引且数据量分别为6万、16万、26万时,Access中的提升效率分别为38%、3%、77%;SQLServer中的提升效率分别为20%、7%、6%。
我国国家标准和行业标准数量已超过20万条,公开声明企业标准数量约20万条,每年动态增加标准数量10多万条,使用拼音首字母检索可以有效提高检索效率。标准题录信息中,起草单位、起草人、标准摘要、公开标准企业名称、企业地址、企业声明等常用中文信息通常没有索引,使用拼音首字母检索的效率更是成倍增加,从而提高网络平台响应速度,减少检索人员等待时间。
3结束语
近年来,标准信息越来越广泛应用于我国社会各行各业,许多专业机构投入巨资建设标准综合服务平台,标准题录信息检索是这些平台的主要服务内容,如何为标准人员提供更快捷、更简便、更全面的检索方式,是平台改进的重要内容。本文提出中文拼音首字母检索,希望能为标准服务业人员抛砖引玉,不断探索进一步完善标准服务方式和丰富标准服务内容,为广大标准从业人员提供更好、更优质的服务。
作者:张广庆等