摘要:[目的/意义]随着信息社会的发展,科技情报感知技术在新时代国家科技情报治理工作中扮演着越来越重要的角色,如何准确、高效、智能地进行情报工作是当前亟待解决的关键议题。[方法/过程]人工智能技术在21世纪初期掀起了技术革命的浪潮,并迅速渗透到生产、生活的方方面面,基于此文章在吸收借鉴传统情报感知技术的研究方法下,提出了基于人工智能的科技情报需求自动感知研究方法,并分模块提出了实现方案。[结果/结论]21世纪的科技情报感知工作需要适应瞬时变化的信息时代,也需要赶上科学技术发展的脚步,逐步实现科技情报工作的高效化、智能化、智慧化,因此基于人工智能的科技情报需求自动感知过程在未来会成为科技情报工作发展的潮流。
关键词:科技情报;情报感知;人工智能;情境感知;情报感知框架
长久以来,外界对于情报工作一直持有这样的观点,即:情报工作的唯一功能是支撑决策,但是对于情报研究人员来说这个说法具有片面性,不能准确表述情报工作的工作性质,情报工作所扮演的角色并不只是支撑决策,作为情报工作的核心环节,情报感知也应该得到注重。十九大以来,我国进入了社会主义新时代,进入新时代后的科技情报工作使命是为科技创新和科学决策服务,为了适应知识大爆炸与大数据时代,国家已经开始重视并革新科技情报工作,科技情报感知功能已经获得了情报界的重视。
科技情报资源是一个国家重要的战略资源和知识财富。科技情报工作的时代重点是由不同时代背景下情报的属性特点及其发展变化来决定的,只有充分认识并把握新形势下情报属性特征的变化及由其决定的科技情报工作的目标定位、核心及时代工作重点,才能更好地开展新时期的科技情报工作[1]。新时代国家科技情报工作的核心任务是服务于国家发展战略的制定,国家战略的制定需要进行详细的调研、缜密的分析、严谨的决策,国家科技情报工作的重要环节是对科技情报的感知、刻画和响应,这一环节发生在决策制定之前,在很大程度上对决策的导向有一个清晰的把握,科技情报需求感知能力水平是国家战略成功与否的关键性因素,为了完善国家科技情报治理,实现“国家大数据战略”计划[2],情报感知研究也注定要成为国家科技情报工作革新的关键点。目前,人工智能技术已经渗透到生产、生活的方方面面,人工智能发展火热,并将在未来情报工作领域发挥重要作用,本文就如何将人工智能技术运用到科技情报感知过程进行可行性的分析,希望通过人工智能技术有效提高科技情报感知的服务水平,推动情报工作精准、智能、高效地发展。
目前对于情报感知过程的研究还没有达到完善的水平,如今还存在着以下挑战:
1)内容感知系统与情境感知系统相互独立工作。在科技情报感知过程中,内容感知系统与情境感知系统两部分相对独立,内容感知系统由各类数据集、情报感知数据库以及情报人员知识储备数据库等组成。赵柯然把情报感知定义为是在相关数据基础上结合特定情境对事物发展态势做出的理解、预判和应对,她提出情境感知系统则是由用户背景、地理环境以及周边资源等情境因素构成[3]。当前对于情报感知的研究都是将内容感知与情境感知作为独立系统分别进行分析,国内外从事情报感知研究的学者们尚未提出过两部分系统之间的相互感知关系。本文认为,外部的情境因素会对内容感知系统的数据收集、整理、分析、融合以及外部信息源的流入等环节都有一定的影响,如果在今后的科学研究中将这一重要影响条件加以考虑,会使科技情报感知工作更加严谨、可靠甚至更具有权威性。
2)缺少完整的科技情报感知框架。通过翻阅国内外学者关于情报感知方面的科研成果,笔者发现,目前,情报感知技术还没有得到国内外学者的广泛关注,一些学者对于情报感知过程的研究只是抽取情报感知过程的某个角度进行详细的探讨分析,虽然分析结果独到全面,也提出了具有建设性意义的命题,但是却缺乏一个完整的研究框架。本文认为对于某项研究过程的探究,缺少了完整的体系框架,就相当于失去了各系统模块间联系的地图,所以一个有效合理的研究框架会起到事半功倍的效果,如果能够构建起一个完整的科技情报感知框架,那么对于科技情报感知的研究就会变得规范化、合理化和系统化,情报研究人员在框架的基础上进行研究也会更加得心应手,基于完整的科技情报感知系统框架的研究也往往会挖掘出更深层次的价值。
1相关研究
1.1人工智能技术
人工智能(简称AI),早在20世纪50年代,香农、麦卡锡、明斯基等10位科学家在一次头脑风暴式的研讨会上就曾提出过人工智能的设想[4],后来人工智能的发展几经沉浮,随着核心算法的改进,计算速度的突破,以及海量数据的支撑,人工智能技术在21世纪初期掀起了技术革命的浪潮[5]。最近几年,国家全面实施战略性新兴产业发展规划,加快人工智能等技术研发和转化,国家政策支撑人工智能获得迅速的发展并取得了丰硕的成果[6]。
根据高德纳公司最近发布的《2018人工智能技术成熟度曲线》显示,目前人工智能技术在自然语言处理、深度神经网络、机器学习等十几项技术方面的发展已经近乎于成熟,并且人工智能的发展已经呈现出一种扶摇直上的趋势[7];麦肯锡公司发布的《失去与被创造的工作:自动化时代的劳动力转换》指出,到2030年,在未考虑到人工智能技术的条件下中国将会有16%~31%的劳动力被自动化取代[8];人工智能技术正在以一种不可抵挡的气势强势入驻人类的生产生活中,张晓林指出目前基于大数据和机器学习的对未知知识的发现正成为研究与实践的热点,人工智能技术正在推动学术领域对于知识发现的重新定义[9];Minsky等认为人工智能技术能够实现个性定制任务,它可以根据不同情境下个体的特定需求,制定问题的解决方案,为用户提供帮助,实现用户需求[10]。
目前人工智能科技下的前沿科技产品正如雨后春笋般涌现,在围棋人机大战中取得胜利的AlphaGo,基于语音识别技术的人工智能虚拟助理,迅速成熟地可以进行复杂医疗手术的智能医用机器人,甚至医生可以通过计算机视觉技术对医疗影像进行快速读片和智能诊断[11],以及适用于智慧城市、智能交通、智慧物联、智慧小区、智慧监控、环境监测等应用场景,集各种数据的采集、运算、监控、反馈、控制等功能于一体的“航天智芯2.0”[12]。
图书情报学科也积极投身于智能化技术革命的浪潮中,王世伟提出智慧图书馆是未来图书馆发展的新模式,在智能技术支持下图书馆能够无所不在、无时不在地实现书书相联、书人相联、人人相联[13]。梁玉芳等认为人工智能技术可以帮助图书馆更好地实现价值和目标,促进图书馆服务的提升,虽然现阶段还存在一些问题,但是图书馆应用人工智能技术一定是未来图书馆发展的新趋势[14]。柳益君等提出了人工智能+图书馆的知识服务创新模式体系,旨在智能化和智慧化的知识服务[15]。数字化、网络化和智能化是智慧图书馆的技术基础,将使图书馆在不久的将来真正迈向可持续发展之路。
通过上文的描述可知,人工智能技术可以高效地处理海量数据,当人类的智力无法达到情报分析工作大量严苛的要求时,有必要采用先进的人工智能技术实现人类不能完成的复杂处理工作[16],而科技情报感知是一个基于多源数据分析的并对未来科技走向提供预测的综合过程,基于此,本文提出了基于人工智能的科技情报需求自动感知研究方法,人工智能技术的应用为科技情报自动感知过程的建立奠定了技术基础,使得科技情报工作真正向智慧型发展,体现出情报服务工作的精准化、个性化、主动性。
1.2情报感知
科技情报感知过程,即情报工作人员通过对收集到的数据进行分析处理以满足用户当前对于科技情报的迫切需求并对未来的发展做出可靠的预测的过程[17]。近几年来,国内外的学者相继从不同角度对情报感知过程进行了研究与探讨。王延飞等提出国家科技情报治理研究强调重视情报工作在情报感知、情报刻画和情报响应等方面的特殊要求,追求营造健康、可持续的科技情报生态环境[18]。刘记等提出以情报感知为核心任务抓手的科技情报治理现代化实现途径,为实现我国参与全球治理、推进治理体系与治理能力现代化的目标,更加需要倡导情报感知、情报刻画和情报响应的关键能力建设[19]。
情境感知研究是一个古老而丰富的研究领域,相关研究人员基于这个主题进行了深入的思考,并且构建了几个情境感知应用程序来证明这种新技术的有用性,但是该项应用程序从未被日常用户广泛使用。G.Chen为了更好地理解情境意识,对该领域的文献进行了调查,通过对情境类型、情境信息模型、情境信息收集和传播系统,以及适应不断变化的情境感知应用程序进行了深入调查,他发现目前对于准确发现情境信息,有效传播情境信息以及充分利用情境信息等方面的研究仍处于萌芽阶段,但是他仍旧认为情境感知作为普适计算的内在属性是构成普适学习的关键技术[20]。
一些学者在总结尚未在图书馆中使用但适用于下一代数字图书馆的尖端信息技术中提出,情境感知可以确认为下一代图书馆的特征,情境感知技术可以作为解释图书馆4.0的关键词[21]。W.Hu等提出应用情境感知技术的下一代数字图书馆可以为用户提供更好的服务,基于情境感知技术的图书馆可以为读者提供量身定制的服务,系统可以通过检测用户的行为、移动路径和体温等为用户提供适当的温度、湿度和照明的控制以及紧急援助等服务[22]。
通过以上各位学者对情报感知的相关研究,笔者发现情报感知技术在国家科技情报治理、不同情境预先感知等方面都有很成功的应用,回顾历史、着眼现在、面向未来,基于情报感知的研究正逐步在业务与学术活动中引起业界和学界同仁的关注与思考,所以情报感知技术注定会成为未来图书情报领域适应高新科技发展潮流趋势的标签。
1.3对于提出基于人工智能的科技情报需求自动感知研究的思考
从上文的讨论中可以看出,人工智能技术是人类社会未来发展进程中不可或缺的颠覆性技术,而情报感知研究是目前情报工作的核心关切,是未来情报学术创新探索的有力保障,将两者结合到一起进行科技情报工作的探究,主要有以下两点思考:
一是创新驱动,新时期科技情报需求向科技创新情报需求转变,在国家实施创新驱动发展战略的大背景下,这些围绕着科学技术自身发展的情报工作也需要发生创新转变,所以将科学技术发展的产物应用到科技到情报工作中去便是一种大胆的创新举措,人工智能技术使得科技情报工作真正向智慧型发展,体现出情报服务工作的精准化、个性化、创新化,在科技情报自动感知过程中应用人工智能技术既是情报工作领域内的一个创新之举,又是一条现代科技发展的必由之路。
二是前瞻定位,随着信息资源数字化网络化的发展,科技情报研究所用的信息资源也开始呈现出一些大数据的特征,基于海量数据开展的情报研究与分析正在获得越来越多的重视[23]。传统的研究方法往往难以在大规模数据的基础上确保情报研究成果的质量,而且情报研究人员自身也会感觉任务很重工作量大,吴晨生等提出在传统的情报感知过程中,情报人员的情报敏感度、知识结构、知识状态等个体差异会导致各自生产的情报结果相异,甚至对立[24]。所以在科技情报自动感知过程中应用人工智能技术可以确保情报工作高效、准确、稳定地进行。
根据上文所述,将传统的信息服务和情报工作与新兴的人工智能技术相结合是现代情报学发展的大趋势,目前在这方面的研究已经取得了一些成果,例如文本信息的自动化、情报自动采集和加工技术、基于大数据的人工智能决策系统、以语义内容分析为基础的科研成果评价等[25],所以基于人工智能的科技情报需求自动感知技术是具有可行性的,会在打破传统科技情报工作模式下为情报工作注入“新鲜血液”,为学科引进值得期待的新思路、新理念。
2基于人工智能的科技情报需求自动感知过程体系构建
本文提出的基于人工智能技术的科技情报感知过程的实现思路见图1,整个体系模型可以分成三大模块,下面给出详细的描述与实现方案。
2.1模块1:内容感知系统
在大数据时代条件下,科技情报“尖兵”“耳目”的作用越来越得到各方的关注,科技情报是科技情报工作者基于对科技领域最新研究进展、趋势、竞争合作关系等信息做出的有价值的判断[26]。科技情报感知过程的实现需要有广泛、可靠且丰富的科技情报数据作为支撑,进入互联网+大数据时代后信息的获取愈发容易,在杂乱无章的各类科技情报资料中提取出有用数据与信息是科技情报感知过程重要的准备环节[27]。内容感知系统是一个各类数据与信息的集合。科技情报的来源包括:各类期刊、学位论文、中文专利、产品信息、标准信息等多种来源。数据源具有形式多样、冗余度高和存储量大等特点,所以为了准确高效地执行科技情报感知过程,需要对搜集到的数据源进行筛选,去除冗余信息,留下有效信息,最终以数据集的形式同情报感知数据库、情报知识储备库等相关的数据库一道作为科技情报感知过程的事实依据。
内容感知系统的数据源并不是一成不变的,当前正处于一个快节奏的信息时代,每天都有大量的信息扑面而来[28]。此前我们经常会说:“每天叫醒我们的是梦想”,但现在我们完全可以理直气壮地说“每天唤醒我们的是信息”,足以见得信息的数量与更新速度是我们远不能想象到的,而且科学技术的淘汰时限也被压缩的越来越短[29],所以内容感知系统一定是一个动态变化的、实时更新的同步数据系统。此外,内容感知系统还附有一个辅助项目,即生成科技情报产品报告,这份产品报告相当于科技情报感知系统的“说明书”,产品报告的使用者主要针对于用户,用户可以通过阅读产品报告对情报感知系统进行预先了解,对科技情报感知系统的工作能力进行预先评估,进而提出自己的情报需求。
2.2内容感知系统实现方案
第一步:数据源的存储。为实现科技情报自动感知功能,内容感知系统需要容纳大量数据集合作为情报感知产品分析基础,但是在处理大量数据时会在数据存储和搜索信息性能上遇到瓶颈。为了克服这些挑战,本文提出了一个基于Neo4j图数据库的领域本体过程,在高速发展的互联网应用中,业务需求的频繁变更和数据的快速增长都要求数据库必须具有很强的适应能力。Neo4j图数据库正是一个能够适应这种业务需求不断变化和大规模数据增长而产生的数据库,它不但具有很强的适应能力,而且能够自始至终保持高效的查询性能[30]。Neo4j支持两种应用模式,分别是内嵌模式和服务器模式。本文选择内嵌模式,在内嵌应用程序的应用模式下,应用程序直接使用Neo4j数据库通过Java-API直接与图模型交互,API提供了非常灵活的数据结构。通俗地说就是通过直接编码的方式与Neo4j图数据库交互[31]。
第二步:数据源的自动分类。为实现大规模数据源的自动分类功能,首先需要对数据源进行功能结构识别。本文提出借鉴陆伟等的研究方法,利用词汇特征和机器学习的方法对数据源的功能结构自动分类[32],基于数据源的类型词汇特征、数据源要素分布及词汇特征,结合神经网络分类器训练的方法,实现对数据源按照领域专题、产业技术、产业专题、情报报告、机构数据库等类别的自动分类。
第三步:目标任务抽取模型。为了高效地实现科技情报自动感知功能,需要对分类后的数据源实现基于用户要求的目标任务抽取。该模型是对RNN(循环神经网络)的改善,在处理过程中,采用卷积和Bi-LSTM-CRF循环神经网络模型对分类后的数据源进行抽取,Bi-LSTM(双向长短时记忆模型)能有效地解决RNN中梯度消失和梯度爆炸问题[33],模型以词向量、句子特征向量和知识元素特征向量的卷积作为输入,输出层结合CRF(条件随机场)获取到全局优序列标注预测[34]。该模型将基于目标任务的分类数据源抽取表示成多元组的形式,对数据源中主体、对象、事项、性质和依据等元素进行表示与链接[35]。
2.3模块2:情境感知系统
情境感知系统由各种情境因素构成,科技情报感知过程需要结合一定的情境,情境内容会对感知结果产生一些具有针对性的影响,在情境条件的加持下感知结果会更加贴合用户的需求,不同的用户适配不同的情境内容,所以每次进行科技情报感知时都需要针对指定用户进行重新评估。情境感知系统在整个情报感知过程中具有举足轻重的作用,有时一些科技情报感知结果的产生就会因为忽视外部情境而出现严重的偏差,使科技情报工作缺失了最重要的准确性特征,相反,善于结合外部情境,就可以更加准确地掌握事态的方向,得出更加贴切的感知结果,更好地发挥情报工作的前瞻作用。
2.4情境感知系统实现方案
情境感知系统的设计使命就是采用科学的方法和手段采集特定情境下的数据,并将这些数据进行有效的融合。情境感知计算由Schilit等于1994年最先提出[36],随着科学技术的不断发展,情境感知技术的研究也不断进步,情境感知的应用使用现有技术,利用情境信息,智能判断用户日常行为及目的。情境感知技术源于泛在计算的研究。简单来说就是通过传感器及其相关的技术使计算机设备能够“感知”到当前的情境,并相应地调整它们的行为,是以无干扰的方式为智能决策支持识别和应用感知的关键技术[37]。
由情境感知的定义可知,一个完整的情境感知系统包含情境提供、情境处理以及应用服务三部分。所以本文提出的适用于科技情报感知过程的情境感知系统见图2,通过传感器进行情境信息的提取,传感器终端获取到相关信息,同时将这些信息转换为数字信号,数字信号通过嵌入式系统进行处理和判断[38];对提取到的情境感知信息进行有效的组合并协调执行,将计算资源分布并且嵌入到情境感知数据库中,方便AI代理根据用户需求获得合理服务。
2.5模块3:需求/反馈机制
需求/反馈机制主要是用来刻画人工智能与用户之间的互动关系,作为科技情报感知过程的核心部分,整个科技情报自动感知过程数据、信息、产品的流动几乎都发生在这一环节,这一环节的核心技术是人工智能技术,创新举措在于引入了AI代理代替了繁琐的人类劳动,AI代理可以智能化地处理多项事务,例如:教育、医疗健康、金融、自驾、安防、个人助理,等等,引入人工智能技术后的科技情报感知过程可以高效、准确、及时地进行情报工作,避免人工的消耗,降低决策制定的偶然性,提高数据分析处理效率。用户是整个科技情报感知过程的主角,用户把自身当前的科技情报产品需求传递给AI代理,AI根据用户需求对来自内、外部感知数据库的数据进行分析整合,整个数据感知环节全部经由AI代理来完成,用户所需要的情报产品也通过其反馈给用户。情报感知产品是AI代理在完成用户需求后,根据用户的产品需求情况,综合外部感知数据库等多方面条件因素,对用户未来的科技情报产品需求而做出的一个预测,情报感知产品会在后续时刻推送给用户,方便用户更好地把握科技情报工作未来发展趋势,推动科技情报工作的可持续发展。
基于人工智能的科技情报感知过程实现了科技情报需求自动感知功能,传统的情报感知过程多是依赖于情报人员的决策能力,需要情报人员主动地综合运用各种数据分析处理方法进行评估后得出情报感知结果,这个过程是在完成用户需求后进行的后续的处理过程,而人工智能的运用使得科技情报感知过程变成了一个自动生成情报感知产品并将其推送反馈给用户的过程,变原来的主动为自发,更加适应情报3.0时代的需求,推进我国科技创新和科学决策服务发展。
3总结
传统的科技情报工作正面临着诸多的挑战,科技情报工作的进行不应该单单为了满足用户对于情报产品的需求,随着社会的发展,情报工作需要打破传统的科技情报工作模式,将具有新时代特色的情报工作逐步引入大众的视线范围内。科技情报感知作为情报工作专业化、特色化服务有必要得到广泛的关注。2017年国务院印发了关于新一代人工智能发展规划的通知,通知将立足国家发展全局,准确把握全球人工智能发展态势,找准突破口和主攻方向,全面增强科技创新基础能力,全面拓展重点领域应用深度广度,全面提升经济社会发展和国防应用智能化水平作为当前人工智能发展的重要任务[39]。现如今人工智能越来越多地应用于各个学科领域,而且取得了不同凡响的效果,所以情报感知会成为今后情报工作的特色服务,基于人工智能的科技情报需求自动感知过程会是未来情报工作发展的大趋势。