当前,广东省经济发展已经进入新常态,实现经济可持续健康发展,根本途径是要走创新驱动发展的路子,人才是科技创新的关键,创新型科技人才更是实施创新驱动发展的中坚力量。建立一个结构优化、技术先进、信息完整的创新型科技人才数据库,对于合理使用和配置我省各地科技人才资源,释放科技人才队伍效能,提供科技人才服务水平,智力支撑广东创新发展具有十分重要的意义。
1.广东省科技人才数据库建设现状概况
目前广东省初步形成了政府、高校、院所、科技企业和中介机构等多方参与科技人才信息资源建设的格局。如省科技厅、地市科技局依托科技计划建立了各类项目评审和课题专家信息库;省内各高等学校及科研院所以本单位科研人员为主体的系统内部专家库;还有中介服务公司面向市场的科技人才数据库,如广东科技人才网等。而当中最具代表性、最权威、最全面的科技人才数据库,则是广东省科技厅建设的“广东科技咨询专家库”。这是我们重构“广东省科技人才数据库”的核心资源。
总体看我省科技人才数据库建设存在多种问题:如各单位独立建库,无法全面把握省科技人才信息与发展趋势,不能为科技人才资源的开发和优化配置提供有效支撑;欠缺区域协调联动、行业协调联动、部门协调联动等;各方共享信息程度低,信息资源的开发利用率低等。当中最突出的是各个人才库间缺乏统一的数据标准规范,这对于数据的共享交换产生很大的障碍。
2.“广东省科技人才数据库”建设规划的总体思路和目标
上文我们多次使用了“广东省科技人才数据库”这一名词,在大多数情况下,它只是个泛称,即在广东省内建设的拥有科技人才信息的数据库。它们的名字各异、用途差别、单位不同,唯一的共同点就是都以科技人才为数据采纳的对象或对象之一。但此处要提出的“广东省科技人才数据库”则是一个专称,特指本文规划的面向全省各相关单位及公众使用的和实现科技人才信息采集、管理、使用、开发全链条功能的以及能够代表整个广东省科技人才信息管理水平的科技人才数据库。可以说,这是一个“重构”的数据,即集合我省目前已有的各类科技人才数据库的信息资源和建设基础,重新规划、重新设计的一个更完备、更先进、更开放的科技人才库;也可以说这是我省一个“总的”科技人才数据库,从规模、功能、层次上它是唯一的,它涵括已有各类科技人才数据库的所有信息资源,功能更完备,使用更方便,技术更先进,可完全替代已有的任何一个科技人才数据库。
总体的规划思路是要整合我省现有分布在各系统、各单位、各地市的科技人才库资源,解决其各自为政、重复建设、标准不一、类型单一、共享不足等问题,同时能具有前瞻性、长远性、实用性能支撑我省科技人才服务的未来发展,引领我省在创新发展中引才用才的新方向,这就必须要运用新思维、新技术来构建我省全新的科技人才数据库系统。本文提出要将科技人才数据库的建设纳入电子政务的范畴,同时应用云计算、大数据等技术模式创新科技人才库的建设和运作。革新原有科技人才库的性质和功能,按照“物理分散、逻辑集中”和“资源整合、集约建设”的要求,统筹建设“广东省科技人才数据库”(包括广东省科技人才数据中心和科技人才信息资源共享交换平台),实现各业务应用系统之间、各区域之间、各部门之间、及其3者与统一的协同工作平台之间,与公共数据中心之间的高效链接与信息资源交换。科技人才数据资源库根据实际需求实行“分布与集中”相结合的方式建设,业务性、专业性的数据库实行分布建设,各主体按需要有条件共享,通用性、基础性的数据库则集中建设,各主体共享;充分利用已有的网络基础、业务应用系统、各类资源和信息技术为实现我省科技人才数据库流程再造提供支撑;通过加强信息资源整合与信息公开,实现信息共享、透明与互联互通,提升各部门之间、各业务应用系统、各区域与其他社会主体之间沟通协调的能力,形成网络化协同办公环境,并面向全社会提供科技人才信息共享的电子化服务,实现“大科技咨询”的首要业务功能和全省一盘棋的科技人才信息收集、管理、使用、开发的全链条基础应用。
“广东省科技人才数据库”要实现的主要目标概括如下:
2.1 —个真正涵盖广东所有科技人才信息的数据库
其实目前我省现有的各类科技人才数据库,收录的科技人才基本都是我省各科研单位的高层次科技人才。而“广东省科技人才数据库”要收录的科技人才范围将更大,只要是在广东工作的,进行创新创业相关事业的,或潜在性能引进到广东的科技人才,如省外人才、海外人才等都包括在内。他们或许信息采集的标准不一样,因为如工作单位在广东的科技人才,获取的信息将更为全面,而其他工作单位不在广东而又在广东从事相关事业的科技人才,获取的信息将有所收窄。但“广东省科技人才数据库”必须有这样的“胸怀”,“不为所有,但为所用”,让每一个在广东工作过的科技人才都能以“入库”的形式找到归属感,获得重视,并且能进入我省相关政府部门的“视野”,为广东的自主创新发挥力量。
2.2 一个真正实现“大科技咨询,的科技人才数据库
目前我省大多数科技人才数据库其实是科技专家库,主要功能还是为了政府部门的项目管理做“咨询”,例如立项评审、结题验收的专家遴选等,真正为政府部门相关政策战略制定进行调研、分析、研究、预测比例偏少,而更大层面上为企业、相关组织及社会公众提供智力服务,更是凤毛麟角。“广东省科技人才数据库”就要真正实现以上所有功能,具体来说,它除了包括广东省科技人才数据中心和科技人才信息资源共享交换平台外,还有一个直接面向公众使用的门户网站,以多种业务功能为政府部门及相关管理单位以外的企业、社会公众提供“科技咨询”服务,库内的科技人才能“一对一”的面向公众进行沟通交流。“广东省科技人才数据库”能真正成为广东创新驱动发展的“智囊”和“助推器”,智力支撑我省“大众创新、万众创业”。
2.3 一个真正有数据挖掘价值的科技人才数据库
能做到有数据挖掘价值的前提,“广东省科技人才数据库”必须拥有海量的数据,并且数据持续更新,动态发展。以原有的人才信息收集模式和标准,即使科技人才的入库范围进一步扩大,也谈不上海量的信息。所以重构后的“广东省科技人才数据库”和原有的相关人才数据库模式并不一样,对于每一个入库的科技人才,其相关个人信息和科研信息是动态抓取的,譬如一个专家近期参加了一个什么学术会议,发表了一篇什么学术文章等都可以从互联网上搜集到相关信息,并且进行甄别和清洗,最后更新汇总到他的个人信息当中。甚至引入“社会网络可视化技术”,能清晰地看到他的科技人脉圈子,和谁共同发表了一篇文章,和谁申报了一个科技项目等,所以信息量是十分巨大的,涵盖了一个科技人才成长、发展的全生命周期,这也是数据挖掘的价值所在,能为我省研究人才培养、人才引进、人才流动提供最宏观又最微观的一手数据。
3.“广东省科技人才数据库”的主要技术运行机制
“广东省科技人才数据库”主要由门户网站、公共数据中心、数据交换平台3部分组成。数据中心和数据交换平台是实现我省科技人才数据库跨部门业务协同、跨地方资源共享和一体化协作,实现全省科技人才数据共享使用的业务流程再造基础平台建设的重要组成部分,实现全省科技人才信息统一管理能力现代化的重要物质基础。而门户网站则是一个在统一标准、规范及管理方针下建立起来的信息共建、共用和共享的网群体系,是一个模块统一、功能集成的科技人才数据门户网站。它需要利用云计算技术,以分布式的管理方式建立横向与纵向的数据供应链,横向数据链包括科技系统、教育系统、各社会机构、企业等发布的数据集,纵向数据链包括省直各部门、21个地市系统等发布的数据集。然后通过数据网为用户的数据利用提供有效的集成服务,与此同时有效消除服务方面的“数据孤岛”和重复建设的问题。
所以要建立有效的数据管理机制:一是需要建立全省科技人才数据管理部门,专门负责数据的管理、审查和发布工作。因为数据来源将涉及众多系统和部门的基础及专业数据的公开使用,要由专门的数据主管对数据使用发布进行严格把关,避免数据信息触及保密、安全、个人隐私等法律问题,同时要监控各主体、各部门发布数据的数量和质量,确保数据发布工作的完整执行,满足公众对科技人才数据的使用需求。二是建立有效的数据管理体系。建立一套有效完整的元数据分类体系,整合数据网上RSS、CSV、Test、XLS、KML、KMZ等多种格式的数据,开发多元的检索工具与应用程序,提升用户查找利用数据的效率,通过强大高效的数据分析技术发挥“大数据”的效能。三是确保数据发布的质量。数据分析技术再强大,没有高质量开放数据也是枉然,要对大数据进行有效分析,提取其隐含的“准确的”“有用的”信息,就必须在数据管理的整个生命周期都要把好质量关,保证数据的准确、完整、有效,才能让其产生价值。
从总体上说,“广东省科技人才数据库”的建设涉及多部门、多区域,所以需要建立跨部门的统筹协调机制,在技术实施过程中要推动信息共享标准的使用;要推动跨部门跨系统标准认证和保持一致性;要提升数据、服务和网络的互操作性;而最重要的是要推动服务共享。因为在电子政务环境下,广东省科技人才数据库的搭建必须使用共享计算模型——“云计算”。在这种模型中,数据中心是统一的,计算机基础设施被用于提供共享服务。通用基础设施上的主机系统和应用、分配了工作负担,减低了对计算性能的要求,减少了总成本。将来,除了共享计算能力以外,可能会通过提供其他能力带来额外的改进,例如共享应用和共享信息服务。因此,各部门和机构可以继续使用现有性能,将目光关注于服务和技术的开发上,来更好地满足部门职能。性能共享将使部门和机构为特定的终端用户提供有针对性的服务,而不是为所有用户尝试性的提供所需的全部性能。这一方法的预期优势包括简化成本、提高效率,以及减少个性化的界面和所需标准的数量。
作者:邓媚(广东省科技人才服务中心,广东广州 510070)