信息安全已上升至国家战略。面对我国高端服务器市场长期被IBM、HP等国外企业垄断的局面,国家设立“(863计划)高端容错计算机”重大研制项目。中国建设银行申报并承担了其中的“国产高端容错计算机金融行业应用示范项目”。其目标是在我国成功研制达到同期国际先进水平的高端容错计算机产品的基础上,将建设银行的一类关键业务系统移植切换到国产主机上,接管原进口主机在线生产运营。
经过两年多努力,建行选择省级分行“区域业务综合处理系统”作为应用示范系统进行移植,实现了首个金融行业关键性业务系统在首台国产高端服务器上的生产运行,填补了国内空白,并通过成功试点在金融领域产生重大示范效应。
启用首台国产高端服务器
建行“国产高端容错计算机金融行业应用示范项目”启用了国内首台32路高端服务器——“浪潮天梭K1系统”,该服务器采用先进大型紧耦合共享内存计算机系统体系结构进行设计和研制,主要成果包括:双翼可扩展的64路高端服务器体系结构;支持两级目录Cache一致性协议的NC处理器协同芯片,以及高阶16端口高带宽低延迟的NR系统高速互连芯片;软硬件结合的多级容错体系;全球第五个、国内唯一通过UNIX 03认证的UNIX操作系统等。服务器的峰值定点、浮点计算能力等技术指标也达到同期国际先进水平。
为体现项目价值,建行选择在K1系统上进行“区域业务综合处理平台”的应用移植和整合。区域业务综合处理平台是建行省级分行的核心应用系统,具有银行应用系统的典型特征。在体系架构方面属于典型的星形架构,系统上连总行核心系统,下接网点、自助设备等交易渠道,横向和合作企业互联,是分行的交易中枢。在业务类型方面,系统所承载的各类代收代付,代理财政、社保、住房、IC卡等中间业务属于银行的典型业务。在IT产品方面,系统使用的进口服务器、基础软硬件产品,在银行业作为主流被广泛应用。在系统规模方面,试点分行的交易量可达30万笔/日,代表了大型商业银行分支机构或中小型银行同类系统的平均交易水平。在连续性服务方面,平台为客户提供多渠道、7×24小时不间断服务,对系统可用性要求极高。
跋涉技术变更“深水区”
当时K1系统还只是实验室产品,建行直接将其进行生产性应用,风险是未知的。而且,此前建设银行的软件开发项目,大都基于进口服务器的成熟系统进行开发,而这次面对的是一台没有应用过的“裸机”,除完成跨平台应用移植的艰巨任务外,还要完成系统环境的整体迁移,其困难难以想象。最终,建设银行通过科学的方法指导和丰富的应用经验积累,应对各种挑战,实现了突破。
■软硬件兼容性及主机系统测试
“区域业务综合处理平台”囊括了银行典型业务系统运行所需的整体系统环境,需要配套硬件系统、基础系统软件、外围设备、运维管理软件及应用系统本身相互协同才能有效运行。在国产主机没有生态环境,缺少厂商、专业机构测试认证的情况下,建设银行通过大量的测试验证了各种复杂条件下,软硬件产品在国产主机上的可用性。
在外围设备等基础硬件兼容性测试方面,针对系统涉及的IBM、EMC、HP、Symantec等十几类产品,设计并行验证的测试方案。分别在进口主机、K1系统上进行相同案例测试,对比分析结果、快速定位,针对磁盘柜驱动、MPIO故障、多路径切换、部分USB设备接入等问题,积极与厂商沟通,通过服务器体系优化、设备模块升级、使用替代方案等方法解决问题,确保了主机系统、外围设备的整体可用。
■跨平台的应用移植
“区域业务综合处理平台”是使用C/C++语言开发的,异构平台在处理器等硬件平台、共享库、系统库、API等操作系统特性,以及不同的编译环境等方面存在的差异性,为两阶段的应用整合和跨平台移植,带来极大的工作量和难度。
在应用整合和平台搭建方面,采用面向服务(SOA)的设计理念,基于K1系统构建开发平台,系统内部提供基于消息驱动(EDA)的方式协调各组件运行。在统一数据模型的基础上,支持多种通讯协议、数据格式转换,屏蔽各业务系统之间的连接方式和报文格式的差异,提高代码的复用性,更加符合商业银行松耦合、构件化、面向服务的应用系统开发趋势。
在程序移植方面,选择了难度最高、意义最大的“两个平台、一套源码”的移植方案。通过大量的源码梳理、整合开发平台、预编译等多种方式,针对进口、国产平台的差异性在一套源码中开发不同的分支、设置不同的编译选项,保证源码版本的一致性。在开发移植过程中,克服了因主机硬件平台和操作系统差异,所带来的部分系统库函数、系统API存在的差异,处理器字节存放顺序不一致,程序异常容错性能力不同等诸多跨平台移植问题。
此次应用改造和移植涉及11个应用子系统,包括190个后台交易和服务、130个前端界面和服务、216个数据自动处理作业、140张业务报表,总代码量65万行。通过制订科学的管理制度、规范,利用ClearCase、QC等管理工具,严控开发版本和质量。先后在异构平台上进行了多达10轮、涵盖全部交易服务的业务通测,业务测试案例4000多个,投入188个测试机构、1万多人次,为系统上线打下坚实基础。
■异构平台互备运行
为实现国产与进口主机异构系统互备运行的目标,在主机系统、操作系统级无法实现的现实情况下,项目通过合理设计,利用面向服务的分层架构、开发服务总线,在应用层面解决了异构平台互备运行问题,创新了国产主机为主、进口主机为辅的异构平台互备运行模式。
基于服务总线,设计两级容错机制,降低风险、确保系统容错与运行稳定。第一级:国产高端服务器向进口小型机的切换及容错。国产服务器出现故障后,在应用层面通过容错条件判断及预定处理机制,自动将服务切换至进口小型机。第二级:进口主备机的切换。进口小型机出现问题,自动切换至备机。
上述机制既支持自动和手工切换两种方式,也可根据需要进行全部和部分交易切换。在异构平台上,国产、进口主机系统之间的故障响应和系统切换能够在秒级内完成,提高了系统的高可用和连续服务能力。
自主可控,已成为国家战略安全的必然选择。本次项目的成功,很大程度上增强了金融业对于应用国产高端服务器的信心,在加快推动国产高端服务器广泛应用方面,起到了一定的引领和辐射作用。目前已有包括金融、电力、公安、交通在内的10多个行业市场,开始在业务系统中尝试使用国产高端服务器。国产主机系统的产业联盟,也从最初的10多家成员发展到60多家,覆盖了芯片、整机、软件等各个产业环节,以国产高端服务器为核心的产业生态环境正在构建和形成,示范项目中所遇到的一些系统兼容性问题将逐步得到解决。结合分布式技术等在金融领域的逐步应用,金融行业必将进一步打破国外高端服务器市场的垄断局面,实现从“被动、威胁”向“自主、安全”的全面跨越。
写在最后
系统成功上线后,试点分行新疆分行包括代理业务在内的97%以上特色业务已在国产主机上在线处理。使用用户及渠道包括14个二级分行、187个营业网点、2000多个柜员、1049台ATM及多媒体自助设备、网银、手机银行等。
本次项目的成功,很大程度上增强了金融业对应用国产高端服务器的信心,在加快推动国产高端服务器广泛应用方面,起到了一定引领和辐射作用。目前已有包括金融、电力、公安、交通在内的10多个行业市场,开始在业务系统中尝试使用国产高端服务器。国产主机系统的产业联盟,也从最初10多家成员发展到60多家,覆盖芯片、整机、软件等各个产业环节,以国产高端服务器为核心的产业生态环境正在构建,示范项目中遇到的一些系统兼容性问题逐步得到解决。结合分布式技术等在金融领域的逐步应用,金融业将进一步打破国外高端服务器市场的垄断局面,实现从“被动、威胁”向“自主、安全”的全面跨越。
作者:林磊 来源:中国信息化周报 2016年43期