十几年前,在数据对于企业的作用还不被认识,大数据为何物更是不为人所知时,一位25岁的青年却已经开始了在工业大数据领域的耕耘。
是什么让他当年在从事自动化专业多年后选择这一相对冷门的行业开始了创业?又是什么吸引他一直坚持?在大数据、智能制造、工业4.0的概念如此响亮的今天,他又有什么感想和认识呢?
《中国信息化周报》与北京中瑞泰科技有限公司(简称中瑞泰科技)创始人江涛和联合创始人黄咏博士展开了将近两个小时的访谈,畅聊工业大数据的来龙去脉。
十五年前
创立“工业大数据”公司
《中国信息化周报》:您当年为什么会去选择创立中瑞泰科技?公司初期的发展情况如何?
江涛:大学毕业后我一直从事自动化专业相关的工作,当时有两方面的感触:一是国内自动化工程主要采用的还是国外的产品;二是自动化市场竞争激烈,同质化竞争严重。1998年,我有机会接触到当时世界最先进的实时数据库技术,美国OSIsoft公司的PI系统(Plant Information System)。与传统的自动化系统不同,PI系统通过数据集成把底层控制系统的信息带到了管理系统层。大量的生产实时数据将成为自动化系统的一个新特点,我意识到在这一领域将会出现很多机会。现在回想一下,正是海量实时数据的价值推动我创立了中瑞泰科技。
在公司成立之初,我们的业务重点有两个方面,一方面基于PI做应用开发,另一方面专注于实时数据挖掘的自主知识产权产品开发。在2005年,中瑞泰科技推出了自己的第一个产品——智能设备故障预警系统软件,这个软件通过对设备海量实时数据的分析和建模,实现实时故障早期预警,是我们目前的iEM System工业大数据平台的雏形。
我们做这个技术时,是用数据的方法解决机理问题,同期也有美国的公司在做类似研究。其实这种技术在20世纪70年代已经具备了雏形,最早采用模糊数学、灰色理论等技术,但受限于当时的计算机技术,一直到2000年才具备应用条件。
2005年我们的产品出来之后,已经能够解决很多应用问题,但大多数用户在意识和管理上还跟不上,只有部分用户很早就开始了相关的实践,例如秦山核电等。
与目前铺天盖地的大数据和物联网相比,其实我们十年前就已经开始工业大数据技术的研究并形成产品了。
《中国信息化周报》:黄总有怎样的职业经历?您对公司的产品发展有什么看法?
黄咏:我在国企做设备维修和设备管理很多年,读完博士之后,又在外企做产品研发和技术服务,一直没有偏离自动化的专业方向。在我看来,自动化系统中的很多问题,都可以归结为建模问题。建模就需要数据,但实际上,在我们目前的自动化系统中,已经采集了很多数据,但这些数据并没有被充分利用。越来越多的人意识到这些数据的价值,如何利用这些数据已经成为瓶颈。主要的问题还是需要新的方法和工具来解读这些数据,这就是工业大数据技术的应用领域。
经过这么多年的准备,我们的产品在大量的实际应用中得到不断完善和改进,从最初的预警系统到设备健康管理,从实时数据应用到工业大数据平台,其实从这个过程您也可以看到我们在工业大数据方面的坚持。
工业4.0、工业技术物联网离不开工业大数据,但也只有在这个阶段,工业大数据才有机会成为推动力,催生很多行业机会。我们把中瑞泰的产品打造成工业大数据的应用平台,就是要让工业大数据技术好用易用,发挥数据的价值。
工业大数据技术的产业价值
《中国信息化周报》:什么是工业大数据?工业大数据技术的特征是什么?
江涛:工业大数据是工业企业与生产设备相关的大数据,工业大数据包括设备的设计制造数据,实时运行数据,检维修数据,缺陷、故障数据等等,工业大数据包含的面很广,但相对我们通常谈论的大数据,工业大数据有自己的特点。工业大数据中生产设备的实时运行数据是重点。
工业大数据技术就是研究如何利用工业数据的技术,大家都知道数据中包含了设备的运行规律,但关键在于,如何发现规律?利用这些规律能干什么?能带来什么价值?
关于工业大数据的概念,已经谈得太多了,但真正谈到工业大数据技术,其实还比较具体。
总体上,工业大数据技术可以分为四个关键环节:机器学习,状态分析,关联分析和预测分析。机器学习是工业大数据的核心,机器学习就是通过对海量历史数据的分析建立工业大数据的模型,这是利用工业大数据的第一步,没有机器学习就谈不上工业大数据技术。
然后是状态分析,我们其实更强调实时状态分析,就是利用工业大数据模型来对系统对象进行实时状态识别和评估。关联分析是工业大数据技术的另一个重要特征,其实工业大数据和我们通常说的大数据相比,数据之间的关联性更强更复杂,关联分析就是通过对关联性的分析,对事件发生时的因素进行识别。最后才是我们经常提到的预测分析,是利用工业大数据模型,对期望状态的一种运算。
《中国信息化周报》:目前,实现工业大数据技术的主流技术有哪些?应用效果如何?
黄咏:由于工业大数据的内容比较丰富,采用的技术也各种各样,不过在机器学习、状态分析、关联分析和预测分析等环节,各种技术的应用效果区别较大。
首先是常规的统计分析方法,应用的很多,同时实际上并不是真正的机器学习技术,但是因为比较简单,因此用在大量的数据处理应用中。
其次是聚类分析方法,通过构建分类器来实现对状态模式的自动识别,对于一些非实时性的需求,聚类分析方法应用起来比较简单,也有一些平台可以提供算法。
人工神经网络是实现机器学习的一个常用技术,在工业大数据研究中也经常采用,但是建模训练比较慢,以及模型不唯一的缺点,使得在实际应用中遇到很多障碍。
主元分析方法也是常用的方法,用在工业大数据分析中效果还不错,通常适用于有一定专家经验介入的系统场景。
我们的iEM System工业大数据平台采用的是超球建模技术,直接在多维空间中分析工业设备对象海量状态数据,建模过程能够最大限度地保留数据中各个维度的信息,因此超球模型能够真实地反映设备的“工况-状态”模式。在应用中表现得比较好。
整体说来,工业大数据领域有很多技术尝试,但iEM System做到了平台化和产品化。
《中国信息化周报》:工业大数据技术的核心价值是什么?
黄咏:iEM System智能平台带给用户的核心价值可以总结为四个字:“通、活、早、简”,也称为CAPS。
“通”是打通孤立系统:我们现在的自动化系统都讲究网络架构,从拓扑结构上看,所有的系统都连起来了,但从数据上看,大部分系统还是孤立的。实际上数据就是各个系统不同的语言,大家“自说自话”,并没有实现我们预期的通过网络将系统互连的目标。而iEM System按照资产架构对数据进行重新组织,从设备视角建立状态模型,对状态实时评估,通过“健康感知”技术,让设备的状态变得简单明了,及时将状态变化推送到管理和分析系统中,这才真正打通了各个系统之间的数据和信息通道。
“活”是激活数据资源:工业系统的实时历史数据积累的速度,远大于我们通过专家学习、分析和利用数据的速度,海量的数据资源在沉睡。而iEM System通过机器学习的方式,提取海量数据中的模式信息,充分利用计算机的能力,激活数据资源,提高分析和利用数据的效率。
“早”是提前发现问题:基于iEM System工业大数据模型的实时状态评估,可以对工业系统或设备的整体状态实现量化评估,系统的任何问题发生的早期都会有一些异常的波动,iEM System可以提前发现这些波动,确保有充分的时间来处理问题。
“简”是简化监控模式:传统的自动化系统中,监控的对象是测点值的变化,因此要诊断设备故障,通常要通过看画面、查参数、比趋势、翻报警、看频谱等步骤,在iEM System工业大数据平台上,监控可以通过健康度曲线和关联测点的方式快速定位故障原因,这是在操作层面最有价值的一种改变。
《中国信息化周报》:工业大数据技术有哪些具体的应用?
江涛:目前工业企业在很多应用领域都锁定工业大数据技术为重点科研项目。从目前应用的情况看,在设备状态监测、故障诊断管理和系统性能优化等领域应用的案例较多,基于iEM System的设备健康管理系统在电力、石化等领域有一些非常成功的应用案例。
《中国信息化周报》:基于工业大数据做健康感知、关联分析、预测分析,中瑞泰科技的技术门槛高吗?
江涛:应该说还是有比较高的门槛的。它既要求有理论背景也要求了解用户的实际需求。我们这么多年还在不停地摸索和改进。我们的发明专利技术在国际上也得到了认可,可以说,这项技术属于国际领先水平。
工业大数据产业风口到来
《中国信息化周报》:你们如何理解工业大数据技术和工业4.0的关系?
江涛:工业大数据技术其实是一步步发展起来的,但只有在工业4.0时代,工业大数据技术才变得更现实、更重要。因为在工业4.0时代,更强调工业系统中机器和人的分工以及协作。
我们一直在讲智能制造,工业物联网等。实际上,在这些概念中,重要的是工业系统中的设备,要成为具有智能的独立单元。在工业系统中,设备一直在“说话”,它的语言就是各种测点的实时数据。以往,我们只是记录数据,在设备故障之后,再来分析数据,因为我们不能理解设备“说的话”。而在工业4.0时代,我们需要让设备说我们能听懂的话,如何实现?
工业大数据技术是解决问题的关键。实际上,设备在大部分时间是在说“废话”,而我们借助iEM System工业大数据技术实时评估设备的状态,翻译设备的语言,忽略冗余的状态,也就是设备的废话,而识别异常的波动。
因此,工业大数据技术和工业4.0是相互支撑的,工业4.0的实现,需要基于工业大数据技术构建设备智能,而工业大数据技术只有在工业4.0时代才能充分发挥其真正的价值。
工业大数据技术是解决工业4.0人机分工的重要技术。未来,随着数据量的增加,工厂肯定不可能完全靠纯粹的人工来判断、分析、解决问题,懂行的人为什么能够看到这些数据就能知道问题出在哪里,那是因为他在脑袋里用人工的方式识别数据的关联分析,而我们现在要做的就是用机器识别数据的关联性。原来人工识别数据的关联都是在报警之后,而机器识别则可以在人之前,甚至在报警之前,不是让机器取代人,而是要让机器帮助人,在面对海量数据的时候把第一步工作先做了,帮助人提前预知设备状态,在什么时候去看什么事,在没有发生问题之前发现问题所在。最早我们的产品早期预警系统,不是早期能预测设备什么时候坏,而是对异常状态数据的感知识别后告诉给人。以前是人只能等报警之后才去关注,事情追着人,现在是提前识别,可以提高人管设备的效率。总结来看,我们的产品第一解决了合理的人机分工,第二它会对所有的传统技术带来革新。
《中国信息化周报》:如何看待工业大数据技术在中国的产业前景?作为行业的领先者,中瑞泰科技在中国的工业大数据技术的发展中要发挥什么样的作用?
江涛:在工业大数据这个领域,我们和欧美处于同一起跑线上,我们在很多领域还具有后发优势,例如产业设备升级和自动化水平等,只要环境适宜,这个技术有很大的发展前景,可以超越其他国家。与15年前创业相比,国家对这个领域也非常重视,我们的感觉是产业的风口正在形成中。希望国家的相关标准能落地,加大对知识产权保护,希望更多人参与到创新的过程中。
随着产业环境的变化,国家大力倡导智能制造、工业4.0,市场会越来越成熟,让大家认识到产业发展趋势,未来的方向不只是让设备会说人能听懂的话,更要在数据之上做更多的文章。
在工业大数据这个领域,中瑞泰科技只是做得比较早,意识得比较早,希望通过我们的努力能够促进这个产业更健康的发展,与我们的用户和合作伙伴一起共同推动这个产业的发展。感谢您的采访,也希望能够借助媒体让工业大数据被更多人所了解和熟悉。
记者手记
这次的访谈对记者而言,更像是一堂课,一堂工业大数据的科普之课。
工业大数据技术可以分为四个关键环节:机器学习、状态分析、关联分析和预测分析。机器学习是工业大数据的核心,机器学习就是通过对海量历史数据的分析建立工业大数据的模型,这是利用工业大数据的第一步,没有机器学习就谈不上工业大数据技术了。
只有在工业4.0时代,工业大数据技术才变得更现实更重要。因为在工业4.0时代,更强调工业系统中机器和人的分工和协作。
工业实时数据其实是企业非常宝贵的财富。
这的确是一块非常细分、专业的领域,需要精耕细作。中瑞泰科技已经默默地“耕种”了十多年。当这个产业的风口来临,这个领域将迎来前所未有的发展良机。
相信风起的时候,那些做好准备的人们,会飞上高空。
作者:霍娜 来源:中国信息化周报 2016年20期