人工智能悄然而至-新一代工业智能——CPS与工业大数据实践
9月27-29日,以“构建中国制造2025新生态——精益·数字·智能”为主题的第十四届中国制造业国际论坛(MIF)在天津梅江会展中心举行。此次论坛由天津市工业和信息化委员会指导,制造业国际联盟、爱波瑞集团主办,现场有1500余位制造业领袖、专家、学者、政要以及快速成长型企业参会。北京天泽智云科技有限公司CTO刘宗长受邀出席并发表演讲。
大家好,今天这场分论坛的主题是“新一代工业智能——CPS与工业大数据实践”。那么,工业大数据、CPS、工业智能这些名词到底是什么?是如何定义的?我今天将为大家分享我们对这些热门技术词汇的理解,通过案例帮助大家理解工业智能的含义及其发挥的价值。
人工智能
2016年人工智能悄然出现并逐渐发展,直到现在,仍处在一个人工智能序曲的阶段上。这是为什么呢?AlphaGo事件中人工智能首次战胜人类棋手,引发了许多思考;同时,越来越多的公司也开始把人工智能技术引向工业的应用。
· 柯洁在大战之前说,从AlphaGo当中我们学到了很多东西,这对整个人类认识新的知识有很大的益处。
· 上个月特斯拉首席执行官埃隆·马斯克(Elon Musk)联合100多位人工智能学者向联合国提出倡议,我们应该去关注人工智能给人类带来的威胁。
· 麦肯锡曾经指出:“可能到2035年的时候,我们一半的工作将被人工智能所取代。”
· GE前总裁Jeff Emmelt曾提出:“一觉醒来惊奇地发现人工智能悄然而至,GE已经变成了一家互联网公司。”
· 德国Fraunhofer研究中心指出:“人工智能可以将生产率每年提高到0.8%-1.4%的功能。”
这些都预示着人工智能时代来临了。可是为什么我们需要人工智能?举个例子,在一辆汽车内设置了移动终端,实现对路面信息、交通状况、预计到达时间以及周围商圈等情况的信息收集,这样人们出行时能够享受更多的便利和更好的服务。可以看到,人工智能带来的并不是原本汽车的改变,而是用新的方式提供了更便利的信息服务。
工业智能
在工业界也是如此,原本的设备没有改变,在机器端对数据进行采集与分析,会呈现出很多关于设备的洞察,包括目前的运行状态与健康程度,跟其他设备与历史状态进行比较,自主预测未来设备的状态。最终,这些信息汇集之后传输回设备端,实现自我的维护和调整,这正是智能化技术在工业界当中巨大的优势体现。
那么,目前工业中有哪些不足?如何运用人工智能来弥补?过去我们关注两个方面,第一个是可制造性,运用多种建模手段,如冲压制程等,通过对物理指标的仿真考察规格是否合格,但无论怎样仿真,有些问题还是难以被发现和关注,最终导致在仿真中优秀的模型人工智能悄然而至,到实际生产中仍可能会产生次品。第二是生产系统设计,即对于设备综合效率(OEE)的管理和设计、及整个制造系统当中设计的管理,大多数企业会用到仿真软件,但无论怎样设计产线,都很难保持设备零意外停机的无间断运行。最主要的原因是设备都有一定的衰退,当衰退积累到一定程度会产生停机,进而生产线停止,最后导致过去的数据模型失效。
所以我们会发现,设计建模与实际的生产制造中间存在一个很大的差距,它们之间不匹配,这就会产生忧虑。在过去的生产线中,目标是实现work reduction(怎样减少工作)以及waste reduction (怎么减少浪费),现在worry reduction(零忧虑)成为新的目标,即怎么把生产过程中原本不可见的东西变得可见,从而去管理这些由于未知所造成的忧虑。将设备中所有造成停机、浪费、次品的风险全部加以控制,最终实现三个零:零停机、零次品、零浪费,消除生产过程中的忧虑。
美国IMS中心在2000年成立时,曾提出“未来智能工业系统”的概念。当时发现每个产品或者系统中都会有上百维的数据,但那时数据并不像现在这么容易提取出来。我们的想法是,基于嵌入式的智能终端,将分析方法进行有效的结合,用Watchdog Agent分析引擎,将信息在边缘端处理之后,传输出当前状态和健康相关信息,再跟运营系统相连接,最终通过可视化的服务传递回设备端,传递时间既不过早也不过晚(Just-in-time),从而实现近零停机(near-zero downtime),即任何一次停机都处在预料之中。如此可以对机器进行主动的维护,同时将信息反馈到从设计端到产品制造端的全过程中,实现对设备的改善,最终实现信息的闭环。这就是我们当初提出来的设想。
通过这个设想的发展,我们发现当初预见的未来正在变成现实。让我们聚焦到现代工业系统是怎样的?未来智能工业系统会怎样?主要表现在零部件级、设备级、生产系统这三个维度上。
从零部件级,现在关注的是精密性,以及如何通过更加精密的传感器,实现更加精密的动作,那么未来呢?需要具备自预测性和自省性,设备需要精密,但不会一直精密下去,外部原因或者自身衰退都会造成精密性发生变化,这时零部件可以将设备的状态以及能造成的后果反馈给操作者。
从装备的状态角度,现在关注的是性能,以及能否连续生产质量达标的产品。未来更加关注设备的自比较性,自比较性也是对标的概念,麦肯锡在数字化制造的战略当中,提出了这个概念,它既包括设备与自身历史最优状态的对标,也包括在不同的环境下,集群内与其他的设备之间的对标。这样可以清晰的了解设备目前状态好坏与否,如果设备状态不好,还可以进一步了解故障在哪发生,以及是哪种原因造成的。
第三个层面就是整个系统,怎样实现最大的生产性来提升设备综合效率(OEE)。现在我们主要关注的是系统中各个设备、工序之间怎样配合。配合的概念是指当上游产生了质量误差,及时发现并在下游进行补偿。在这个过程当中,如果有设备出现质量问题,能用其他的途径进行改善,这就实现了具有强韧性的系统(resilience system),即系统内部可以通过协同性的优化,把问题的影响降到最小。
以上讲的由零部件、装备到系统的不同层级的角度,为大家展示了未来我们希望的工业智能系统的状态。
工业智能发展的五个阶段
在实现工业智能的过程中,需要经历五个阶段。正如这场论坛的主题——精益、数字、智能,这六个字涵盖了制造系统从传统到智能化的演变过程。
第一个阶段,是过去大家一直在做的,即TPS全员生产系统的标准化持续改善,提升整体的生产文化的管理;
第二个阶段,是精益化和数字化。精益化和数字化的概念是以数据为驱动标准,使整个系统当中的配合性能够达到最大化,用数字化的方式把当前的状态实时地表示出来,这样就可以了解设备将会出现的问题以及可能带来的影响。
第三个阶段,在我们知道了当前状况的时候,如果能够通过预测性的手段,或者通过数据驱动建模的分析方式,寻找到问题产生的隐性原因,这就是将隐性问题显性化的阶段。要实现这一目标,需要基于大数据,或者人工智能的建模技术;
第四个阶段,当知道设备出现问题的原因时,可以通过结合具体场景,预测对设备的运营或决策会产生什么后果,来实现以预测性为基础的有效性运营和决策优化;
第五个阶段,在以上基础上,把感知、分析、优化和执行连接起来,实现在赛博空间管理整个实体空间中所有设备的系统,形成了赛博空间与实体空间的镜像,最终实现CPS的工业智能系统。
目前大多数企业还处在第三个阶段,前两个阶段做得很好,但建模的能力还没有形成,问题出现时不了解故障原因。
用GE倡导的工业互联网概念再来描绘一下未来工业智能的技术图景。这个圆圈包含了很多的技术,数据输出后,运用基于机器的算法(machine-based algorithms),如嵌入式智能和边缘计算的技术,以及在云端的智能分析、数据可视化等,运用数据产生最优化的决策,传递到不同的组织,最终反馈到设备当中进行执行。这既包括IT与OT之间的相结合,又包括很多的云计算、边缘计算等最新的IT技术,甚至包括像大数据分析,人工智能建模等最新的技术研究方向。实现智能设备、智能分析、智能决策,最终形成自发自动的循环。
工业智能化转型的三个路径
那么对于目前的工业企业,如何运用工业智能技术和大数据来实现转型?可以运用这个模型分成三条路径 - 对于问题,纵轴分为可以解决或是避免,横轴分为可见问题和不可见问题,过去致力于怎样解决可见的问题,并进行持续的改善和标准化。
那么接下来转型的第一条路径是怎样去避免不可见的问题:从数据的角度,将问题产生的过程用数据分析、建模,来了解发生的原因。并在发生的原因上,通过预测性方式持续改善,来避免可见问题的发生。
不可见的问题是指设备衰退或者生产过程中会出现残次品,设备背后的关联性和关系性模型存在的问题是不可见的,从数据的角度能够挖掘到关联性,把不可见问题变得可见,更加高效地解决问题,这是我们可以开发的第二条路径,会用到PHM、机器学习还有知识挖掘等核心技术。
第三个路径是建立知识的模型,把相关性挖掘出来后,变成知识进行沉淀。沉淀后在赛博空间建立对称管理,实体空间中所有装备镜像的模型,实时产生所需的最优决策,用到的核心方法是建模技术(Twin Model)、信息物理系统(CPS)等。
工业智能化案例
下面介绍几个案例,来帮助大家更加清晰地理解工业智能的这三个转型路径或方向是怎样完成的。
第一个案例是通过阿尔斯通的轨道交通智能管理系统来解析如何利用数据分析问题发生的过程,并且避免可见问题的发生。阿尔斯通是全球非常先进的轨道交通解决方案的供应商,不仅基础设施庞大而且维护费用也高,所以阿尔斯通2006年推出智能管理系统Health Hub,实现从车辆级到基础设施级的智能管理。在感知系统方面通过Train Tracer、Track Tracer、Train Scanner等产品,实现将运行过程当中的实时状态数据传递到HealthHub中进行分析,实时评估关键部件的健康状态,预测未来的风险,并且用预测性的方式进行排程优化。
这套系统支撑起了阿尔斯通向服务型制造的转型。目前阿尔斯通已经有超过35%的收入、50%的利润来源于对已经卖出设备的服务型管理。其中的价值在于,车辆卖给使用者之后,通过智能的分析、预测与优化排程,帮助用户节省维护成本,这是生产价值模式的转变。
整个系统运用了典型的CPS技术框架,包括设备中数据的智能连接,实时的数据分析流,云端实现建模过程,经过大数据分析之后,对这些问题预测和决策,最终将决策运用到所有的相关部门中。展示一些典型的界面,2010年IMS中心与阿尔斯通进行合作,提供了很多分析模型的核心算法,包括像高铁集群的监控、车辆内部的牵引系统、轴承系统、轨道的转辙器、车载的轨道监测系统等。在模型的底层上,将传统的不可见的问题显性化。
目前天泽智云也在跟国内某高铁制造商合作,开发基于CPS技术的高铁PHM(预诊断与健康管理)平台,通过对高铁进行大量的实验将关键部件的镜像模型建立出来,包括失效模式、失效的状态,以及过去探测到具有隐性失效特征的算法等等。
第二个案例是高圣智能带锯机床,通过从数据中挖掘隐性问题的线索,实现对不可见问题的管理。传统的不可见的问题,包括设备衰退、质量过程参数产生偏差等,如何进行预测和管理是在我们在制造系统当中最常见的问题。带锯机床通常用来做材料的粗切割,如将块状材料切割成不同的形状。锯带是一个耗材,如果在使用过程当中出现了断裂等问题,会造成质量参数的缺失,以及大量成本的增加。
传统的方式是通过有经验的操作工人,在现场用耳朵去听设备的声音,判断当前的锯带是否正常。如果觉得噪音变大,就更换锯带,有时可能把好的锯带换掉,造成成本浪费;也会出现没有及时发现问题而造成了锯带断裂,如果切削的是极其昂贵的航空材料时,这块材料可能就会报废,造成极大的成本浪费。
后来项目团队把人的经验和生产过程当中的参数固化为模型,来预测锯带的状态。通过试验传感器的部署,把知识、故障模式、切割参数等信息集成到模型里,同时运用PHM算法工具,包括信号处理、健康评估、故障预测等,实现了在不同的工况下,通过状态参数进行自动识别,提取不同健康状态下的特征聚类,再运用特征识别等模型方法判断当前的状况。
最终,实现了将锯带从完全健康到镀层磨损,再到内部实际的磨损,最后到断裂的整个过程中,把不同时期的模型建立起来,这样就把过去不可见的问题显性化。这些实时的数据,包括锯带的衰退状态,核心部件的运转模式等,通过模型加以分析,通过手机端或者web端进行访问,实时决策优化管理。过去可能一个人管理最多10台机床,现在一个人可以管理更多的机床,实现了从人员的使用效率到成本维护的整体优化。这个产品在2014年芝加哥国际制造技术展会(IMTS)上第一次展出,2016年正式商业化,目前已在全球部署了超过一百多家的项目工程。
第三个案例是通过智慧风场系统解析如何利用知识建模在赛博空间里面产生对实体的管理镜像,实现对不可见问题的避免。风场大多在相对偏远的地方且风机成本昂贵,这对生产管理、健康管理以及运维管理层面有很大的挑战。对于一台风机,生产管理方面要实现对设备衰退状态的监测,并预测当前的环境;健康管理方面,主要针对风机内部的核心部件的管理;运维管理方面,通过预测的方法实现对设备故障的避免以最大化降低运维成本。
通过研究发现,要把以上的忧虑解决掉,需要三个步骤。
第一步进行状态评估,即了解风机的实时状态,无论是性能的衰退或健康的风险,都要进行精确地量化。
第二步是场景化预测,比如整体维护排程的优化,采用不同的排程规划,会产生不同的生产和维护成本,结果也有所不同,因此需要将所有可能的成本结果都量化出来,从上亿种可能性中搜索最优的一个结果。
第三步是优化和避免,一台风机中可能有上百维的参数,运用模式识别的方法判断正常状态、非正常状态,这样可以清晰地识别出正常状态下的风机。当新的数据输入进来时,实时地跟正常模式进行比较,当发生逐渐偏离健康状态时,设备就会产生新的风险。
实现这一系统后,对大型的部件如传动链可以做到提前至少30天预测到潜在故障。当了解到设备的故障后,就要对故障进行排除。这涉及维护的问题,要考虑多成本要素的综合建模,包括机会成本、固定成本、动态成本,实现全部建模后,基于建模进行有效预测,比如在某一时刻,将有几十个排程的任务,不同排程组合造成的成本是多少,这可能有上亿种不同的组合途径,如何在这些途径中搜索最优的结果,我们运用了遗传算法的优化模型求解过程。遗传算法针对于风场排程的问题,实现了多层的优化求解器,比传统的线性规划提升上千倍的效率,比单层的遗传算法提升数十倍的效率。对于一个风场来讲,如果要排程几十个维护任务,可以在一分钟之内找到最优的结果。
目前这个WindInsight系统是我们与微软的Azure合作,实现部署的一个海上风场。风场在实时运行的时候,整个风场的风机运行状态是否有潜在的故障或者风险发生等,都可以在这个系统上进行远程判断。当某个风机出现潜在故障时,我们可以对它进行最优化的排程。优化排程中考虑的因素包括当前人员使用率,整个风场的风资源情况,风机的发电能力情况,故障衰退情况等。也对每台风机进行对标,与整个风场内的其他风机相比发电能力如何?与历史相比发电能力如何?在对风场管理时,对当前风场未来72小时的风资源进行预测,包括风向和风力的情况。在维护的过程当中,要尽量的选择风小的时候进行停机维护,在风大的时候进行发电,如此经过多成本的综合考虑后,产生新的智能优化的模型,对这些模型进行在线评估。这样的过程实现了对风场从设备的管理到生产管理再到维护管理的全栈式解决方案。
关于CPS信息物理系统
以上三个案例的实现,是基于融合了边缘计算和云计算的CPS技术架构。CPS这项技术在国外研究的人非常多,2011年GE第一次提出工业互联网的概念的时候,就提到CPS将会是未来的核心技术,而德国的工业4.0也提出CPPS的概念。在我国,CPS也是今年工信部推广的一项重要的技术架构,于3月1日正式发布了CPS信息物理系统白皮书,将CPS定义为支撑工业和信息化深度融合的一套综合技术体系,对于实现中国制造2025和推进我国工业产业的价值转型与升级具有重大的意义。
在李杰教授的《CPS新一代工业智能》书中,定义了CPS的5C技术体系架构,即Connection智能连接层、Conversion智能分析层、Cyber智能网络层、 Cognition智能认知层、Configuration智能配置与执行层,也被收录于工信部的CPS信息物理系统白皮书中。实现这五层的CPS架构,需要融合DT数据处理技术、AT分析软件技术、PT平台接口技术和OT运营技术,对工业大数据进行连接、挖掘、分析、预测和优化,将工业生产制造当中的知识转换成高价值生产力。
关于天泽智云
最后给大家介绍一下我们。IMS中心是美国自然基金会下属的一个产学研合作中心,过去在IMS中心时,我们主要的研究方向是设备的预诊断与健康管理(PHM),随着数据量越来越庞大,IMS的研究领域开始向工业智能和大数据分析方转移。我的导师是IMS中心的创始主任李杰教授,在他的《工业大数据》、《从大数据到智能制造》、《CPS新一代工业智能》、《云上工业智能》这四本书当中,对刚提到的概念有详细解读,并且列举了之前做过的30多个工业智能化的案例, 如果大家想要了解更多,可以翻阅书中得到更详尽的资料。
天泽智云是IMS中心在国内的技术孵化企业,定位是工业智能实践引领者。核心团队来自于IMS的机械工程博士,具备工业领域知识、计算机科学、人工智能算法的跨界知识与应用能力,拥有丰富的工业智能项目的实践经验。我们希望将IMS过去17年在工业智能方面的项目经验智慧在中国进行传承。
天泽智云工业资产智能运维解决方案以“信息-物理系统”(CPS)技术为构架,结合对工业场景的深度理解,为客户提供从方案的咨询到实施以及持续的能力交付的全栈工业智能方案集成。通过交付从产品到能力的赋能服务,真正地帮助客户提升整体竞争力,实现价值转型。
最后,欢迎大家关注天泽智云的官方微信,里面有很多工业智能化成功应用案例,以及工业智能相关的技术资讯,都可以供各位参考。谢谢大家!