BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

刘宗长:AI落地工业,需要融入而非颠覆
录制于:

| 受访者 刘宗长 关注 0 他的粉丝 作者 InfoQ 关注 13 他的粉丝 发布于 2018年1月26日 | QCon上海2018 关注大数据平台技术选型、搭建、系统迁移和优化的经验。
25:25

个人简介 刘宗长,天泽智云首席技术官。美国辛辛那提大学智能维护系统中心机械工程博士,美国国家科学基金会(NSF)智能维护系统研究助理,拥有工业领域十多项专利技术,对工业大数据、CPS、PHM领域具有深入的理论基础与广泛的实践。合作参与船舶智能运行与维护(SOMS)项目,智能风机故障预测与诊断系统,PCB制造系统智能工厂,阿尔斯通(Alstom) Track Tracer等多个重大项目,对能源、船舶、制造等诸多领域有着深入的实践与理解。参与编写李杰教授的《工业大数据》、《从大数据到智能制造》、《CPS新一代工业智能》等多部著作,成为中国工业大数据和工业智能领域的经典理论体系。主导IMS并带领团队与工业界诸多的合作项目研究,对产品设计开发、研发体系建设有着深刻的认识与经验。

AICon全球人工智能与机器学习技术大会是由极客邦科技InfoQ中国主办的技术盛会,大会为期2天,主要面向各行业对AI技术感兴趣的中高端技术人员。大会将重点关注人工智能的落地实践,与企业一起探寻AI的边界。在AICon上,你将会看到国内外知名企业的人工智能落地案例,也能与国内顶尖的人工智能专家探讨相关的技术实践,使企业可以根据最佳实践确定自己的选型方案,并提前预估相关的风险和收益,实现技术落地。

   

2. 首先请您介绍一下自己的从业经历,还有当前您在天泽智云主要负责的工作?

刘宗长:天泽智云是美国NSF的智能维护系统中心孵化出来的一个企业,我是2012年开始在IMS中心念博士,后来在2016年的时候,跟我们的几个同学在我们导师以及教授的带领之下,创立了天泽智云这个公司。IMS在过去的一个研究的方向应该从2001年开始一直在做工业的智能维护系统,包括我们所说的面向工业装备的故障预测与健康管理。在大概五六年前开始关注怎么利用机器学习建模的方法来应用到工业这个领域当中去。我们过去在全球与大概超过90家企业,合作了150多个工业的项目,在工业领域里面基于数据分析,还有包括基于数据建模的技术为企业去生产价值,并积累了一些经验。过去我从事的一个主要研究方向是CPS,就是信息物理系统,在工业当中尤其是在工业设备的健康管理方面的一些应用。在这个领域里面,我过去负责和参与的一些项目包括智慧风电系统的开发、智能船舶系统、智能轨道交通系统,还有像电动汽车的电池管理BMS这样一个系统的开发,现在我在天泽智云主要负责技术这方面。我们现在建立了核心的三个团队,一个是数据科学家团队,不断地在工业领域当中去挖掘新的场景,以及在场景当中利用工业智能或者说人工智能的技术去解决里面的问题,这是我们数据科学家团队。另外就是我们的软件团队,最终各个方面我们的载体最终落地形式还要落到软件方面,所以我们现在有开发自己的CyberSphere、CyberRepository和GenPro这样一些面向数据管理、模型管理和建模过程的产品平台。另外我们有一个边缘计算团队,主要就是面向于各种工业对象的数据接入、IOT技术的开发,以及包括我们的算法怎么样能够在边缘端,无论是RT环境当中,还是FPGA环境当中的一个部署,这个是由我们的边缘计算团队在做。整个这个三方面,就是作为天泽智云核心的技术支撑,现在是我来负责做一些管理和技术方面方向的制定。

   

3. 通用电器在2012年提出了“工业互联网”和“工业大数据”这两个概念,请为我们解读一下这两个概念的含义,以及工业大数据与互联网大数据之间有什么重要的区别?

刘宗长:这个解释之前在李杰教授那本工业大数据的书里面也有一些提及,“工业互联网”和“工业大数据”的主要区别在这么几个方面:第一个我们讲,在互联网大数据里面它关注的就是那四个V的问题,那么在工业大数据里面我们更多关注的就是叫做三个B的问题,就是数据的Bad Quality,数据质量的一个问题,还有Broken的问题,就是数据的维度可能没有那么的全面,还有第三个,就是我们叫做Background,数据的背景可能没有那么清楚,包括它的标签,包括它的运行的相应的工况等等这样的信息。所以这里面我们会发现在互联网数据当中,尤其是我们讲在这种大数据管理的这种方式下,那么在互联网大数据更多的关注于数据的本身,就是数据的压缩存储索引等等类似这些所有的。但是工业环境当中,我们在面向工业数据的时候,我们同样也要管这些问题,但是我们管理有所侧重,或者解决问题的这种维度不太一样,我们关注的更多是这些,第一数据怎么用更好的方式把它组织起来,第二个是我们的数据用怎么样一个合理的方式,去获取这些合理的方式,就是我们所说的流的概念,整个数据获取之后怎么样进行分析,分析到决策,决策再到反馈,它的流程性非常强,这个是关注的一个不同;第二个就是从分析的维度而言,我们讲在工业里面它是收敛型的,为什么它有流的概念?就是我一定会从一个大的数据,就是大数据小信息,慢慢地到小数据多信息,然后再收敛到一个很具体的决策。这个决策无论是对于这个设备的维护的决策还是对于一个产品是否存在质量风险决策等等这些方面,它一定是有明确的目的性去收敛的。所以我们无论是数据获取还是分析的过程,我们首先一定是从问题出发和目标出发,然后再回过头来去看,我们要怎么去获得和管理数据。而互联网的数据更多是发散型的,就是这些数据天然而然的在每次的交易点击当中它就产生了,那么我们从这些海量的数据当中,我们去找一找,看看能不能有商业模式,看能不能找到一些新的价值,所以说它是本身基于海量数据的环境当中再在里面去寻找它的应用场景,它的一些分析更多的是这种发散性质的,这个是主要的几个不同。

   

4. 像您刚刚提到了CPS-信息物理系统架构,能否请您介绍一下CPS架构,以及它在工业智能的实现中主要发挥什么样的作用?

刘宗长:CPS 5C的一个架构也是李教授在2013年的时候提出来的,后面我们很多实验室的博士生们和研究人员一直在尝试怎么把这个架构在各种场景当中落地,那么现在我们看到它有一个非常大的优势,实质上我们现在在船舶、高铁、风电,还有包括像钢铁等这种流程性制造、不同的工业环境当中,都很好地落地了,并且很好地解决了问题。所以说CPS这个5C架构应该说在解决工业这个方面的,我们讲工业智能落地方面还是应该是一个相对来讲比较通用和比较可靠的一个技术的思路或者技术的路线。那这里面,五个C第一个我们叫做Connection,就是数据的获取,数据的获取这里面的问题就是在于工业领域的数据获取是很贵的,它不像互联网里面,数据的获取是天然就在的,在这里面我们更关注于Connection这上面,到底怎么样能够用最少量的传感器,去得到最多的我们想要的信息,还有包括数据采集的一些策略,在这里面我们大量都用到了很多的智能网关,还有包括边缘计算等等这样的一些技术。在第二层,我们叫做Conversion,就是怎么从数据变成一个有效的信息,在这里面我们提出了一个叫做Add-on AI的概念,这个概念我们看到GE它在做工业互联网Predix这个平台的时候,有一个圈,表示并不是数据一出来之后直接进到互联网或者云端,它在上面有个叫做machine-based algorithm,就是基于在设备端的一个初步的分析,然后再把这个结果传出去,所以第二层Conversion这个层面,更多的是说,怎么样在设备端里面,比如跟这个设备运行相关的一些信息,我这边把它处理掉了,而在这里面设备里也有一个闭环,它有一部分信息可以分享,另一部分信息只是用于内部的控制决策,把这个数据消费掉就可以了,所以这就是我们讲的Conversion这个层面。到了Cyber这个层面,前面两个我们关注的还是对象,然后到了Cyber这个层面,它关注的其实是一个Fleet(集群)的概念。在一个系统当中,可能同一类设备也有很多种,还有就是不同的设备做不同的事情,它关注的点是说,第一,对单个设备而言,我怎么对它的历史状态进行非常精确的镜像的建模,第二个是这个设备跟其他设备的关联关系是什么,他们之间会不会有相互的影响,第三个是说这些所有的设备组合在一起,有一个共同的目标,他们对于这个目标的理解,还有对于这个最终目标的优化方向,这个方面的一些建模。第四个层面就是我们讲的Cognition,认知层,认知层我们更多关注的是因果性的挖掘,一个现象产生了,它的原因到底是什么,第二个就是协同优化的概念,就是当我们有一个目标出现的时候,那么这个目标是不同的对象共同的组织然后去实现的,如果这个里面出现了一个扰动,比如说一个风险,那么我们用什么样的方法能够把这个风险降到最小,这个风险对目标的影响是什么,用什么样的一个手段能够把它降到最小,无论是一个设备可能出现的早期故障,它要停机了,还是说一个设备的性能下降了,它有可能产生次品,这都是形成扰动,我们怎么去对它进行分析和决策。那么最上层我们叫做Configuration,叫做配置或者执行,其实也就是说我们的决策怎么样能够执行。在这个过程当中,我们在执行过程当中关注的是System Resilience,就是设备的强韧性。比如说在系统当中发现有一个设备出现了性能的衰退,可能造成了一定的产品质量的影响,能不能在下一个工站把这个给补偿进去;还有像一个设备如果已经出现了效率的下降,那么能不能先把它这个生产路径by pass掉,但是我保证整个系统的total throughput不会产生影响,这时候我们讲叫做Resilience概念。我们会发现整个过程当中,它从数据到信息,再到认知再到决策整个过程都具有非常明显的收敛性;而且它是一个我们叫做流的概念,工业当中大量都是我们所说的Process Flow这个概念;还有就是我们讲拉动式,它一定是以决策,一定是以它最终的执行为核心,反向去拉动下面的所有的数据的获取到分析这个过程的,所以这是我们讲CPS之所以能落地于工业界很重要的一个原因,它整个架构的设计与工业的认知和工业现有的体系是非常契合的。

   

5. 刚才您提到很多次边缘计算,可能我们原来对互联网的云计算会比较熟悉,但是对边缘计算不太熟悉。所以边缘计算到底是什么样的 概念,能不能请您简单的介绍一下?

刘宗长:这个现在大家一提到边缘计算,包括像那个思科等等这些,他们提出更多是网关的概念,智能网关的概念,包括不同的数据接入端的一种协议的转换,或者说一些非常简单的处理,这个他们会认为这是一种边缘计算的概念,这也是现在大部分人一提到边缘计算的第一反应。而我们现在在做的工业里面的边缘计算,它其实比这个要有更多的一些含义。除了我们刚刚讲的面向对象的接入,除了完成这样的一个任务之外,我们也很希望能够尽可能的,把一些信号处理或者特征提取能够被标准化,同时我们叫做Computing Intensive的计算都放到边缘端去进行。所以我们对于边缘端的计算环境会有更高的要求,无论是基于工业PC的这种,我们叫RT的这样一个环境,基于这里面的芯片,或者基于FPGA这样的一些方式,其实我们现在都面向一些对象,就像我们讲的Add-on AI,就是它有一个计算环境,同时放进这样一个服务,每个模型都可以变成一个服务,那么在这个过程当中我们现在也做了很多的应用,它面向的应用场景在于,如果我面向的是一个设备的个体,那这个设备个体它所要完成的任务,或者说它所要执行的业务的内部闭环流程,比如说面向一个风机而言, 那么这个风机的控制参数、控制策略的优化,完全可以在这个风机内部进行,而不需要与其他的风机或者这个网络产生任何的关系,这个时候我们就可以把这样的一些业务全部集中在Edge端统一完成。还有我们现在做的比如高铁的项目,那么它的Edge端的作用就是把高频的信号,比如说一百兆每秒这么大的一个数据的流量,这么多的数据,在边缘端能够把一些信号处理和特征提取做完,然后传递出来一些结论性的特征,或者能够支持进一步决策的下一步分析的特征,大概可以做到10KB这样一个水平,这个时候它的价值就会很大,因为它可以减少很多数据传输带来的成本和资源的占用。

   

6. 像天泽智云主要做的是工业智能,将人工智能在工业场景上面落地跟它在比如说一些消费场景上面落地,会有哪些不同的挑战呢?

刘宗长:我觉得最大的挑战可能来自两个方面,第一个方面就是来源于工业,传统的互联网里面更多的是2C的一个状态,那么工业里面肯定是2B的一个状态,客户的属性还有技术解决方案本质上来讲是有很大不同的,那么我总结下来,可能有两个是非常重要的,第一个是在互联网里面,它更多的是,我们怎么去设计一个场景,比如说支付等等。任何一个产品,比如说滴滴打车,就是原来不存在,后来凭空创造出来一个新的场景,这就是为什么我们说互联网的分析是发散式的,这种场景是源自我们每个人生活当中可能出现的,我们都可以很好理解的。而工业里面最大的问题,是我们不会因为有了AI,就创造出来一个新的场景,这是很难的,我一定是对里面一些已有的业务场景进行服务。第二个,这里面的场景它有大量的领域知识,有大量的机理知识,还有大量的工艺流程的知识,这不是说我们在日常生活当中就是说每个人都能够去做的。这里面最大的一个门槛,就是大家不是讲同一种语言,他们很难理解,这里面工业里面的场景是什么,这是一个门槛;第二个门槛就是在于说,我们在2C端的时候,大家社会的组织没有那么强的标准化或者说体系性,大家对于一种新的东西的概念接受程度是非常强的,但在工业里面,如果说有个新的一个系统,因为AI本质上来讲,也是个新的系统,那么它要被引入到工业界,那么它一定要解决就是我们刚也提到两个S的问题,第一个就是标准化的问题,Standard,怎么跟已有的标准去结合,不能说原来的工业系统是这样的标准,新的AI系统进来以后,我发现跟原来的标准没有办法去对接,甚至产生了冲突,这个工业系统也是没有办法接受的;第二个就是我们叫做Sustainable的概念,就是为什么要有标准,它的原因是因为只要按照这样的标准方式来,就可以不停的复现、不停的成功,但是现在大部分的AI场景很难实现这种Sustainable,比如用深度学习的技术,没有办法保证你训练的模型跟我训练的模型结果是一样的,哪怕我们用的是同样的数据。如果我们用同样的一个技术手段、同样模型都不能保证结果是一样的,那么我们在后面也没有办法保证它是一定能够持续被使用的。所以我认为可能这两个是特别大的一个难度。还有一个就是集成(Systematic体系化)的问题,因为AI的系统要进到工业界,就要跟已有的系统集成,两个方面,一个是信息系统方面,它怎么跟已有的这些信息化的系统去对接,第二个就是跟它的Operation层面,运营层面怎么去对接,这里面又牵扯到生产组织管理的问题,还有整个操作习惯的问题,还有甚至是整个工作流里面的变化的问题,这个也是一个很大的挑战。所以说,AI落地到工业里面,我们觉得,它一定不能是一个颠覆者的姿态,而是要融入,一定要基于工业已有的东西。工业已经发展了那么多年,它的体系已经那么成熟,AI在里面,更多的是怎么去赋能、怎么在原有的基础上再去提升它的能力,这是我们对这个问题的理解。

   

7. 天泽智云的工业智能解决方案已经应用到了哪些行业和客户中,给他们带来了怎样的提升效果,能否给我们举几个例子?

刘宗长:天泽智云的目标是10年100个工业场景,这个目标还是比较大的。我们目前已经进入的一些领域,包括像交通领域,如船舶、轨道交通这些,今年我们还会再进入到车联网,这是我们面向的整个交通的这个方面;在能源这个领域,像风电和火电,这两个我们现在也都有了项目正在进行,那么今年的话,我们会进一步的到核电,还有包括像太阳能等等这些,还有多能互补,就是微网或者混合能源这样一些领域。第三个方面,我们其实正在关注制造场景,制造场景里面尤其是基础工业,也是我们非常关注的,在这里面我们也有一些合作伙伴。因为基础工业关注的是整个运营效率的提升,所以在这里面,我们的合作伙伴来自于过去专门为企业提供咨询服务,比如资源有效性运营的咨询服务。我们在里面的价值是,能不能把这些传统的依靠人的组织的训练,依靠人的经验这些方面,把它固化成为在信息系统里面,或者用AI来驱动,这个是我们关注的领域。为什么关注基础工业?是因为基础工业的盘子很大,比如一个钢厂每年有三百亿以上的销售额,如果能够给它提升1%的效率,那么它的经济价值是非常高的,而钢铁这一个行业又占了中国10%的GDP,如果我们在基础工业当中能够提升它的运行效率,对于整个经济的运营效率,它的撬动的杠杆率是非常高的,这是我们关注的几个方向。

   

8. 最后一个问题,您觉得现在工业智能的发展处于一个什么样的阶段,未来它还会怎样变化?

刘宗长:差不多从2017年的年底才开始提到工业智能这个概念,所以工业智能应该还处于非常早期,但是我们也应该说,现在虽然还比较早期,但是大家关注度很高,所以我们其实比较乐观说这个行业应该会很快地发展,因为我们也发现像有些巨头,微软、阿里他们现在也都开始把工业放到特别大的一个环节,今年10月份的时候阿里的云栖大会在北京召开时候,他们直接提到了说未来最核心的云计算也好,或者数据也好,最大的来源肯定会是工业,在这方面我们觉得接下来肯定会有很多人愿意进入到这个行业里面去做一些贡献,但是在这个行业当中形成一个标准,也就是我们刚刚讲的AI能够体系化地落地到工业场景当中,我们认为还是有很长的一段路要走。在这个过程当中我们要解决的几个问题,还是我刚刚提到的,怎么解决它的标准化问题,还有它的体系化问题,还有它的可持续,就是说可复现这种可靠性的问题,这几个如果能够被解决的话,那么我们认为其实工业AI就算真正落地到工业场景里面去了,这三个问题只要一突破,后面肯定能够非常快进行复制的。因为我们现在已经发现,当我们落地到一个场景去,插上第一个旗帜或者打上第一个桩的时候会有很多的困难,一变成一百的时候还会有些新的困难,我觉得现在大家都在打桩了,就是都在做一个第一个场景,这个做完了之后,我们接下来面临的挑战就是怎么从一个个的点变成一个网,真正实现规模化的复制。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT