BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

专访IBM陈谷:拥抱开源紧跟趋势, AI更贴切的理解是Augmented Intelligence
录制于:

| 受访者 陈谷 关注 0 他的粉丝 作者 InfoQ 关注 9 他的粉丝 发布于 2017年6月28日 | Google、Facebook、Pinterest、阿里、腾讯 等顶尖技术团队的上百个可供参考的架构实例!
33:59

个人简介 陈谷,全球杰出工程师、IBM云计算事业部大中华区首席技术官、IBM全球技术研究院领导团队成员、全球高级认证信息专家。北京大学计算机系软件专业学士、北京大学管理科学中心管理学硕士。1991年加入IBM, 先后在IBM深圳、日本大和实验室、上海软件中心、广州软件部、多伦多实验室、温哥华太平洋开发中心、亚太新产品促进中心任职。主要从事软件产品和项目的开发以及IBM软件产品的技术支持。现任IBM云计算事业部大中华区首席技术官,负责IBM云计算及软件新产品在大中华区的推广与支持,同时也是IBM全球技术研究院领导团队成员及IBM全球技术资格评审委员会的主要委员。

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。

   

1. 陈先生,您好,欢迎来到QCon2017北京站,跟我们的Qcon参会者还有InfoQ的读者招个呼吧?

陈谷:大家好,我叫陈谷,来自于IBM ,是IBM全球杰出工程师,也是我们大中华区云事业部的首席技术官,欢迎大家来到Qcon。

   

2. (杰出工程师,在IBM是技术岗位顶级的职位。)很荣幸今天能够邀请到您来到QCon2017,并接受我们的采访。我们知道云计算发展到今天,对于很多人已经是家喻户晓的事情,IBM相对进入的比较晚,那您从IBM的视野来看,云计算跟学术界,或者是市场上的竞争对手们解释,做一比较,包括现在IBM新的战略——企业级,数据优先,认知计算,这块给大家解释一下?

陈谷:说IBM进入云计算很晚, 我应该不完全同意,因为我本人07年就已经在做云计算的一些工作了,那时候到现在也有10年多时间了,云计算,大家都知道,实际上是指IT资源池,也就是IT资源可以通过网络,然后很方便的让客户直接使用,这个对IT行业本身来说是一个变革,同时也是一种新的商务模式的变革,因为以前很多商务和商业需要IT资源的时候,要先去搭一个IT的环境,现在呢,有了云计算,搭建这个过程完全可以省略掉,直接去使用云里头提供的IT资源,如基础设施的资源:服务器、网络、存储,同时还可以使用一些新的IT资源,比如像人工智能、认知的这些资源,在IBM实验室里头,很多研究成果现在都可以直接放在云里头提供给大家使用,这样的话,大家在做一些新的业务的时候,这些新技术就完全可以得到很快地利用。所以说,云计算本身也是一个业务创新的平台。对于IBM来说,云计算和认知,是两个最主要的技术领域,IBM的一个想法就是通过云计算可以把人工智能、或者认知的能力提供给最终的用户,然后让用户能够很快的使用到这种认知计算能力。另外,我们会注重行业的解决方案。原因是IBM还是以企业为首要服务的对象,提供企业级的服务。行业本身是由行业知识和行业信息支撑的,而且知识和信息都需要通过积累才能够实现。IBM的目标是通过人工智能的能力在云计算中给行业提供很好的解决方案。

   

3. 那您认为就是这个云计算的这个核心竞争是什么?到目前为止IBM在这方面做得怎么样?

陈谷:在云计算中,有两个核心技术,第一个是网络,因为云计算都是通过网络提供的,如果你的网络不好,网络的性能或者说安全有些问题的话,你的这种云计算的服务肯定都会有问题,第二个,叫持续运营,或者有另外一个词叫DevOps,也就是说开发、运行和维护的环境是一体化的环境。通俗地说,一旦云计算提供了服务之后,你就不可能说,中间停一段,我再提供服务,而是说你要一边让你的客户用,一边再更新,而且云计算发展速度非常非常快,新的技术、新的服务不停的在这个平台上出现,换言之,基本上你应该是每天都会有更新,也就说你这种持续更新是每天都在发生的,怎么样具有这种持续更新的运营能力是云计算的另外一个核心。IBM在整个云计算方面是有五个特点,第一个特点叫作一致性,一致性是指我们全球有超过50个数据中心,50个数据中心之间都是相连的,而且使用上是一致的,这会解决你网络的问题,解决你全球使用的问题,你可以自己选择你要的云,在世界的哪个区域和地方,但不论在哪里,使用的界面都是一致的。第二点,就是持续运营,IBM在持续运营方面,已经有很多经验了,而且我们有很多的产品来帮助做这种持续运营,比如说早期的Rational产品,还有我们现在经常用的叫UrbanCode这个产品,这个产品就是帮助你从早期的IT开发到现在云的运维,都能够做到持续运营,解决持续性- DevOps开发跟运维一体化的问题,另外IBM还提供了一些方法论来帮助你解决这些持续运营的问题。第三个特点,是指IBM对混合云的支持,IBM已经成为全球最大的混合云运营和支持厂家,而混合云是未来云的常态,因为在公有云之后,还有很多客户需要把自己重要的数据放在私有云中,最终会形成这种混合云的状态。第四个IBM云的特点是具有数据分析能力,在IBM的云平台上集成了很多IBM积累多年的数据分析和处理的服务,数据是每个企业,每个用户的核心,处理好数据是每一个企业的自然需求。第五个特点,IBM在云中提供了最核心的Watson的能力,Watson 是IBM云平台上的认知服务,或简单的说是人工智能的服务,是IBM投入大量资金和人员,与全球实验室一起研发,提供的服务,也是公司的发展策略。我举个例子,比如说我们在Watson里头提供了一个叫图像识别的服务,实际上IBM有个研究院的团队做了20多年的图像识别,也就是说图像识别不是一个全新的东西,只是成熟度越来越高,但是在早期的时候你要用到这个图像识别的能力,你必须要找到研究院,然后呢,你要去搭个类似的环境,在你家里头,IBM派人来帮你搭,几个月后,你才可以使用。现在IBM把这种新的技术,直接放到云里头,你只要培训一下,为什么要培训一下呢?因为普通图像识别,你当然马上就可以用,但是识别率不高,经过分类培训以后,你的识别准确率就会非常高。总之,IBM的五个云计算的特点,使得客户可以更高效率地使用云,并充分发挥出云带来的好处。

   

4. 我突然想起个问题,就是说去年像亚马逊的AlexA或谷歌的Home,那种语音识别,我知道IBM在语音识别这块是很厉害的,不知道IBM现在是否提供这种语音技术或者是服务?

陈谷:在语音这块, IBM是有很大的投资的,我们现在的着重点会放在后端,也就是说语音本身的识别这个并不是IBM主攻的方向,但IBM会在语音识别完了以后,提供后面的分析,比如说内容的分析、语调的分析等等。语音转成文字之后,再对你这句话进行分析,所有这些分析的能力呢,都是IBM最强的,而且整个自然语言的翻译,以及自然语言的对话,上下文文本的关系,都是IBM非常强的领域,现在IBM的云里头,已经提供了Watson的服务和这些类似的能力。

   

5. 我突然想起前几年,有个很流行的叫SOA,面向服务架构,后来云计算发展,对面向服务架构,IBM之后转型到了云计算领域,现在不再提SOA这个词?

陈谷:也不是不提,说起SOA呢,我自己也有很多客户,他们一直在做SOA,SOA做到现在,企业里头已经做得非常好了。SOA有服务的总线,各个服务都接到这个总线上面去。现在在云计算领域呢,又有一些新的发展,在云计算里头,你会听到一个词叫微服务,微服务在某种程度上,跟SOA是有关系的,但不能说是完全替代,原因是:微服务首先是一个服务的概念,而且这个微服务本身,是更松散的,也就是说它本身的运营是独立的,它不需要总线。因为SOA有个总线在里头,它还是一个大的整体,而Micro Service-微服务,可能是在云计算里头不同的厂商提供的服务,通过云计算结合起来,来完成一个业务。现在越来越多的,比如说像这种翻译,可能不是你的专业,但是你需要用这个翻译,你可以去通过调用API,来调一个微服务,解决你这个翻译的问题。从云计算本身来说,是在往微服务的发展方向走,那你企业SOA未来,也会向API的和微服务的方向走,原因是你SOA做完之后,你才可能把你自己企业的服务变得像微服务一样展现出来,让别人使用,这个过程并不矛盾,而且这是一个持续的过程。

   

6. 那这就涉及到一个就说微服务它有一个很重要的支持RESTFul协议,然后,比如说websphere过去的有ESB这样的总线形式的框架,涉及到的协议有SOAP等,你觉得它们之间是怎么转化?

陈谷:这个技术转化是没有问题的,现在也有很多工具可以来帮你做,而且SOA本身的发展也会支持RESTFul,对RESTFul来说,它是相对比较松耦合的一种方式,所以调用起来比较方便。IBM在这个领域也有很大的投入,我们有专门的一个产品或者说我们有一个类似的服务,叫做API Connect,这个也是IBM通过自己的一些经验,以及业界一些比较好的企业收购,像StrongLoop,提供了API的构建和运行环境,之后再提供API的管理和安全,形成一个全生命周期的API的管理、监控和应用。这个很重要,原因是API现在越来越多,使用起来越来越方便,我举个例子,像我自己遇到的,今年,我在注册我自助交税的帐号时,它要验证我的个人身份,然后就连到一个银行界面去了,要求你通过银行来验证,你输入银行卡、姓名、证件号码等。很明显,它是在调用一个银行的API做身份的验证。现在越来越多的应用可以去调用外部的API,但是随之而来,API的监控和管理可能就会成为一个问题,因为每个程序都可以去调,那你调了哪些API,是不是安全,都有可能会成为问题的。另外越来越多的API的提供者,都在提供API,那么,都有谁调了API,这个也是你需要去管理的,也就说,未来是需要有一个API平台来管理的。IBM现在就提供了这个平台,一种方式,IBM在云里头提供这个平台,另一种,你可以使用IBM的软件,搭一个API的管理平台。将来谁来调用你,还有你调用了谁,等等这些信息,都可以很容易管理了。

   

7. 我们谈一下这个传统的虚拟化技术,比如说IBM和VMWare合作,同时IBM也是最新的像CNCF、OCI等组织成员之一。那么IBM是怎么考虑这种传统的虚拟化,跟现在容器这种技术?

陈谷:IBM跟VMWare合作主要是在企业应用这个领域,因为VMWare在虚拟化市场上的市场占有率是非常高的,我们有很多的企业在用VMWare做虚拟化环境,IBM跟VMWare的合作主要是我们会在云里头提供VMWare的服务,也就是说以前的一些VMWare的用户,现在有了新的业务需求的时候,可以很容易扩展到云里的VMWare,那就是通过IBM这个云的平台,就可以用VMWare了,而且因为应用跑在VMWare里头,所以对应用本身的改造是不需要的。那好处呢,你这些应用可以用到云的一些特点,比如云的快速部署,云可以自动扩展,云里头还提供更多的服务,这些能力,以前你跑在自己家里VMWare的环境中是得不到的,现在跑到云里头你就很容易做到,这个也是IBM跟VMWare合作的最主要的合作点之一。从企业用户来说,我们现在在全球这个范围内,可以看到,越来越多的客户通过VMWare在云里的这个服务得到了一些好处。另一方面,您刚才也提到了容器,容器现在是非常热的一个技术,原因是容器用起来非常简单,而且容器本身是轻量级的,它跟VMWare比起来,要轻量得多,但是隔离度是不一样的。容器本身也会有些问题,比如说它的管理,容器数很多之后,几百个,几千个,上万个时候,企业越来越多会遇到新的问题,容器的编排和管理都会是很大的挑战,所以IBM在容器跟虚拟机技术上都会支持,在容器本身呢,我们也很看好这个发展过程,也在积极实践,尤其在运维跟管理方面,我们也提供了很多好的做法,一个就是在云里头直接提供容器的服务,另一个,我们自己也在研究更好的管理方法。

   

8. 您刚才谈到了大量的容器,这就会涉及到编排问题,那么现在就是有个很活跃的项目叫Kubernetes,上个月他们在德国刚开完一个CNCFCon大会,会议之后,我看到了一条消息说IBM就立马提供了Kubernetes这样的服务,那么您谈谈它的背后的这个技术思维?

陈谷:刚才有提到,容器是这么热,IBM也不是现在才去研究这些东西。IBM已经做了多年的容器的研究,并且始终在考虑如何能够提供最好的,最方便的服务给到我们的客户。IBM现在已经正式宣布我们会提供、并且已经提供了Kubernetes Cluster服务,为什么要提供Cluster服务呢?刚才我提到单个的容器没有特别大的意义,但我们提供的是Kubernetes Cluster,是集群服务。你一旦使用这种服务,你可以利用到Kubernetes Cluster的编排功能,同时你也具备了容器的能力,当然IBM也融入了一些新技术在我们提供的Kubernetes里头,我们有Master node 和Work node,Master Node主要是管理结点,而Work node是最终客户跑应用的容器结点。IBM在云里头的做法是,如果是客户跑自己应用的工作结点,它是专有的,就是我分配给你了,这个结点就是你自己的,或者说是单租户的,但是管理结点呢,就是一个多租户的,因为云里头你需要有多租户的管理,是一个共享机制。管理结点跟工作结点也会有结合,在这种情况下,我们实际上充分利用了云的技术和容器的技术,通过自动编排,使用户用起来会更加方便。

   

9. 谈到Kubernetes,就现在开源是非常出名的形式了,IBM一直一来都是开源的主力军,像当年的Linux,像贡献Eclipse,那么现在包括从OpenStack之后,IBM这两年,就关注开源逐渐不是那么高调了,就是您谈谈IBM对于开源的战略是怎么考虑的?

陈谷: IBM始终是开源的一个主导者,还是一个推行者。比如说像Java、OpenStack、Cloud Foundry等等都不是IBM提出来的,IBM也不是第一家作主推的,但是IBM是主要的推广者,通过IBM的推广,这些开源项目都得到了广泛的使用。另外,开源本身会引导某些科技方向,所以IBM自己在做一些新的项目时都会开源,比如说现在在做的事件驱动的服务,叫作OpenWhisk,其实原本叫Whisk,我们加了个Open,就把这个原代码开放出来了,包括我们现在的Blockchain区块链,也开源了,变成了Open Blockchain,也叫超级账本的项目,都是开源的项目,这些是IBM主导的。所以不是说IBM不关心开源了,而是会把需要开源的代码在合适的时间全部开源出来,但从商业运维的角度来说,你只是拿开源的代码搭出来的项目,是缺东西的,比如说我拿OpenStack,搭几个虚拟机,很快就能搭出一个简单的云环境来了,提供基础架构IaaS虚拟机的服务,但是你真正要做个生产的环境,这个差得还好远,因为你缺少安全,缺少管理,缺少监控,缺少很多基础组件,比如说像OSS,BSS这种计费模块你都是没有的,而这些东西才是你一个云运行的最核心的东西,你如果没有这些东西,那你的云服务,在真正的商业化环境中,是完全不能用的。这就是开源和最终商业环境的一个差异,我觉得从用户角度来说,作为研究性质,用开源是最好的,但是如果你需要一个商业的环境,你就要平衡一下。不是说所有东西都是用开源代码可以搭的,我自己都遇上过一个案例,我们国内的一家企业,它想做一个非常大的中间件平台,这个平台里头有很多的组件,它就把业界的每个组件的最好的开源的代码都拿了过来,把原代码堆在一块,试图做出商用的平台,做了两年,出现了各种各样的问题,兼容性、性能等,发现差得很远,最终还是放弃了。所以,开源和最终的商业环境一定要平衡好,只有这两个因素平衡好,才能做到:既能够满足最终用户的生产环境,又能够达到让大家一起来推动这个代码往前发展,因为开源的一个好处,就是很多人可以去改进代码,每个人都可以有想法,也就可以让这个代码对应的技术得到更好的发展。

   

10. 那我理解,就是IBM没变初衷,您刚才提到那个超级账本,IBM有一个动作就是把超级账本作为一个主要的服务推出,你能跟中国的用户谈谈它这个背后的技术或者是一些主要的应用场景?怎样看待区块链的发展?

陈谷:最近区块链应该是最热的一个题目了。我们今天上午也有个区块链的演讲。区块链简单的说呢,它是未来的分布式交易的一种可信的系统,原先交易其实都是有一个核心的数据库,大家交易都是通过数据库去做,但是现实中的很多交易,尤其在跨界的时候,是很难做到通过一个数据库去交易的,我举个真实的例子,比如商业医疗保险,病人去医院看病,看了病之后,他要去报销,但商业保险公司并没有办法拿到病人在医院看病的信息,只能是病人自己提供,比如说复印一下病历,或者寄张照片来做这个事情,如果有了区块链这种技术,我们能够让这些数据都放在一个公共的区块链平台上,保险公司只能看到它需要看到的数据,别的数据是看不到的,这样的话,这种跨界的交易就有可能实现了,也就说区块链解决了一个最大的问题,那就是信任的问题。IBM是目前主要的几个做区块链的公司,每家公司的着重点也有所不同。基本上区块链有两种,一种叫公有链,另一种叫联盟链,公有链就是谁都可以参与的,也是去中心化的,比如像比特币,只要是公有链,大家都可以加入,然后去参与整个区块链的交易过程。IBM建议的是联盟链,也就是说需要指定参与方,而不对所有人开放,这样更容易实现联盟间的交易。区块链有四个最核心的组成部分,第一个是共享帐本,就是日志记录,这个是区块链的基本,大家都要做。第二个叫做智能合约,谁能够去写这个记录,什么样的情况下可以写,怎么写等等,都由智能合约来规定,IBM会非常注重这个智能合约,因为在联盟链里,并不是大家谁都可以参与,我们会规定谁可以做什么事情,在什么情况下做,交易的规则是什么,都是通过智能合约实现的,所以在联盟链里,智能合约是核心。第三个叫共识机制,就是说要有一个机制来判断你的交易是正确的,而不是假的。如果每一个参与方都认为你这个交易是正确的,那这个交易就应该是正确的,是大家的共识,或者说你有个算法,一半人认为是正确的就算正确,也是可以的。共识机制在公有链里头会变得非常的关键,因为谁都可以参加交易,那你怎么知道我手里拿到的这个比特币是真的还是假的?目前它是靠计算来实现的,它会用计算机的这种共识算法来验证我的交易是正确的,因此,公有链里的共识机制是要花很多精力去做的,但是在联盟链里,共识机制会稍微简单一点,因为参与方毕竟是有限的。区块链的第四个核心,也是最后一项是指隐私保护,这个一定要做的,因为信息一旦放入区块链里,只有你自己和授权的人可以看到你的信息,别人不可以看到,这就是指隐私。因为区块链的内容很多,我们现在就谈到这里。

   

11. 也是重点推这个技术。然后在前阵子,谷歌Next大会上提出一个理念叫云计算的民主化,和AI的民主化,那个包括Salesforce的老板也说民主化,您怎么看待这个“民主化”这个词?包括Waston在医疗行业中的应用可以理解为其中的一种形式吗?

陈谷:民主化,我觉得这也是IT的一个发展过程。我本人就是计算机系毕业的,当时学计算机,还是比较少的,因为一年,也就是一个系不到一百个学生,研究生当时更少,一个导师只能带一个研究生,每年毕业的研究生很少,也就十几个。那个时候,IT还是比较专的,但是现在,很多人都会做IT的东西,也不一定非得计算机专业毕业的才会用,很多东西已经越来越简单了,手机和电脑使用起来也越来越方便,所以这个民主化的意思,就是说被大众更容易接受,这是我自己的理解。那从云计算说起,一旦网络通了,就可以使用云里的资源,价钱也越来越便宜,那为什么不用呢?原因是还有一些技术问题需要解决,比如安全问题、高可用问题,但这是云厂商的问题,厂商应该解决这些技术问题,而不是使用者,所以,确实可以看到用云的人越来越多。这就是一个过程,当然我们现在跟北美比,还是有些差距的,北美基本上公有云已经完全认可,企业也完全认同公有云。中国还在一个发展过程中,我们首先还是私有云,其次才是公有云,因为我们要解决私有跟公有之间这种定性的问题,另外还有安全的问题,中国目前没有发文说,哪些云服务可以用,哪些不可以用,这就需要一个成熟的过程。另外从AI本身来说,人工智能这块内容越来越多了,也越来越热,IBM对人工智能来说,有自己的理解,人工智能不是替换人类,而是说帮助人类,我们认为AI是Augmented Intelligence增强智能,而不是叫简单的Artificial Intelligence人工智能,比如说像Watson,它是帮助人类去诊断,如肿瘤病人之类的,而不是简单地替换医生。所谓IT的民主化,也就说人工智能本身通过云计算方式,更多的被人使用,比如说图像识别,以前你是很难用到的,因为你要找研究院去做,那就可能性很小了,但是现在已经云化,通过图像识别的云服务,你就已经可以使用这种技能了,当然可能刚开始你用的图像识别效果并不是特别好,因为你没有培训它,但是经过你的培训,比如说培训识别某种车,给它500张照片,这是好的车,再给它500张不太对的车,这样培训完了之后,它的识别率可以达到90%,或者到95%以上,这样实用性就非常高了,一旦它再通过云的方式提供给大家,大家用的也会越来越多,这些技术也就会越来越成熟。举个例子,像指纹识别,现在的正确率已经非常高,所以你可以看到,在海关出入境管理中,已经大量使用,我现在入境的时候,把护照往那儿一放,按个指纹,就过了,这不就是就靠指纹识别做到的吗?这就是人工智能发展的过程,也就是说民主化的过程本身也是随着技术的成熟会越来越好。

   

12. 最后一个问题,您作为IBM技术工程师,您给我们Bluemix或者是softlayer这样的工程师提一些建议,或者是一些补充的话语?

陈谷:我在想,作为技术人员,学习永远是第一位的,从我本人的经历来看,一开始在大学学东西,这还是专门的学习,到工作,首先是被动的,我被要求学很多东西,之后呢,我就变成主动去学东西。这个学习呢还是有窍门的,不是说一定要从书本上去学才叫学习,学习的过程是在任何时候都可以发生的,比如说你去听一些讲座,甚至在跟别人在聊天过程中,你都可以学习。那我自己呢,印象特别深刻的是,在跟一些CTO和CIO沟通过程中,我发现,我是可以学到很多东西的,因为他们讲的内容都是他们自己直接的经历,但是我把这些内容总结起来,跟我自己的一些知识结合之后,提高深度,再讲出来的时候,CTO和CIO也会豁然开朗。所以学习就是核心点,你要不停的学习,始终保持热情去学习新的东西。另外我建议,如果你是一个技术人员,你未来应该有一个T形的技能储备,那T形的横是指你的广度,你需要去了解更多的新技术,不论有什么热门的话题,你应该知道这是什么,然后如果你有兴趣的话,你可以增加你的深度,也就是T的横可以更厚一点。T的竖线,是指你某个技能要能够深下去,而且要足够深,因为如果没有这个足够深的技能,你就不是专家。深的技能就是你的专长,使你成为某个领域的专家,而且你要靠这个技能吃饭的。这个深度要够深,如果你只懂一点点,很多事情还是做不了。这个T形就代表说,你要有一定的深度,又要有一定的广度,什么时候发展深度,什么时候发展广度?这是可以由你自己来决定的,也跟你的工作是有关的,一旦你的T形可以做得又深又广,那你的职业生涯也会做得越长越久越稳定。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT