BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

智能时代的新运维

| 作者 InfoQ中文站 关注 21 他的粉丝 发布于 2017年9月15日 QCon北京2018全面起航:开启与Netflix、微软、ThoughtWorks等公司的技术创新之路!

目录

趋势总览

到底该如何理解AIOps?又如何落地AIOps?

运维技术大盘点,2017你该关注运维的哪一面?

无服务器计算的未来

先锋实践

阿里Goldeneye四个环节落地智能监控:预测、检测、报警及定位

京东618:升级全链路压测方案,打造军演机器人ForceBot

360:集预测、处理、关联和资源优化于一体的智能运维系统

卷首语

作者 木环

明者远见于未萌,智者避危于无形。   

 ——西汉司马相如《谏猎书》

纵观历史,运维技术经历了业务规模小的原始手工时代,ITIL管理概念下的脚本时代,和业务量增加原有情况难以维续的改革自动化工具时代。这与机械化、电气化和信息化的三次工业革命竟然有着异曲同工之妙。那么在社会各界纷纷猜测智能化可能引发第四次工业革命的今天,运维人是否应该开始思考智能化会给运维工作带来哪些影响呢?

人工智能的基础是要有可以计算使用的数据,而运维工作中从来不缺少数据,参照OSI七层模型,物理层、数据链路层、网络层、传输层、会话层、表示层和应用层都有传输给运维人的数据。AI对运维的影响并不是说说而已,也不是盲目炒作,业界已经有领先公司研究并取得了一定的成果:IBM使用了机器学习进行磁盘故障预测,Google研发Raft和Paxos算法解决其分布式系统的一致性,阿里基于时序数列预测业务异常,微软则使用智能机器人SREBot提升故障修复速度。百度研发的AIOps平台为例,其整体机制是搭建一个智能化的算法平台不断学习处理数据,学习积累沉淀出运维知识数据库,并在感知、判断和执行阶段更多地依靠机器工作。

其实挖掘运维数据隐含信息,也并不是新鲜想法,原来业界也早有尝试。ITOA(IT Operations Analytics),将服务和应用数据收集、综合分析、规律发现等流程自动化,在高度分布式、业务多样、技术栈复杂并且服务迅速变化系统中非常重要,相比人工手动,这样可以快速定位问题并且提高系统表现性能。这里的运维数据不仅仅指机器层面,并且也关注到是应用层面;这是在业界意识到数字化技术浸入到组织每个环节的时候,就已经开始思考和尝试的了。在一次与普元信息的专家交流中,专家提出AIDevOps是AIOps之后的新阶段。业界有一种看法是,DevOps是从开发端到运维链路的打通,但是真正可扩展化规模化的工作承受量则要依靠AIOps。

数据量巨大,工作繁琐,人工挖掘是吃力不讨好的工作,交给机器不是正合适吗?ITOA提出后,就有很多企业尝试进行IT数据的处理,但是那时候似乎没有找到正确的、有效的打开方式;有了机器学习和深度学习,挖掘数据信息如虎添翼,不必像以往单纯依靠传统概率统计论。 也正是因为机器学习和深度学习这样的重大突破之后,学术界已经研究了半个多世纪的人工智能再次回到业界焦点,并且被社会所广泛注视。

上图是Gartner给出的AIOps平台构成和价值图。除了上文提到的大数据和深度学习(算法)之外,还需要指出的是,AIOps是服务在商业价值的大范畴之下的,即通过AIOps平台,可以更加快速更加精准地进行监控、管理和行动,以此来更好地实现IT运维所需要支撑和实现的企业业务价值。新技术层出不穷,没有必要也不应该单纯地追逐技术潮流,必要的是有着客观理性的认识,这是一些冷静的IT高手们所常常提到的,“技术终究是要为业务服务的”。

而对于AIOps平台化的构成,有如下一张图,从日志、事件、监控系统、故障和工作任务等源头收集数据,通过大数据技术进行计算和分析,同时结合传统算法和机器学习技术将挖掘出的信息和认知可视化地呈现给运维人员。不过,具体到每个公司而言如何真正将AI融入运维或者在实现自动化运维之后如何更加智能,打开的方式和实践成果都会有所差别,因为各自的规模、技术力量、业务需求和组织架构不尽相同。

诚实地讲,在刚刚兴起的今天,AIOps是新概念,业界经验尚且单薄,很难现在就给出AIOps的确切且广泛适用的定义,哪怕是著名如Gartner;随着业界实践、反思和讨论的不断积累,AIOps的认知会发生演变。但是,有一点可以明确的是,AIOps所指代的整体趋势是毋庸置疑的,智能化会逐渐走入IT行业乃至社会生活的各个方面。确实没有必要夸大宣传AIOps会快速地彻底革新运维,不过见微知著、未雨绸缪和敏而好学终归不是坏事;当机器能越来越智能地工作,我们也应当变得越来越聪明。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT