BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

rss
他的粉丝

十万服务器秒级管控 腾讯云如何将AIOps用于日常管理?

作者 梁定安 关注 0 他的粉丝 发布于  2018年3月26日

本文将结合腾讯云织云体系的构建历程,详细讲解腾讯云是如何通过整合数据的智能存储和分析,对IT系统中各个环节的问题进行快速定位、故障排除和预测,为其他企业的AIOps落地实践提供一些方法、思路和解决方案。

他的粉丝

虚拟座谈会:聊聊AIOps的终极价值

作者 郭蕾 关注 9 他的粉丝 发布于  2017年9月19日

从历史发展的角度来看,这些年,运维平台大致经历了流程化->工具化->Web化->自动化的演进历程。随着运维管理复杂度的提升,以及企业自动化运维体系的成熟,运维平台必定会向智能化靠拢。而从结果来看,智能化才是运维平台的最终目标。正如InfoQ的另外一篇文章所言,在这个数字化转型的年代,任何使用传统技术来管理机器数据的企业要么是忽略了信息的价值,要么已经让他们的运维团队不堪重负。随着数据的暴涨,运维团队应该快速拥抱AIOps。传统AI仍然会在某些领域发挥它的作用,而AIOps将为企业带来最直接最深远的价值。

他的粉丝

Uber的SRE实践

作者 郭蕾 关注 9 他的粉丝 发布于  2017年9月5日 1

这几年,Uber成为了硅谷的一颗耀眼之星,它的全球业务呈现了爆发式增长,现在已经覆盖超过570座城市,如何为超过2000个微服务以提供稳定可靠高性能的计算存储支持是整个Infrastructure部门的工作重心,而其中SRE部门又是守护系统稳定的最后一道防线。Uber在很早之前就组建了SRE团队,为了了解Uber内部的SRE实践体系,InfoQ记者采访了Uber SRE存储部门高级工程师孟飞。

他的粉丝

赵成:回顾运维的发展历史,我相信AIOps是必然趋势

作者 郭蕾 关注 9 他的粉丝 发布于  2017年8月28日

如何理解AIOps?AIOps会涉及哪些技术?这又是一个新名词吗? 你认为AIOps是运维发展的必然趋势吗?从手工运维,到自动化运维,再到现在的AIOps,谈谈你理解的运维发展趋势?

他的粉丝

滴滴是如何高效率处理线上故障的?

作者 郭蕾 关注 9 他的粉丝 发布于  2017年8月24日

故障处理是每个系统都要面对的现实问题,但随着系统越来越复杂,故障的发现、定位、处理难度也将随之增大。滴滴现在服务近4亿乘客、1700多万司机、覆盖400多个城市,超过10个业务线提供服务,业务的高速增长对稳定性工作来说是个极大的挑战。为了了解滴滴在故障处理以及稳定性建设方面的工作,InfoQ记者采访了滴滴资深运维工程师张云柳。

他的粉丝

阿里巴巴国际环境下的SRE体系实践

作者 郭蕾 关注 9 他的粉丝 发布于  2017年8月4日

AliExpress是阿里巴巴国际电商平台,海外买家覆盖200+国家,分布广且离散,国际架构、网络体系复杂,为了提升全球用户体验面临诸多技术挑战。从2016年开始,Aliexpress就开始落地SRE相关的实践,并且收效颇丰。为了了解Aliexpress全球架构体系下的可用性解决方案及具体实践,InfoQ记者采访了阿里巴巴高级技术专家周志伟。

他的粉丝

AI时代,我们离AIOps还有多远?

作者 赵成 关注 1 他的粉丝 发布于  2017年8月1日 1

按照 Gartner 的定义,AIOps 是 Algorithmic IT Operations,但是在人工智能时代,可能很多的人会把 AI 理解成 Artificial Intelligence,不去纠结定义,我觉得本质上,想要表达的意思是一样的,就是让运维具备机器学习和算法的能力。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT