BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

rss
46:16
他的粉丝

滴滴出行海量数据场景下的智能监控与故障定位实践

作者 李培龙  发布于  2018年3月8日 作者 李培龙 关注 0 他的粉丝  发布于  2018年3月8日

随着系统复杂度提升,监控报警后故障的定位难度越来越高,定位速度缓慢,我们借鉴Google的Dapper在滴滴落地了系统调用链路追踪系统,同时融合了滴滴自身的司机、乘客与订单的业务链路追踪技术,使得业务与系统故障时可以快速的进行数据关联与追踪分析,精准定位问题根源,整体故障定位效率大幅提升。

37:22
他的粉丝

阿里巴巴故障治理领域的智能运维实践

作者 王肇刚  发布于  2018年2月24日 2 作者 王肇刚 关注 0 他的粉丝  发布于  2018年2月24日 2

本次演讲将介绍智能运维理念在阿里巴巴集团的业务故障管理领域落地的整体思考和实践成果。

28:55
他的粉丝

基于日志trace的智能故障定位系统

作者 曹轩  发布于  2018年2月4日 作者 曹轩 关注 0 他的粉丝  发布于  2018年2月4日

结合机器学习技术的进步,实现一套基于日志trace的智能故障定位系统及其背后的一套技术方案,主要基于以下技术:1.基于GBDT的单PV根因预测模型;2.数据多维度汇聚与维度间信息熵排序;3.智能抽样系统;4.数据获取异步化、维度逐级下钻等一系列工程优化;最终能够实现WQPS/sec的PV根因定位能力,并能够根据根因做统计上的多维度汇聚,该系统应用于百度核心搜索系统,极大提升了重大异常问题定位效率。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT