BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

rss
46:16
他的粉丝

滴滴出行海量数据场景下的智能监控与故障定位实践

作者 李培龙  发布于  2018年3月8日 作者 李培龙 关注 0 他的粉丝  发布于  2018年3月8日

随着系统复杂度提升,监控报警后故障的定位难度越来越高,定位速度缓慢,我们借鉴Google的Dapper在滴滴落地了系统调用链路追踪系统,同时融合了滴滴自身的司机、乘客与订单的业务链路追踪技术,使得业务与系统故障时可以快速的进行数据关联与追踪分析,精准定位问题根源,整体故障定位效率大幅提升。

37:22
他的粉丝

阿里巴巴故障治理领域的智能运维实践

作者 王肇刚  发布于  2018年2月24日 2 作者 王肇刚 关注 0 他的粉丝  发布于  2018年2月24日 2

本次演讲将介绍智能运维理念在阿里巴巴集团的业务故障管理领域落地的整体思考和实践成果。

28:55
他的粉丝

基于日志trace的智能故障定位系统

作者 曹轩  发布于  2018年2月4日 作者 曹轩 关注 0 他的粉丝  发布于  2018年2月4日

结合机器学习技术的进步,实现一套基于日志trace的智能故障定位系统及其背后的一套技术方案,主要基于以下技术:1.基于GBDT的单PV根因预测模型;2.数据多维度汇聚与维度间信息熵排序;3.智能抽样系统;4.数据获取异步化、维度逐级下钻等一系列工程优化;最终能够实现WQPS/sec的PV根因定位能力,并能够根据根因做统计上的多维度汇聚,该系统应用于百度核心搜索系统,极大提升了重大异常问题定位效率。

29:43
他的粉丝

MTC2.0企业版解决方案发布

作者 李明  发布于  2018年1月15日 作者 李明 关注 0 他的粉丝  发布于  2018年1月15日

本次分享将全面推出MTC2.0企业版解决方案,包括专有云及私有云测试解决方案,适用于构建企业专属的自动化测试平台,从而形成完整的从公有到专有到私有的全系解决方案,满足不同客户各种需求场景。

38:44
他的粉丝

阿里电商故障治理和故障演练实践

作者 周洋  发布于  2017年9月26日 作者 周洋 关注 0 他的粉丝  发布于  2017年9月26日

本次分享会探讨经典的故障类型,剖析故障成因,提出解决方案,介绍故障演练系统的设计和演进,提出故障演练的原则和经验。

54:03
他的粉丝

大型商业银行故障处理实践-应急标准化方法论

作者 张春林  发布于  2015年10月7日 1 作者 张春林 关注 0 他的粉丝  发布于  2015年10月7日 1

本文通过定性和定量结合的方式,全面分析可能影响应急处置效率的各个环节和要素,提出了提升应急处置效率的方法,并基于分析结果和笔者实践,总结了一套应急标准化方法论,可为听众起到抛砖引玉、开拓思路的作用。

47:55
他的粉丝

基于SQL的秒杀解决方案

作者 楼方鑫  发布于  2015年7月2日 5 作者 楼方鑫 关注 0 他的粉丝  发布于  2015年7月2日 5

类似库存秒杀的业务非常多,比如抢积分、抢礼品、过年过节抢火车票、马拉松报名等,电商业务的库存处理要比想象中的复杂和困难,比如在双十一的超高流量基础上做秒杀,技术的因素是一个方面,还要结合非技术的因素,才能想到最佳的解决办法。

39:42
他的粉丝

分钟级故障恢复的高可用保障

作者 梁耀斌  发布于  2015年6月22日 作者 梁耀斌 关注 0 他的粉丝  发布于  2015年6月22日

这个topic将分享我们所定义的高可用标准,以及要达到标准中不同的能力级别可采用的技术方案。

44:50
他的粉丝

API单位误解造成的严重故障

作者 林昊  发布于  2014年8月6日 作者 林昊 关注 0 他的粉丝  发布于  2014年8月6日

这里也将给大家分享一个类似的API单位理解错误造成的严重故障

01:05:27
他的粉丝

支付宝弹性计算架构

作者 胡喜  发布于  2013年3月13日 8 作者 胡喜 关注 1 他的粉丝  发布于  2013年3月13日 8

主要介绍云支付架构发展历程,支付宝系统发展历程,面临的挑战,三代云支付架构,支付宝PaaS架构能力,PaaS平台架构,虚拟化,透明化管控,弹性,动态治理等方面的内容

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT