BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

01:13:09
他的粉丝

开源分布式监控 CAT 系统的高可用实践

作者 吴其敏  发布于  2018年4月23日 作者 吴其敏 关注 2 他的粉丝  发布于  2018年4月23日

线上发布了服务,怎么知道它一切正常?为什么一个低级错误,需要花一个通宵、十几个人来排错?某个核心服务挂了,导致大量报错,如何确定到底是哪里出了问题?应用程序有性能瓶颈,如何提供一些有效工具发现?该主题主要分享 CAT 系统的高可用架构设计思路、应用实践以及如何提高业务系统的敏捷性和伸缩性。

46:16
他的粉丝

滴滴出行海量数据场景下的智能监控与故障定位实践

作者 李培龙  发布于  2018年3月8日 作者 李培龙 关注 0 他的粉丝  发布于  2018年3月8日

随着系统复杂度提升,监控报警后故障的定位难度越来越高,定位速度缓慢,我们借鉴Google的Dapper在滴滴落地了系统调用链路追踪系统,同时融合了滴滴自身的司机、乘客与订单的业务链路追踪技术,使得业务与系统故障时可以快速的进行数据关联与追踪分析,精准定位问题根源,整体故障定位效率大幅提升。

39:37
他的粉丝

全方位的监控与智能透明的自动化运维

作者 邸富杰  发布于  2018年3月1日 作者 邸富杰 关注 0 他的粉丝  发布于  2018年3月1日

Monitoring是什么?Monitoring需要做什么事情?作者会从2个不同的维度出发来展开这两个问题,阐述monitor要“两条腿一起走路” 的两条腿分别指什么,并提供全套开源工具链供参考。 你认为的自动化运维是什么?自动化脚本?不完全是,作者会结合过去2年来ChatOps的实践,来阐述如何通过chat bots来实现透明的自动化运维以及所带来的益处。

46:58
他的粉丝

腾讯海量监控包袱与创新

作者 聂鑫  发布于  2018年2月16日 作者 聂鑫 关注 0 他的粉丝  发布于  2018年2月16日

腾讯社交业务规模庞大,历史悠久,架构复杂。从运维的全局角度来看,无论从运维技术还是监控难度都很大。 传统的监控手段和思想已经无法应对如此海量的场景,腾讯社交网络运营部历经十年的建设,在运维监控领域经过了多个建设阶段。 近几年通过创新的方法引入了多种技术手段并实践落地,将监控技术带入一个新的运维高度,本次将主要分享四个创新技术点。

42:07
他的粉丝

PayPal 实时风控大数据平台:打破大数据和快速数据的界限

作者 Gurinder Grewal  发布于  2018年2月8日 作者 Gurinder Grewal 关注 1 他的粉丝  发布于  2018年2月8日

PayPal 的风控与合规管理平台支持无比安全、可信的数字支付。PayPal 用户可以安全地在 200 多个国家间付款。PayPal 是如何做到的呢?

41:13
他的粉丝

阿里巴巴监控之路

作者 程超  发布于  2018年2月6日 作者 程超 关注 2 他的粉丝  发布于  2018年2月6日

这次主要讲的是海量实时秒级监控系统,以日志、REST 接口、Shell 脚本等作为数据采集来源,提供系统、应用、业务等各种视角的监控能力,从而帮助业务快速发现问题、定位问题、解决问题,为线上系统可用率提供有效保障。

37:32
他的粉丝

基于资产配置业务场景下的全链路监控平台

作者 王晔倞  发布于  2018年2月2日 作者 王晔倞 关注 0 他的粉丝  发布于  2018年2月2日

随着系统平台化的演进,服务拆分越来越精细化,原本依赖于总线交互的功能模块都被分散到了PaaS中,形成了“微颗粒”。在松耦合给产品带来“快速交付”的同时,发现故障 、定位故障、排除故障却变成了测试、运维同学“烦恼”的心事。在“互联网金融需要实行强监管”的体制下,在“监管细则划定13条红线 ”的背景下,如何在互联网金融公司中,寻找到“快速排障”与“快速交付”的平衡点?来听听好买的经历吧。

39:44
他的粉丝

质量实时监控:全球音视频实时传输的关键帧

作者 何丰  发布于  2017年12月25日 作者 何丰 关注 0 他的粉丝  发布于  2017年12月25日

本次演讲主要分享如何通过大数据平台解决全网音视频传输的实时质量监控问题。 在全球实时音视频传输过程中,会面临很多实时监控挑战,比如设备、服务器全球分布很广;移动设备种类太多;数据指标不够详尽;时间序列的存储需要优化等等。

32:39
他的粉丝

实时音视频质量评估与监控

作者 陈若非  发布于  2017年7月7日 作者 陈若非 关注 0 他的粉丝  发布于  2017年7月7日

这次 QCon 分享,会详细介绍影响实时音视频质量的三大因素,网络问题、设备问题、物理环境。以及相对应的测试,评估和监控方案。内容上会着重对语音测试体系进行说明,同时也覆盖视频测试的评估体系,结合大量实践,为大家介绍不同质量期望下得测试评估和监控手段,便于大家更准确的评估音视频引擎质量。

34:07
他的粉丝

监控系统产品选型以及经验

作者 尤勇  发布于  2017年3月8日 作者 尤勇 关注 0 他的粉丝  发布于  2017年3月8日

这次演讲会从监控的各个层次,移动、应用等各个层次讲诉点评在监控领域做的工作以及一些实战经验,希望能让大家对今后的监控选型有所帮助。

25:34
他的粉丝

京东大促之大规模分布式监控系统实践

作者 鲍永成  发布于  2017年2月22日 作者 鲍永成 关注 5 他的粉丝  发布于  2017年2月22日

京东业务壮大,特别是大规模容器落地后,对基础监控带来挑战。在此背景下,带领团队自研 light 监控平台(内部名称 mjdos 系统),帮助运维和研发同事更好的监控运维业务系统。 light 分布式监控平台特点: 支持容器类型监控数据采集; 全容器化部署,弹性伸缩; 支持跨 IDC 部署和感知; 海量监控采集点; 监控能力平台化 & 开放 API。

44:56
他的粉丝

全景业务监控平台(Goldeneye)

作者 马小鹏  发布于  2017年2月14日 作者 马小鹏 关注 1 他的粉丝  发布于  2017年2月14日

全景业务监控平台(Goldeneye)是阿里妈妈在业务监控方向上的一次大数据应用创新, 相比传统的同环比报警检测方式精确度更高。本次演讲向大家介绍一种基于数据统计分析的业务监控检测方法,通过收集监测数据的样本,并使用智能检测算法模型,让程序自动对监控项指标的基准值、阈值做预测,在检测判断异常报警时使用规则组合和均值漂移算法,能精确地判断需要报警的异常点和变点。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT