BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

  • 他的粉丝

    Prometheus原理和源码分析

    作者 杨谕黔 关注 1 他的粉丝 发布于  2018年2月2日 6

    Prometheus是一个基于Metrics的监控系统,提供了通用的数据模型和便捷的数据采集、存储和查询接口,同时基于Go实现也大大降低了服务端的运维成本。实际使用中笔者发现工程人员中普遍存在对Prom中客户端数据模型和PromQL计算逻辑的误解误判。本文分析了客户端和服务端的部分源码实现,介绍了客户端数据模型和PromQL计算逻辑,希望能为基于Prom的监控平台提供一些启发。

  • 他的粉丝

    新思路设计可视化大型微服务监控系统

    作者 张玄 关注 0 他的粉丝 发布于  2018年1月11日 1

    随着微服务在生产实践中被大量使用,后台系统中的服务系统数量暴增,挑战也随之产生。当系统出现问题时,如何在上百个相关的、依赖错综复杂的服务系统之中快速定位到出错的系统?达达 - 京东到家的 Overwatch 系统已经在线上运行了一年有余,采用了创新性的可视化监控设计,并成功帮助达达 - 京东到家的系统渡过了“双十一”的挑战,设计思想值得分享。

  • 他的粉丝

    中小型研发团队架构实践:应用监控怎么做?

    作者 张辉清 关注 121 他的粉丝 , 杨丽 关注 7 他的粉丝 发布于  2017年12月12日 7

    “没有度量就没有提升”,度量是改进优化的基础,是做好一个系统的前置条件。业务应用是个黑盒子,通过数据埋点来收集应用的实时状态,然后展示在大屏或看板上。它是报警系统和数字化管理的基础,还可以结合集中式日志来快速定位和查找问题。我们的业务监控系统使用 Metrics.NET+InfluxDB+Grafana。

他的粉丝

监控即服务:微服务架构的模块化系统

作者 Matthew Henry 关注 0 他的粉丝 ,译者 王青 关注 0 他的粉丝   发布于  2017年11月7日

我们开发了一个监控系统,为开发者提供服务。他们可以自由的配置监控系统,使用它们构建多维度的报表,设置阈值触发报警。DevOps 工程师只需要提供基础设施的信息和文档。

他的粉丝

苏宁调用链监控系统如何为818保驾护航?

作者 朱健荣 关注 0 他的粉丝 发布于  2017年9月30日

网上商场大促时,快速发现问题并精准定位根因所在是保障活动顺利进行的关键任务。HIRO 调用链监控系统在 818 苏宁发烧节期间为商城系统保驾护航,抗住了压力,这其中的设计经验值得借鉴。

他的粉丝

360 Wonder监控系统,设计和开发经验之谈

作者 赵阳 关注 0 他的粉丝 发布于  2017年5月31日

Wonder是基于Open-Falcon二次开发的监控系统,16年4月左右正式上线使用,其中架构和功能设计按照HULK私有云平台需求的而来。 此前HULK使用的是Zabbix和内部开发的另一套监控系统。

他的粉丝

阿里Goldeneye业务监控平台之架构演进,如何实时处理100T+/天的日志量?

作者 许琦 关注 0 他的粉丝 , 马国强 关注 0 他的粉丝 发布于  2017年4月11日

文中所讲的三种架构版本的演进过程,是我们保持业务发展、系统性能和工作效率之间平衡的过程。反推这个过程,新的架构也适合之前的业务规模和场景,然而衡量一个架构的优劣不是兼容了历史,而是能预见未来。所以,我们在保持业务和技术均衡的基础上,结合对未来业务潜在的需求的思考,才产生了每一次架构的改进和升级。这些是黄金眼每位成员的集体智慧,供大家参考学习。

他的粉丝

阿里Goldeneye四个环节落地智能监控:预测、检测、报警及定位

作者 马小鹏 关注 1 他的粉丝 发布于  2017年4月10日

Goldeneye作为阿里妈妈业务监控平台,主要在业务日志、数据的实时统计分析基础上做监控报警以及辅助定位。阿里集团内部也有很多优秀的监控平台,它们在开放性上做的很好,接入成本也不高,但是监控阈值也是开放给用户自己设定。

他的粉丝

谈阿里核心业务监控平台SunFire的技术架构

作者 郁松、章邯等 关注 0 他的粉丝 发布于  2017年1月19日

在2016年双11全球购物狂欢节中,天猫全天交易额1207亿元,前30分钟每秒交易峰值17.5万笔,每秒支付峰值12万笔。承载这些秒级数据背后的监控产品是如何实现的呢?接下来本文将从阿里监控体系、监控产品、监控技术架构及实现分别进行详细讲述。

他的粉丝

腾讯云11.11:十分钟内完成弹性伸缩,流量清洗化解DDoS攻击

作者 罗志 关注 0 他的粉丝 发布于  2016年11月12日

每家电商都有自己各自的业务特色和技术栈,具体落实的架构不尽相同;但是在腾讯云架构师罗志看来,总有一些规律可以遵循,这里对不同的电商架构情况进行下分类介绍。各电商业务的架构一般比较类似,都是4层架构,即接入层、逻辑层、cache层和数据库层。而若按业务架构的物理部署而言,又可以大致分为传统和新兴电商两类。

他的粉丝

大数据下的技术运营(三)——报警系统设计与实现

作者 马超 关注 1 他的粉丝 发布于  2016年10月17日

TalkingData拥有千台以上服务器的大数据业务集群,所以对于系统的监控能力、指标的实时分析和历史报警信息追查也就有一定的要求,而且由于机器数量较多,我们也需要一些灵活的报警策略应对不同的情况。我们之前版本的监控系统有诸多弊病,主要是非常难于部署安装,而且对于更改某一台主机的监控项会非常苦难,所以最后选择用Go语言开发下一个版本的监控系统,主要是因为可以满足用户的定制化的需求并且具备高易用性。 1

他的粉丝

PPTV的Zabbix监控体系

作者 姚仁捷 关注 0 他的粉丝 发布于  2016年9月29日

InfoQ开设新栏目“品味书香”,精选技术书籍的精彩章节,以及分享看完书留下的思考和收获,欢迎大家关注。本文节选自姚仁捷著《Zabbix监控系统深度实践》中的第23章“PPTV的Zabbix监控体系”,以PPTV的监控体系为例,给大家一个完整的实战说明。前半部分主要介绍PPTV基于Zabbix进行的二次开发,后半部分介绍Zabbix在整个监控体系中的角色和作用。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT