BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

搭建Docker监控框架的理论与范例

| 作者 木环 关注 2 他的粉丝 发布于 2016年7月18日. 估计阅读时间: 6 分钟 | Google、Facebook、Pinterest、阿里、腾讯 等顶尖技术团队的上百个可供参考的架构实例!

容器技术适用于分布式应用的构建与交付。Docker作为容器技术的典范,已经被行业中很多国内外IT巨头企业采用,同时许多初创企业的业务也是基于Docker来实现的。在上个月结束的全球DockerCon 16大会上,Docker的CEO Ben Golub宣布全球已有46万个应用Docker化,该数据在两年增长了3000%。同时,Ben称他们会继续努力使得每一台服务器都可以使用Docker,并估计市场价值为上百亿。

InfoQ就Docker运维的监控为主题,对云络网络科技的高级架构师王寒做了采访。

受访嘉宾介绍

王寒,云络网络科技公司高级架构师,2016北京QCon《DevOps与Docker的最佳实践》讲师,毕业于香港科技大学,曾任职于IBM和微软公司。擅长于AWS、Azure技术,Windows Networking,Docker运维以及各类运维技术,DevOps实践。

InfoQ: 作为运维监控方面的专家,你如何理解监控对于整个运维系统的意义?对于一般的系统,应该从哪些方面考虑监控内容?

王寒: 系统运维的很大一部分工作就是管理服务器,而管理的前提即是对被管理事物有清晰地了解。监控可以帮助我们了解我们管理的服务器的情况,所以监控是系统运维的基础。

对于一般性的系统,应该做到从下到上三层的监控:

  • 服务器层面,即最底层,包括服务器的基本信息如CPU、内存、I/O、网络等;
  • 中间层,是服务器上安装服务的监控,如Tomcat、Nginx、MySQL等;
  • 上层应用层,这层可以使用APM监控工具来完成。

InfoQ:对于运维来说,系统基于容器带来了哪些便利性,又带来了哪些挑战?

王寒: 对运维而言,容器技术带来的便利性不多,而带来更多的是挑战。这些挑战包括在监控方面、日志收集方面、网络方面以及安全方面。在本次的访谈,我会主要谈谈容器技术给监控带来的挑战、以及相应的应对策略。

InfoQ:请谈一谈如Docker这样的容器监控原理?

王寒: Docker监控大体分成三个部分:Docker服务的监控、Docker服务下每一个容器的基本监控、Docker容器里所运行服务的监控

常见的监控方法包括Cgroups,Docker command以及Docker API。Cgroups就是利用伪文件的方式获取单个容器的基本状况,这种方式获取信息全但需要对数据做二次处理;Docker command是利用Docker服务提供的一些命令来获取信息,这种方法简单便捷但信息量有限;Docker API可以获取比Docker command更多的信息但是对于大规模的容器管理有着性能的瓶颈。

InfoQ: 在容器监控的探索中,你们遇到最大的挑战是什么?

王寒: 容器的监控主要挑战就是监控的代理安装在哪里,是在容器内部还是在容器外部。在容器内部的话,可以直接监控容器内的服务,但会占用资源;在外部的话技术上会复杂一些,但能更大程度的发挥容器的性能。

因为Docker官方的最佳实践是一个容器只运行一个服务,而添加监控代理在内部无疑增加了服务;所以为我们并没有考虑把监控代理放在容器内部。

经我们的经验,我们建议将监控给代理放在容器外部。将监控代理放在容器外部需要解决的关键技术,是如何获取容器内部服务的信息。

InfoQ:你们目前的监控方案是怎么样的?

王寒: 我们运维平台的监控系统是Zabbix,所以我们主要是尝试了把监控集成到Zabbix上。下面是我们目前监控方案的流程图。

第一,考虑Docker监控代理安装的位置。如果选择将监控代理部署在容器内部,则需要在容器里启动一个startup服务来分别开启监控代理以及容器内所要执行的服务,这将损耗容器的性能所以这里并不建议;于是,我们尝试将监控代代理部署在容器外侧及host上。

其次,选择监控获取信息方式。从下自上来看,首先我们通过Docker API来获取Docker服务的信息,在这里我们可以收集到该host上有多少容器在运行,哪些停止,哪些暂停等整体信息;随后我们利用Zabbix的Low discovery 获取容器的服务情况,然后在Zabbix后台建立相应的Zabbix host;之后再分别利用Cgroups(即伪文件 Pse-udo file)获取单一容器的CPU,I/O等基本情况,同时利用Docker exec脚本定位容器内部服务类别并赋予监控模板收集需要的信息。最后再将这些信息汇总到Zabbix服务器,进行统一的处理和显示。

InfoQ:基于容器的系统的未来将会怎样发展,这对于监控会带来怎样的影响?

王寒: 容器具有轻量级、易部署的特性,如果未来在性能、安全性、可靠性等层面更加成熟的话,那么容器技术在企业的使用程度会进一步增大。

容器技术是实现DevOps的一个重要技术手段。随着容器技术的广泛使用,将会出现更多的大规模的集群式容器需要监控和管理;我认为这将是未来容器发展对监控的一大挑战。

InfoQ主办的CNUTCon全球容器技术大会即将开幕,特设Docker专题,将从技术层面剖析Docker,专门解决参会者在Docker实践中遇到的共性技术难题。我们邀请到了曾经深度参与过Docker项目的企业开发者、开源项目代码贡献者前来分享。内容方面,不追求大而全,只希望能把一个小知识讲精讲透。


感谢徐川对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT