BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

您现在处于全屏预览
关闭全屏预览

新浪CDN自动化运维
录制于:

| 作者 刘宇 关注 0 他的粉丝 发布于 2013年7月27日 | CNUTCon 了解国内外一线大厂50+智能运维最新实践案例。
32:29

概要
新浪内容加速平台做为研发中心新起之秀,承载着新浪越来越多的业务,平台规模扩充迅速,给运维带来的挑战越来越严俊,满足不同业务的需求,并保证服务持续稳定的高效运行。 当前挑战有: 突发流量变化 合理的带宽错峰 规模快速扩张 复杂的关联影响 快速的开发迭代更新 运维效率、运维质量及成本 这些挑战迫使我们加速自动化运维的建设,为此我们采用开源框架,使用Puppet实现运维自动化,沟通OS相关部门实现定制化。制定相关的运维操作流程及标准,在生产-部署-应用一体化后利用Zabbix实现监控自动化。并开发自己Console管理所有操作流程及监控数据展现。 为避免复杂关系的影响最大化,采用灰度发布机制保证每次代码上线对业务的影响最小化。在成本优化的互联网公司,成本也是平台重中之重,合理对业务进行划分处理,利用低峰期对业务流量的错峰降低单位的成本。

个人简介

刘宇现就职于新浪,担任新浪内容加速平台(SinaEdge)运维负责人。主要负责新浪微博图片、新浪视频、新浪微盘、新浪看点等新浪大小50个项目。 擅大规模Linux集群环境的自动化管理与运维、问题分析、性能调节和架构设计优化、分布式监控、CDN相关,以及GTD高效管理有一定的探索。对集中化管理Puppet、分布式监控类、高可用性,高并发,视频点直播技术以及图片加速有一些经验和心得。喜欢关注互联网行业动态,新软件等。目前关注于平台建设与数据挖掘分析。 曾活跃于CU及51CTO,分享过不少技术文档及相关经验。目前是LinuxTone.org 创始人之一。正在撰写《Puppet实战》一书,预计2013年5月份出版。 快速部署,节点业务迁移与扩容,灰度上线,故障快速响应与定位等都是我面临的挑战,因此良好的自动化运维体系显得越来重要,这也是我想分享的原因之一。

QCon是由InfoQ主办的全球顶级技术盛会,每年在伦敦、北京、东京、纽约、圣保罗、杭州、旧金山召开。自2007年3月份首次举办以来,已经有包括传统制造、金融、电信、互联网、航空航天等领域的近万名架构师、项目经理、团队领导者和高级开发人员参加过QCon大会。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT