BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

高可用云计算服务——Engine Yard如何应对AWS停用

| 作者 李湃 关注 0 他的粉丝 发布于 2012年4月2日. 估计阅读时间: 2 分钟 | CNUTCon 了解国内外一线大厂50+智能运维最新实践案例。

PaaS云服务提供商Engine Yard,在2012年3月23日经历了AWS(Amazon Web Service)网络服务中断后,将对外服务不可用的比率控制在0.13%(2300个客户,有3个客户受到网络中断的影响)。

Engine Yard的运营VP,Bill Plat,以及市场营销高级VP,Mark Gaydos,透露了他们三条最佳实践:

  • 及时沟通,不论是对外部客户还是合作伙伴——在事故发生时,Engine Yard会及时与AWS团队沟通以达成应对策略;同时对外部客户发布公告,告诉客户发生了什么,为什么会这样,现在进展到了哪个阶段。
  • 避免“热点数据”——Engine Yard通过将客户以及基础设备散落在不同的区域,来减小事故发生所产生的影响。而且,Engine Yard会提供冗余数据快速恢复服务,但这项服务会额外收费。
  • 清除隐患——Engine Yard在每次事故之后,找到导致其发生的根本原因,并采取措施保证类似事故不会发生第二次。

早在一年前,在经历了类似事故后,Engine Yard就着手研发了新的服务功能,支持客户在备选区域内恢复业务数据。同时,对于AWS来说,网络服务中断这个话题也常常被用户提及(取自AWS论坛):

论坛用户endertech:一周之内发生两次网络服务中断,这是为什么?

亚马逊AWS成员preethi@AWS回复说:我们知道网络中断会造成部分用户的不便,除了查看AWS健康状态仪表盘上的数据,我无法提供更多的信息。但我们团队在不断的努力,尽全力避免类似事故的发生,面对现在这样的状况,可以先参照下“如何构建数据容错的AWS应用”指南。

不论是外部客户还是云计算服务合作伙伴,都希望得到Up-To-The-Minute信息,能够提供高可用、高容错的云计算服务是未来供应商的核心竞争力。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT