BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

他的粉丝

京东618:商城交易平台的高可用架构之路

作者 郭蕾 关注 8 他的粉丝 发布于  2017年6月18日

公开数据显示,在今年的618大促中,京东商城在零点后的第一分钟内就实现了xx的交易数据,远超去年的xxx。为了应对如此大规模的流量增长,京东研发团队几乎全年都在高筑墙、广积粮,一直着力从技术层面为用户提供流畅的交易体验,以保证在峰值交易时期系统的高可用性。在京东整个电商体系中,交易系统占据着其中的半壁江山,购物车、结算、库存、价格等相关的环节都包含在其中,可以说交易系统的高可用能力基本上决定了整个京东商城的高可用能力。

他的粉丝

红帽峰会2017第三天回顾:自动化的未来

作者 杨赛 关注 3 他的粉丝 发布于  2017年5月8日

红帽管理平台相关负责人已经明确在一次媒体沟通会上表示,Ansible已经被定位作为红帽自动化工具体系的中心。

他的粉丝

从Docker运维看知乎容器平台的优雅整合

作者 木环 关注 2 他的粉丝 发布于  2016年7月28日

传统的部署是安装、配置和运行;而Docker的出现革命性地改变了传统模式,部署被简化为复制和运行两个步骤。因此,越来越多企业使用Docker提高分布式应用的构建与交付;但是与此同时,Docker带来了很多不可避免的挑战,其中运维需要克服的挑战尤为传统的部署是安装、配置和运行;而Docker的出现革命性地改变了传统模式,部署被简化为复制和运行两个步骤。因此,越来越多企业使用Docker提高分布式应用的构建与交付;但是与此同时,Docker带来了很多不可避免的挑战,其中运维需要克服的挑战尤为突出。知乎曾经在QCon上与大家首次分享Docker架构和经验,也即将在全球容器大会详细讲述容器平台的实战历程。本次InfoQ就在Docker整合入原有架构过程中,如何实现的Docker运维对知乎两位专家进行了采访。

他的粉丝

去哪儿网张悦:合适的开源软件,支撑800万+监控指标

作者 薛梁 关注 1 他的粉丝 发布于  2016年7月25日 1

从垂直搜索起家,后杀入在线旅游交易。去哪儿网的业务越来越复杂,整个技术系统对可靠性、质量的要求越来越高,去哪儿网的工程师们克服了种种困难,确保了最终系统的顺畅运行。例如,去哪儿网的运维团队基于开源项目Graphite+Grafana+Nagios二次开发了监控系统Watcher,用来支撑去哪儿百万级别的基础/业务监控指标。

他的粉丝

搭建Docker监控框架的理论与范例

作者 木环 关注 2 他的粉丝 发布于  2016年7月18日

容器技术适用于分布式应用的构建与交付。Docker作为容器技术的典范,已经被行业中很多国内外IT巨头企业采用,同时许多初创企业的业务也是基于Docker来实现的。在上个月结束的全球DockerCon 16大会上,Docker的CEO Ben Golub宣布全球已有46万个应用Docker化,该数据在两年增长了3000%。同时,Ben称他们会继续努力使得每一台服务器都可以使用Docker,并估计市场价值为上百亿。

他的粉丝

LinkedIn详细介绍了由他们开源的Kafka Monitor

作者 Dylan Raithel 关注 9 他的粉丝 ,译者 谢丽 关注 9 他的粉丝   发布于  2016年6月15日

近日,LinkedIn详细介绍了由他们开源的Kafka Monitor服务。他们使用它监控Kafka生产集群以及广泛的测试自动化,让他们可以识别出Kafka主干中的Bug,并为开源社区贡献解决方案。

他的粉丝

应用性能监控方法一览

作者 张卫滨 关注  他的粉丝 发布于  2015年8月27日

随着用户对软件可用性的要求越来越高,99.9%或99.99%已经算不上高水准的高可用性了,用户期望的是100%的可用性。为了达到这一点,我们需要遵循良好的设计模式并保持服务的可扩展性,同时还要对硬件、应用服务器以及数据库服务器进行全面地监控。来自Zephyr的CTO Shailesh Mangal撰文总结了各种监控类型以及所需的工具。

他的粉丝

Haystack:GitHub的异常监控工具

作者 孙镜涛 关注 2 他的粉丝 发布于  2015年8月1日

对于GitHub而言稳定性和性能是非常重要的,但是和其他大部分软件应用程序一样,它也会产生异常,从Git超时这种系统级的错误到JavaScript错误这种应用级的错误都会发生,这就需要一种方式能够在错误发生的时候尽快地识别它们,然后寻找最合适的团队或者个人去处理,最终实现错误的快速响应。而[Haystack][1]就是Github应对这一问题的钥匙。

他的粉丝

Invent and re:Invent:AWS说我们永远都在Day One

作者 杨赛 关注 3 他的粉丝 发布于  2014年11月15日

2014年11月13日,美国拉斯维加斯,AWS re:Invent 2014大会官方日程的第三天。第二场主题演讲由AWS CTO Werner Vogels主讲,一个半小时的议程主要由合作伙伴的分享和两个新服务的发布信息组成。

他的粉丝

唐洪:阿里云飞天面对的三大挑战与解决策略

作者 罗鹏 关注 0 他的粉丝 发布于  2014年10月22日

在10月17号的2014年阿里云开发者大会上,阿里云飞天项目负责人唐洪做了飞天项目的专题演讲,演讲中对飞天项目架构、遇到的技术挑战、监测运维等方面进行了详细介绍。本文是对演讲内容的整理报道。

他的粉丝

阿里云监控体系现状概览

作者 杨赛 关注 3 他的粉丝 发布于  2014年10月15日

在本次沟通中,阿里云产品技术部产品总监马劲对阿里云监控体系的现状进行了简单介绍,涉及到监控的覆盖面、监控粒度、故障识别、OpenAPI的开放进度等方面。

他的粉丝

梁定安:解密腾讯SNG云运维平台“织云”

作者 刘宇 关注 0 他的粉丝 发布于  2014年9月25日

梁定安,2009年加入腾讯运营部,先后从事系统运维、业务运维、运维规划和运营开发的工作,目前是社交平台业务运维组Leader,可以说是整个SNG云平台的缔造者。在本次采访中他详细介绍了腾讯SNG织云自动化运维体系这个平台的特性、底层技术组成、以及给SNG所带来的价值。

他的粉丝

UCloud邱模炯:为什么内核是云平台稳定性的关键

作者 杨赛 关注 3 他的粉丝 发布于  2014年9月25日

评估一个云平台的SLA,一般以可用性、数据可靠性为主要指标,而UCloud则主要着眼于单机上的云主机稳定性,UCloud广泛应用的Linux内核热补丁技术可以实现宿主机不重启的情况下完成内核升级,从而避免对上面云主机的业务中断。InfoQ中文站编辑跟邱模炯进行了一次交流,了解UCloud关注单机稳定性背后的原因。

他的粉丝

构建大型云计算平台分布式技术的实践

作者 章文嵩 关注 0 他的粉丝 发布于  2014年7月24日 1

本文基于章文嵩博士在2014年7月18日的全球架构师峰会ArchSummit上的主题演讲《构建大型云计算平台分布式技术的实践》整理而成。

他的粉丝

CERN云的日志处理和控制面板,再谈OpenStack的监控与报警 - OpenStack社区周报

作者 叶璐 关注 0 他的粉丝 发布于  2013年10月25日

本周,OpenStack Havana版正式发布。本周周报推荐内容包括:OpenStack H版加强了对GlusterFS的支持,CERN云的日志处理和控制面板,DevStack与XenServer,创建一个基于KVM和vSphere的复合式OpenStack云,再谈OpenStack的监控与报警,Keystone Token Binding。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT