BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

rss
  • 他的粉丝

    业务高速发展的运维困局,如何保证系统稳定性?

    作者 胡杨 关注 0 他的粉丝 发布于  2017年6月13日

    随着业务的快速发展,运维体系也逐步的完善起来。业务的稳定性和服务质量也在监控、可用性等体系的相互环抱下健康地成长。所有的问题、故障及影响稳定性的因素都在可控、可收敛的范围内,一切都向着好的方向发展。 这一切的背后真的和看起来一样美好吗?实则不然,业务的高速发展势必会留下种种隐患和问题。

  • 他的粉丝

    集预测、处理、关联和资源优化于一体的智能运维系统

    作者 籍鑫璞 关注 0 他的粉丝 发布于  2017年6月1日

    随着业务量的增加,通过设置单纯的阈值来监控报警是远远不够的。而且这种被动式的触发报警很多时候需要人工去处理。 我们提出来DoctorStarange,它是一个智能的预测和处理系统,能够提前预测出一些监控项的报警,并提前处理预测的报警,最大程度减少报警次数;它是一个关联不同报警项的系统,能够帮助运维人员去更快地排查报警;它还是一个对机器各个维度进行检测的系统,能够优化机器资源。

  • 他的粉丝

    全球最大游戏网站运维过程中积累的SRE经验

    作者 Ian Miell 关注  他的粉丝 ,译者 大愚若智 关注 9 他的粉丝   发布于  2017年5月16日 1

    作者Ian Miell通过本文探讨了自己在全球最大在线游戏网站的站点可靠性运维工作中积累的经验。

他的粉丝

提升运维稳定性的利器——故障复盘

作者 胡杨 关注  他的粉丝 发布于  2017年3月29日

稳定性是运维工作的基石。故障,也就是稳定性问题是悬在各位运维从业者头上的一把达摩利斯克之剑。稳定性一旦出现问题,运维的其它工作基本也就算前功尽弃了。那么如何提升稳定性是所有运维从业者都绕不开的话题。 那么出现了稳定性问题怎么办?

他的粉丝

如何将运维的报警做成运营的报警

作者 安新海 关注 0 他的粉丝 发布于  2017年3月3日

做运维的同学都知道,运维一定离不开Zabbix、Nagios之类的监控软件。目前,类似的软件在监控和数据采集方面已经做到了极致,但是在报警处理上并没有很完美的解决方案,比方说,经常出现高质量报警湮没在海量报警之中等情况。本文不探讨监控系统的配置优化,只探讨监控系统按照它的逻辑发出报警之后我们该做点什么。 2

他的粉丝

网易蜂巢基于万节点kubernetes支撑大规模云应用实践

作者 刘超 关注 0 他的粉丝 发布于  2017年1月23日

本文分享了网易蜂巢为了支撑大规模云应用从IaaS、PaaS、CaaS以及应用层所做的优化和最佳实践,还有大规模Kubernates集群支持高并发集群的运维实践,希望能给各位带来一些新的思考。 1

他的粉丝

谈阿里核心业务监控平台SunFire的技术架构

作者 郁松、章邯等 关注 0 他的粉丝 发布于  2017年1月19日

在2016年双11全球购物狂欢节中,天猫全天交易额1207亿元,前30分钟每秒交易峰值17.5万笔,每秒支付峰值12万笔。承载这些秒级数据背后的监控产品是如何实现的呢?接下来本文将从阿里监控体系、监控产品、监控技术架构及实现分别进行详细讲述。

他的粉丝

亿级用户PC主站的PHP7升级实践

作者 侯青龙 关注 0 他的粉丝 发布于  2017年1月12日

伴随业务的增长,系统压力也在不断增加,再加上机房机架趋于饱和,无法更加有效应对各种突发事件。在这样的情况下,PC主站升级为PHP 7,有哪些技术细节可以分享? 2

他的粉丝

QA Review UT的那些事儿

作者 李春辉 关注 0 他的粉丝 发布于  2017年1月6日

根据测试金字塔,UT处于测试金字塔的最底端。其特点是更贴近于代码,运行速度快,成本相对较低,对问题的反馈也更准确。所以通常情况下绝大部分的业务代码都会在UT层被覆盖,也就意味着有近70%或更高的业务逻辑会由UT来保护。

他的粉丝

解读2016,眺望2017:运维的风口在哪?

作者 兴刚、陈尔冬、赵成、熊胜 关注 0 他的粉丝 发布于  2017年1月4日

着眼于运维领域宏观的变化趋势,以期能给运维同仁带来帮助。首先,总结具体运维实践,自用容器化、使用厂商云后的两类运维是怎样的?然后,探讨SRE概念以及列举了互联网领军公司的SRE落地。最后,分析了正在兴起的智能化运维并对其影响做了简单的展望。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT