BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

他的粉丝

Sportradar是如何实现可恢复性的

作者 Manuel Pais 关注 9 他的粉丝 ,译者 盖磊 关注 2 他的粉丝   发布于  2018年4月13日

Pablo Jensen是体育数据服务提供商Sportradar的CTO。在今年的QCon伦敦大会上,他做演讲介绍了Sportradar在确保自身系统满足所期望的可恢复等级中所采取的实践和操作。Jenson在演讲中提及,影响可靠性的因素不仅包括技术方面,而且包括企业结构与管治、对客户的支持,并需要不断进行努力以实现持续改进。

他的粉丝

Twilio的混沌工程实践

作者 Hrishikesh Barua 关注 14 他的粉丝 ,译者 薛命灯 关注 24 他的粉丝   发布于  2017年12月28日

Twilio团队介绍了他们的初次混沌工程实践,他们使用Gremlin往自家的队列系统中注入故障,测试系统的自动恢复能力。

他的粉丝

如何衡量持续交付

作者 Ben Linders 关注 23 他的粉丝 ,译者 薛命灯 关注 24 他的粉丝   发布于  2017年9月26日

在实施持续交付时,稳定性和吞吐量是两个可衡量的度量指标。这些度量指标有助于降低不确定性,帮助你做出更好的决策,让整个持续交付过程不偏离正确的方向。

他的粉丝

Azure IaaS灾备开始公测

作者 Kent Weare 关注 9 他的粉丝 ,译者 Beining 关注 0 他的粉丝   发布于  2017年8月10日

微软最近发布了使用Azure Site Recovery(ASR)进行基础架构即服务(IaaS)灾难恢复的公测细节。用户可以使用ASR将Azure上的工作负载备份到同一地理区域的另一可用区。

他的粉丝

人为失误导致AWS S3的US-EAST-1区服务宕机

作者 Abel Avram 关注 7 他的粉丝 ,译者 Rays 关注 3 他的粉丝   发布于  2017年3月8日

由一次人为失误引发的连锁反应导致了很多S3服务器宕机,其中包括两个影响S3运行的关键子系统。由此导致了S3的故障,影响到了不仅S3本身还有其他一些依赖S3的服务。四个小时后S3才重新恢复正常。

他的粉丝

必须移除无用代码

作者 Ben Linders 关注 23 他的粉丝 ,译者 Rays 关注 3 他的粉丝   发布于  2017年2月15日

需要发现和移除无用代码。无用代码的存在对于编程人员理解程序并采取行动而言是一种障碍。无用代码也存在被唤醒的风险,会导致严重的问题。移除无用代码并非是一个技术问题,而是一种理念上的和文化上的问题。

他的粉丝

软件工程技术的未来

作者 Ben Linders 关注 23 他的粉丝 ,译者 Rays 关注 3 他的粉丝   发布于  2016年12月9日

Mary Poppendiecktt在近期的大会演讲中指出,云、架构即代码、具有API和反脆弱系统的联邦架构等软件系统开发技术正迅速成为关注焦点。越来越多的系统正在向云上迁移,API正替代中央共享数据库。我们需要开发可直面故障的反脆弱系统。

他的粉丝

应对冒充者综合症

作者 Ben Linders 关注 23 他的粉丝 ,译者 王纯超 关注 0 他的粉丝   发布于  2016年11月23日

冒充者综合症(impostor syndrome)指人们害怕被他人发现是一个“骗子”的心理状态。他们认为他们自己不属于他们所处的环境、不配拥有他们取得的成功以及没有他人认为得那么聪明。敏捷教练Gitte Klitgaard指出,许多取得较大成就的人士都患有冒充者综合症。它阻碍人们的工作,阻止他们追随他们的梦想。

他的粉丝

Spotify希望自己擅于失败

作者 Ben Linders 关注 23 他的粉丝 ,译者 NER 关注 0 他的粉丝   发布于  2016年7月29日

Spotify工程部主管Marcus Frödin说:“Spotify希望自己总是能迅速试错,然后再实验性地优化它。”在2016年伦敦的Spark the Change大会上,他提出了一个概念,要从错误中学习并培育出成功。他还举出了Spotify的失败案例以及从中汲取了怎样的教训。

他的粉丝

“穿实验服的猴子”:Netflix的应用型故障测试研究

作者 Daniel Bryant 关注 667 他的粉丝 ,译者 bigmarvin 关注 0 他的粉丝   发布于  2016年4月13日 1

在Qcon London 2016上,Peter Alvaro和Kolton Andrus分享了一项企业与学院合作的成功案例,这次合作最终为Netflix找到了一条自动化故障注入测试(failure injection testing)的崭新途径。

他的粉丝

microXchg会议上与Richard Rodger讨论“在微服务中生存”的话题:消息、模式匹配以及故障处理

作者 Daniel Bryant 关注 667 他的粉丝 ,译者 张卫滨 关注 13 他的粉丝   发布于  2016年3月14日 1

在德国柏林举办的microXchg 2016会议上,Richard Rodger做了一个“在微服务中生存”作为主题的演讲,对于希望保持微服务架构“健康和高性能”的开发人员来说,这是一个实用的指南。在这个演讲中,所讨论的核心话题包括面向消息系统的收益、服务间通信的模式匹配、故障处理以及Seneca.js。

他的粉丝

组织学习和真实沟通的重要性

作者 Ben Linders 关注 23 他的粉丝 ,译者 魏程 关注 0 他的粉丝   发布于  2016年3月14日

InfoQ对Stephen Carver进行了采访,具体内容如下:引进程序和条例对预防问题怎么无济于事,如何确保在不同公司工作的工程师能够沟通,怎样从失败中吸取教训以达到新水平从而防止类似问题的发生,以及工程师如果想要影响研发和发布产品的决策,应该怎样做的问题。

他的粉丝

微服务故障测试

作者 Jan Stenberg 关注 33 他的粉丝 ,译者 谢丽 关注 10 他的粉丝   发布于  2016年3月4日

在微服务从业者峰会上,Kolton Andrus在演讲中指出,故障测试是运行微服务的一个关键部分。你应该确定微服务的行为同预期一样,以避免停机。

他的粉丝

CoachRetreats:一种实践教练技术的方式

作者 Ben Linders 关注 23 他的粉丝 ,译者 陆志伟 关注 1 他的粉丝   发布于  2016年2月19日

CoachRetreat是一个“安全失败”的学习平台,在这里参加者可以尝试不同的教练方法。在 CoachRetreat,在给定条件下参加者探索人们相互交互的方式,能够从不同的角度看情况,从而提高教练技术。本文是根据对 Oana Juncu、 Elad Sofer和 Yves Hanoulle的采访整理而来。

他的粉丝

To the Moon:太空任务与开发软件的相似之处

作者 Ben Linders 关注 23 他的粉丝 ,译者 陆志伟 关注 1 他的粉丝   发布于  2015年12月8日 1

Russ Olsen在 GOTO Berlin 2015会议上发表了题为“To the Moon”的开幕式主题演讲。InfoQ对其进行了采访,主要关于为了满足期限在同一时间进行所有事情的弊端、从错误的和正确的事情中吸取经验教训、在软件开发中再渺小的事情也能扼杀你和当实施复杂工作时如何专注和处理细节。

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT