BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Ruby 2.2.0发布,支持增量式垃圾收集和符号的垃圾收集

| 作者 João Miranda 关注 2 他的粉丝 ,译者 臧秀涛 关注 4 他的粉丝 发布于 2015年1月7日. 估计阅读时间: 6 分钟 | QCon上海2018 关注大数据平台技术选型、搭建、系统迁移和优化的经验。

Ruby 2.2.0已于2014年12月25日发布,这是给Ruby开发者的圣诞礼物。该版本的亮点包括一些垃圾收集方面的改进:引入了一个新的增量式垃圾收集算法,支持对符号(Symbol)进行垃圾收集。核心类和标准库方面也有小幅改进。

根据Ruby 2.1.0中分代垃圾收集(RGenGC)相关的说明,分代方式可以改进GC吞吐量。在新版本中,Ruby的维护者继续引入了重要的改进。大部分对象都会在很年轻的时候死掉,根据这个假设,分代垃圾收集将对象分为几个代。这个假设使得对较年轻对象的处理有较高的吞吐量和较低的延迟,因为较老的对象会在内存不足时才去计算是否要删除。不过也意味着,较老的对象仍然要承受高延迟之困。

增量式垃圾收集(RIncGC)是在分代垃圾收集的基础上构建的,致力于在维持同样吞吐量的前提下减少停顿时间。通过将标记阶段(把对象标记为可以进行垃圾收集)与Ruby的正常执行交错进行,较少了停顿时间。而在Ruby 2.2.0之前,标记阶段要占用很大的一步。

RGenGC和RIncGC都不能管理所有对象,意味着某些对象不会被提升到较老的一代。主要是因为C扩展,无法保证全部满足RGenGC和RIncGC的约束。在RubyConf 2014大会上, Koichi Sasada详细描述了RGenGC和RIncGC。如果想了解所有的算法细节和性能基准测试,这是很好的材料。

RIncGC does multiple small mark phases instead of a big one.

全局停顿GC与增量式GC之对比 来源:Koichi Sasada

RIncGC eliminates long pauses.

RIncGC消除了长期停顿 来源:Koichi Sasada

Ruby 2.2.0引入的对符号的垃圾收集,也改进了Ruby的内存管理。这个改进如此之大,乃至计划于2015年秋季发布的Ruby on Rails 5.0,将仅支持Ruby 2.2及以上的版本。

Rails 5.0将仅支持Ruby 2.2及以上的版本。Ruby 2.2带来的很多优化都非常棒,但是对Rails而言,符号的垃圾收集是最重要的。这意味着在处理来自外部的字符串时,可以轻松很多。而且我们可以完全转换到最新的Ruby带来的关键字参数(keyword arguments)和其他所有良好特性。

因为Ruby内部会将每个符号映射到一个整形数(integer),带来了一个问题。CRuby(用C实现的Ruby)将这个整形数用作符号的ID。如果一个符号在Ruby端释放了,之后又创建了同样的字符串,那会出现不同的CRuby整形数ID。这意味着,根据语言规范是同样的符号,但是出现了不同的ID,所以是个bug。

最简单的解决方案是用字符串替换CRuby中的整形数,这样在两端(C和Ruby)就一致了。另外,C扩展将问题变得更复杂了,因为它们会妨碍运行时探测和管理所有的符号。解决方案是将符号分成两组:永久的(immortal)和非永久的(mortal)。永久的符号会继续使用整形数ID,不会被回收。这类例子包括方法名、变量名、常量和其他语言元素。非永久的符号,比如"foo".to_sym,没有整形数ID,可以被回收。

非永久的符号与永久的符号之对比 来源:Narihiro Nakamura

Narihiro Nakamura在RubyKaigi2014大会上描述了符号GC的解决方案,还介绍之所以使用这种方案的所有约束条件。

仍然是内存管理方面,Ruby 2.2.0还提供了一个选择,即使用jemalloc代替系统的malloc,此举有可能会提高速度,并减少内存碎片。这还是一个实验性特性,在收集到更多性能数据和使用案例后才会正式提供。

诸如system()和spawn()等创建进程的方法,在可能的情况下会使用vfork(2),代替了fork()。这种改变也会提高性能,尤其是当父进程会消耗大量内存时。这也是个实验性特性,未来可能会发生变化。

核心库现已支持Unicode 7.0,还引入了一些新方法,如Enumerable#slice_afterEnumerable#slice_whenFloat#next_float、Float#prev_floatFile.birthtime、File#birthtimeString#unicode_normalize

Ruby 2.2.0废弃了mathn库,同时还更新了其他一些库:

  • Psych 2.0.8
  • Rake 10.4.2
  • RDoc 4.2.0
  • RubyGems 2.4.5
  • test-unit 3.0.8
  • minitest 5.4.3

更多细节,包括废弃的一些C API以及一些非兼容的改变,详见Ruby 2.2.0相关新闻。与Ruby 2.1.0相比,Ruby 2.2.0有1557处文件改动,包括125039条插入和74376条删除。

 

查看英文原文:Ruby 2.2.0 Released, Featuring Incremental and Symbol GC

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

Ruby真的变快,占用内存减少了 by 夏 健

随着ruby越来越流行,我就觉得Ruby会越变越快。只要持续改进,未来的Ruby性能一定不会差的。

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

1 讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT