BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Gil Tene:了解硬件事务内存

| 作者 Ralph Winzinger 关注 0 他的粉丝 ,译者 金灵杰 关注 5 他的粉丝 发布于 2016年6月28日. 估计阅读时间: 3 分钟 | QCon上海2018 关注大数据平台技术选型、搭建、系统迁移和优化的经验。

2016年纽约QCon上,Gil Tene在其演讲“了解硬件事务内存”中介绍了硬件事务内存(hardware transactional memory,HTM)。虽然HTM概念不是新的,现在终于有商业硬件支持了。HTM的目的是能够支持在内存中原子的进行多地址写入,以避免与其他合作线程产生不一致的情况。

Tene首先从解释内存缓存的四个状态开始:

  • 无效
  • 共享
  • 排他
  • 修改

同时他指出,考虑到硬件事务内存,还有两个额外的状态:

  • 缓存行在操作中被读取
  • 缓存行在操作中被修改

如果发送下列情况,事务必须被终止:其他CPU希望写入数据、读取已经被修改的数据和CPU希望失效其缓存。

根据Tene说法,硬件事务内存最大优势是摆脱串行块。最终目的是完全并行执行,并且仅在实际访问数据产生实际冲突时进行回滚。这和阿姆达尔定律有关,即当CPU核数越多,对运行速度的实际提升越少。如果应用程序中有10%的串行代码,10核CPU最多只能提速5倍。要实际达到提速10倍,可能需要使用将近100核CPU。

Tene然后介绍了锁竞争和数据竞争。例如当处理大型散列集合时,可能在读写完全不同的区域,但是整个散列集合都需要被加锁。通常锁竞争影响范围会比数据竞争大很多,但是只有数据竞争才会影响CPU的并行工作。因此,仅仅终止产生数据竞争的事务,可以彻底降低阿姆达尔定律影响,加速并行运算。

对于Java同步块,Tene解释了没有竞争的代码库可以和之前运行的速度相同。仅当发生实际数据冲突的地方,将会产生事务回滚,并且让代码并行的重新运行。对于Java应用程序,一旦Java虚拟机使用HTM,该过程是完全透明的,代码上不需要做任何修改。这在Hotspot 8 Java虚拟机的40更新之后实现。Tene页展示了简单的基准测试数据,可视化的展示了硬件事务内存的效果:即使散列集合中又5%的写比例,在增加更多CPU时,性能也能线性增加。

Gil Tene总结指出虽然对于开发者来说HTM使用是透明的,他们还是需要开始考虑应用程序中的数据竞争。多线程不应该修改一个变量,因为这样会导致数据竞争,并因HTM的优势无法被利用而无法提高运行速度。

请注意大部分QCon演讲材料会在会议结束后的几周后免费提供,演示文档可以在大会网站进行下载。同时,您也可以在InfoQ网站上观看关于这一主题对Gil Tene进行的采访

查看英文原文:Gil Tene: Understanding Hardware Transactional Memory


感谢张龙对本文的审校。

给InfoQ中文站投稿或者参与内容翻译工作,请邮件至editors@cn.infoq.com。也欢迎大家通过新浪微博(@InfoQ@丁晓昀),微信(微信号:InfoQChina)关注我们。

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT