InfoQ

新闻

JavaOne:Cliff Click谈论可伸缩、非阻塞的编码方式

作者 Charles Humble译者 韩锴 发布于 2008年6月15日 上午9时10分

社区
Java
主题
编程,
性能和可伸缩性
标签
并行计算
你的并发代码能有多快?早在1967年,Gene Amdahl就指出了影响这一问题的主要限制。程序中只有一部分可以完全并行地运行,也只有这部分才能直接在拥有越来越多处理器内核的机器上获得良好的伸 缩性。程序的剩余部分则只能顺序执行。Amdahl法则强调的主要问题是锁争夺,这个问题会随着处理器内核数的增加而逐渐恶化。多数共享存储器硬件的大型 CPU控制系统都支持非常快速的并发读操作,但会限速于“1-cache-miss-per-write”或者“1-memory-bus- update-per-write”,因此避免所有CPU对同一位置进行写操作是非常关键的。即使利用读写锁,系统伸缩度也很难超越50-100个 CPU。多核处理器是一个正在发展的产业趋势,几乎全部硬件供应商都在不遗余力地朝着多核的方向努力。Azul即将开发出可投入使用的768核的处理 器,Sun的Rock拥有64核,就连基于x86的商用硬件也在增加核的数量。因此锁争夺的问题将成为程序员编写高性能代码的拦路虎。

Azul Systems的资深工程师Cliff Click博士在今年的JavaOne大会上进行了演讲(下载幻灯片),介绍了一些可以帮助我们用Java编写出可伸缩、非阻塞代码的技术。总体来说,他介绍的方法实现了一个非阻塞算法,这个算法可以保证停止某个特定线程并不会导致整体进程的停止。

Click的演讲主要包括下面几部分:

  1. 一个大型的、快速的包含所有数据的数组,该数组允许快速的并行数据读取,也允许并行的、递增的并发复制。
  2. 数组元素的原子更新(需要使用java.util.concurrent.Atomic.*)。在Azul/Sparc/x86处理器上,原子更新将使用“比较并交换(CAS)”原语实现,而在IBM的平台上,将使用“链接加载/条件存储(Load Linked/Store-conditional,LL/SC)”原语。
  3. 从对每个数组元素的原子更新与逻辑上的复制操作中抽象出来的有限状态机(FSM)。FSM支持数组的大小调整,并用于控制写操作。

有了这些基本概念和元素后,Click接着将大量锁自由的FSM步骤(比如每个CAS步进)组合成一个非阻塞算法。每个CAS的成功都是局部成功,同时一个CAS的失败则意味着另一个CAS会继续。如果一个CAS成功,状态机就会前进,同时失败的CAS就会重试。

Click已经实现了两个示例,分别是位向量(Bit Vector)和哈希表(Hash Table),它们的源代码可 以在SourceForge上获得。同时Click正在开发第三个示例(FIFO队列)。让我们以哈希表为例来深入研究一些细节,哈希表是一个由键值对组 成的数组,其中Key在偶数的位置上、Value在奇数的位置上。每个元素都独立地进行CAS操作,但是状态机会同时跨越两个元素,甚至在复制阶段包括来 自两个数组的不同元素。Click实现的哈希表支持并发插入、移除测试(remove test)、重置大小,同时该实现还通过了ConcurrentHashMap的Java兼容性测试集(JCK)。在Azul的768核的硬件系统上,该 哈希表在每秒超过十亿次读操作、同时每秒超过千万次更新操作时,可以获得线性的伸缩性。

InfoQ与Click博士还谈到了他目前研究工作的一些背景。在这次JavaOne的演讲期间,他特意强调了几个用Java编写哈希表时存在的问题,因 此在被问到Java做这样的工作有多合适时,他回答说:“事实上是非常合适的……它非常准确地应用了存储模型(并且实现得非常好)。但是它在细粒度控制上 存在不足,这些不足只带来很小的性能损耗,我可以忽略它们。缺乏细粒度控制(也就是直接ASM存取)可能会在OS设计或者设备驱动程序中带来问题,但是对 数据结构不会产生影响。”

InfoQ还问他建议人们何时使用他实现的数据结构。Click的回答是,在那些“久经考验”的实现变得太慢、难以使用之时:

“如果单独的数据结构被激烈争夺;而且你已经尝试过java.util.concurrent.ConcurrentHashMap等实现了。那么我的实现在没有负载的情况下并不会显著提升性能(也就没有什么理由使用它),但在下面的情况下,却完全不同了:
- 当有超过32个CPU同时争夺时,或者
- 写操作占读写操作总数的比例很高时。
这种转变会带来很大的变化,因此,使用它以前要先进行测试。”

目前,围绕Java中的并发有很多动作,Click博士的研究工作所解决的问题与fork/join框架基本类似,后者正被考虑加入Java 7。尽管Click本人不是专家组的成员,但他经常向专家组提供帮助。

查看英文原文JavaOne: Cliff Click on a Scalable Non-Blocking Coding Style

没有回复

回复

独家内容

剖析短迭代

敏捷教练Dave Nicolette提出:我们应该如何设定迭代长度?是要根据发布周期的时间么?使用短迭代又有哪些好处?

应用JSF、Ajax和Seam开发Portlets(1/3)

本文主要讲述了如何用JBoss Portlet Container 和JBoss Portlet Bridge创建新项目,怎样配置一个JSF应用去使用JBoss Portlet Bridge,以及JBoss Portlet Bridge所具备的功能。

AtomServer:数据分发的发布动力(第二部分)

在这篇文章里,Bryon Jacob和Chris Berry将和我们继续探讨AtomServer,它是基于Apache Abdera的完整Atom存储实现。作者还创建了几个Atompub规范扩展,其中包括自动标记、批处理和Feeds聚合。

架构师(试刊第二期)

InfoQ中文站的电子杂志《架构师》试刊第二期出版了!相比于上期,我们在内容的选择安排和版式上都根据读者的意见重新做了修正。“细节决定成败”,我们希望基于InfoQ中文站的专业内容,《架构师》能逐渐成为大家喜欢的电子刊物!

一种正规的性能调优方法:基于等待的调优

在本文中,Steven Haines探讨了Web应用性能调优问题。该领域过去更像是一门艺术而不是一门科学。他提出了一种称为基于等待调优的方法,使整个调优过程更加可度量,也因此更具科学性。

Java程序员ActionScript 3入门

通常来说,改变技术路线时最艰难的部分是辨别语言语法之间的不同。这篇文章就为Java开发者提供了一份如何转向Flex基础语言ActionScript的指南。

浅谈如何创建Rails应用

本视频主要以财帮子为例,介绍了如何创建一个PV为百万级的Rails应用。其中包括:Rails应用的服务器架构、Rails Cache的优化、负载均衡的处理、Web服务器的调试、分布式解决方案、Open API的设计等等。

Alexandru Popescu谈InfoQ.com网站架构

InfoQ首席架构师Alexandru Popescu在采访中谈论了InfoQ架构、Webwork与DWR、Hibernate与JCR、Hibernate可扩展性、最新的InfoQ视频流系统和InfoQ的未来规划。