InfoQ

新闻

JRuby 1.0里的Unicode状态和Ruby兼容性

作者 Werner Schuster 译者 宋玮 发布于 2007年4月10日 下午10时28分

社区
Ruby,
Java
主题
国际化,
JRuby
标签
发布
过去,JRuby的字符串问题是一直是个难题。对于字符串,Ruby使用字节数组表现;而Java则全面支持Unicode字符串,在内部表现为UTF-16。由于这种差别,运行在Ruby上的代码如果要运行在JRuby上就可能会出现问题,正如Charles O. Nutter解释的那样:
但是API不符合Ruby应用程序的预期,经常将个别字符返回为16bit的值,并报告不正确的字符串字节长度,且无法将该字符串编码为全部由8bit的字符组成的字符串。只要Ruby代码涉及到这样的字符,就会出问题。
他继续描述了JRuby1.0中的解决方案:
  • Ruby字符串是byte[]类型且符合Ruby字符串语义。
  • 传入Ruby代码的Java字符串将被编码为UTF-8,这暗示了你应该在接收参数的代码中用UTF-8 byte[]来工作。
  • Ruby 字符串传出到Java时也被假定为UTF-8,Java端调用的返回结果应该符合该假定。
  • 调整字符串编码只是众多工作中的一个,为了达到与Ruby的完美兼容,还需要做许多单调乏味的工作。 一个相关的话题是在JRuby上支持Ruby正则表达式。简单的解决方案是直接用java.util.regex——Java中自带的正则表达式类库,来处理Ruby正则表达式。这个方案已经用了很长一段时间。可是,不断有不同的Bug报告进来,同时出于其他一些方面的考虑,我们觉得需要一个更好的解决方案。java.util.regex的性能问题是众所周知的,而且在JRuby内部使用字节数组表示Ruby字符串会使性能问题更甚(java.util.regex工作时不直接使用字节数组,因此需要先将Ruby字符串进行转换)。 因此,JRuby的核心组成员Ola Bini决定直面困难,重新选择一个解决方案。他先选择了JRegex作为临时的替代解决方案,目前他正在致力于REJ方面的工作,这是他的描述:
    REJ是一个我已经启动的项目,它将成为MRI 1.8.6正则表达式引擎的直接端口。这一点很重要,因为这样JRuby的语义将与MRI紧密匹配。我们将能够匹配UTF-8、SJIS和EUC正则表达式等,并且我们将具有像MRI一样的特别功能,即使人们并不一定依赖于这样的特别功能。
    到2007年5月,所有这些工作将确保JRuby 1.0尽可能地接近Ruby。
     
    译者简介:宋玮是InfoQ中文站的志愿者翻译。他有多年软件开发经验,从2002年开始就使用Java,在各个项目开发过程中先后使用过Struts、Oracle ADF、AspectJ等。最近正在使用Spring及Ruby on Rails,对敏捷方法有比较大的兴趣并做过一些尝试。他的blog为http://www.donews.net/victorsong。加入InfoQ中文站志愿者翻译队伍,请邮件至china-editorial@infoq.com
    JRuby能利用Java 发表人 Dong Wang 发表于 2007年4月11日 上午12时3分
    1. 返回顶部

      JRuby能利用Java

      2007年4月11日 上午12时3分 发表人 Dong Wang

      但Ruby本身在Unicode支持的改进上是怎么计划的呢?

    深度内容

    模块化Java:声明式模块化

    本文是模块化Java系列文章的第4篇,介绍的是声明式模块化。文中描述了组件如何以声明的方式来定义并组织在一起,而无需让代码依赖于OSGI API。

    Ian Robinson和Jim Webber谈论基于Web的整合

    本采访是在伦敦举行的QCon2009上记录的,Ian Robinson和Jim Webber探讨了如何将Web作为整合平台以及REST在理论上和实践中的好处。

    项目管理修炼之道(精选版)

    项目管理对于项目成败至关重要,但实践中每个项目都有自己的独特性,没有现成的解决方案可以套用。书中从应对实际风险的角度出发,讲述了从项目启动、项目规划到项目结束的整个管理流程,展示了作者的思考过程。本迷你书从原书中精选出5个章节。

    那是鸟,还是飞机?不,那是超人!

    在这个演讲中,Fred将会揭示敏捷的一些外在因素,并会重点关注敏捷获得成功的内在原因。从案例研究和真实的项目经验来看,Fred认为:工具、管理体系都不能让你变得敏捷。敏捷的成功,植根于士气高涨、充分授权的工作者身上,他们能够以不同以往的方式思考问题。

    访谈和书摘:Eben Hewitt的新书《Java SOA Cookbook》

    Java SOA Cookbook

    Eben Hewitt的新书《Java SOA Cookbook》从Java实现的角度讨论了面向服务架构。Eben在书中讨论了SOA基础、工具、最佳实践和SOA治理等主题。

    Mark Richard的《Java消息服务》第二版

    Mark Richards的新书《Java消息服务》第二版覆盖了JMS的许多主题, 包括发布和订阅模式以及点对点模式,消息过滤和事务等。InfoQ与Mark谈论了跟他的新作。

    模块化Java:动态模块化

    本文是“模块化Java”系列文章的第三篇,讨论动态模块化,内容涉及如何解析bundle类、bundle如何变化、以及bundle之间如何通信。

    让测试也敏捷起来

    对于测试组织来说,敏捷方法带来的快速迭代却让测试本身变得困难起来:缺乏“足够详细的文档”,缺乏“仔细设计用例的时间”等等。在本演讲中,段念将与大家探讨如何在敏捷过程中进行测试。