InfoQ

InfoQ

新闻

我的书签

登录注册 以永久保存书签。

该内容已经被标记书签!

标记书签错误,请重试!

JRuby 1.0里的Unicode状态和Ruby兼容性

作者 Werner Schuster 译者 宋玮 发布于 2007年4月10日

领域
架构 & 设计,
语言 & 开发
主题
Java ,
JRuby ,
Ruby ,
国际化
标签
发布
过去,JRuby的字符串问题是一直是个难题。对于字符串,Ruby使用字节数组表现;而Java则全面支持Unicode字符串,在内部表现为UTF-16。由于这种差别,运行在Ruby上的代码如果要运行在JRuby上就可能会出现问题,正如Charles O. Nutter解释的那样:
但是API不符合Ruby应用程序的预期,经常将个别字符返回为16bit的值,并报告不正确的字符串字节长度,且无法将该字符串编码为全部由8bit的字符组成的字符串。只要Ruby代码涉及到这样的字符,就会出问题。
他继续描述了JRuby1.0中的解决方案:
  • Ruby字符串是byte[]类型且符合Ruby字符串语义。
  • 传入Ruby代码的Java字符串将被编码为UTF-8,这暗示了你应该在接收参数的代码中用UTF-8 byte[]来工作。
  • Ruby 字符串传出到Java时也被假定为UTF-8,Java端调用的返回结果应该符合该假定。
  • 调整字符串编码只是众多工作中的一个,为了达到与Ruby的完美兼容,还需要做许多单调乏味的工作。 一个相关的话题是在JRuby上支持Ruby正则表达式。简单的解决方案是直接用java.util.regex——Java中自带的正则表达式类库,来处理Ruby正则表达式。这个方案已经用了很长一段时间。可是,不断有不同的Bug报告进来,同时出于其他一些方面的考虑,我们觉得需要一个更好的解决方案。java.util.regex的性能问题是众所周知的,而且在JRuby内部使用字节数组表示Ruby字符串会使性能问题更甚(java.util.regex工作时不直接使用字节数组,因此需要先将Ruby字符串进行转换)。 因此,JRuby的核心组成员Ola Bini决定直面困难,重新选择一个解决方案。他先选择了JRegex作为临时的替代解决方案,目前他正在致力于REJ方面的工作,这是他的描述:
    REJ是一个我已经启动的项目,它将成为MRI 1.8.6正则表达式引擎的直接端口。这一点很重要,因为这样JRuby的语义将与MRI紧密匹配。我们将能够匹配UTF-8、SJIS和EUC正则表达式等,并且我们将具有像MRI一样的特别功能,即使人们并不一定依赖于这样的特别功能。
    到2007年5月,所有这些工作将确保JRuby 1.0尽可能地接近Ruby。
     
    译者简介:宋玮是InfoQ中文站的志愿者翻译。他有多年软件开发经验,从2002年开始就使用Java,在各个项目开发过程中先后使用过Struts、Oracle ADF、AspectJ等。最近正在使用Spring及Ruby on Rails,对敏捷方法有比较大的兴趣并做过一些尝试。他的blog为http://www.donews.net/victorsong。加入InfoQ中文站志愿者翻译队伍,请邮件至china-editorial@infoq.com

    译者 宋玮 有多年软件开发经验,长期担任技术管理和项目管理工作,一直关心开源软件的发展动态以及软件过程和敏捷开发的实践探索。

    JRuby能利用Java 发表人 Wang Dong 发表于
    1. 返回顶部

      JRuby能利用Java

      发表人 Wang Dong

      但Ruby本身在Unicode支持的改进上是怎么计划的呢?

    深度内容

    专访Jeffery Richter:Windows 8是微软的重中之重

    Jeffery Richter以其多本Windows核心技术的经典著作而闻名,同时,他深入掌握微软的.NET等一系列核心技术,2012年1月,Jeffery Richter在北京接受了InfoQ中文站的专访,谈到Windows 8和WinRT编程,并就异步编程、Windows编程中的可扩展性、性能和安全性方面给出自己的建议。

    应用云平台的可用性——从新浪SAE看云平台设计

    云计算平台的可用性,相比传统互联网服务而言,更加复杂和困难,也更具有挑战性。本文借助新浪SAE云平台为读者讲述了云平台可用性的定义、如何打造高可用的平台,以及对云计算的用户提出了建议。

    JVM定制改进 @ 淘宝

    淘宝高度重视Java平台的健康发展,组建了一个团队专注于Java平台的底层部分的性能、功能与稳定性改进;工作主要基于OpenJDK中的HotSpot VM开展,其中一些通用的功能随后也会逐渐反馈给OpenJDK社区。希望能与使用Java平台开发应用的大家交流经验。
    本次演讲视频录制于QCon杭州2011

    "伤得起"的云计算应用——对云端应用之架构的思考

    2011年4月21日至22日是值得云计算从业者纪念的日子。Amazon的IaaS服务出现故障,导致许多商业网站的服务中断,影响非常严重。作为云计算用户,我们需要思考的是,如何保证即便在云服务不可用的情况,我们的应用架构仍然能够屹立不倒?本文正是站在云计算用户的角度试图探讨这一问题。

    让交付的速度跟上思考的速度

    12人的技术团队,4组刀片服务器,每月20亿的访问量,每日1次准时部署,99.9%的可用性。这可能吗?当然。想知道如何做的吗?百姓网将与您分享他们在DevOps实践过程中的经验和技巧。
    本次演讲视频录制于QCon杭州2011

    架构之路——穿行在产品和业务之间

    篱笆作为一家起源于社区的电子商务公司,反映到技术层面就是同时要面对产品和业务,以及经营战略的变化调整。如何在产品和业务的夹缝之间完成技术架构的抽象与平衡,寻找更有效的价值定位,这当中有些经验教训和个人感悟愿与众人分享。
    本次演讲视频录制于QCon杭州2011

    特性注入:成功三部曲

    本文将对特性注入以及相关方法做一个扫盲性的介绍。我们会解释这个框架的关键要素,并附上实例来证实它们。为了让文章保持相对较短,我们不会深入到某个工具或方法中,而是会给出一些参考资料,以便大家做进一步的研究。

    解析JDK 7的动态类型语言支持

    随着JDK 7的发布,字节码指令集终于迎来了第一位新成员——invokedynamic指令。这条新增加的指令是JDK 7实现“动态类型语言(Dynamically Typed Language)”支持而进行的改进之一,也是为JDK 8可以顺利实现Lambda表达式做技术准备。在这篇文章中,我们将去了解JDK 7这项新特性的出现前因后果和它的意义。