和Google互补的搜索引擎Wolfram|Alpha
Wolfram|Alpha与Google究竟是什么关系,Wolfram|Alpha自己是如何定位的?Wolfram|Alaph在多大程度上是语义网搜索呢?InfoQ中文站就等等这些问题采访了Wolfram研究公司中国区商务经理王翔。
作者 Werner Schuster 译者 宋玮 发布于 2007年4月10日 下午10时28分
过去,JRuby的字符串问题是一直是个难题。对于字符串,Ruby使用字节数组表现;而Java则全面支持Unicode字符串,在内部表现为UTF-16。由于这种差别,运行在Ruby上的代码如果要运行在JRuby上就可能会出现问题,正如Charles O. Nutter解释的那样:但是API不符合Ruby应用程序的预期,经常将个别字符返回为16bit的值,并报告不正确的字符串字节长度,且无法将该字符串编码为全部由8bit的字符组成的字符串。只要Ruby代码涉及到这样的字符,就会出问题。他继续描述了JRuby1.0中的解决方案:
调整字符串编码只是众多工作中的一个,为了达到与Ruby的完美兼容,还需要做许多单调乏味的工作。 一个相关的话题是在JRuby上支持Ruby正则表达式。简单的解决方案是直接用java.util.regex——Java中自带的正则表达式类库,来处理Ruby正则表达式。这个方案已经用了很长一段时间。可是,不断有不同的Bug报告进来,同时出于其他一些方面的考虑,我们觉得需要一个更好的解决方案。java.util.regex的性能问题是众所周知的,而且在JRuby内部使用字节数组表示Ruby字符串会使性能问题更甚(java.util.regex工作时不直接使用字节数组,因此需要先将Ruby字符串进行转换)。 因此,JRuby的核心组成员Ola Bini决定直面困难,重新选择一个解决方案。他先选择了JRegex作为临时的替代解决方案,目前他正在致力于REJ方面的工作,这是他的描述:Ruby字符串是byte[]类型且符合Ruby字符串语义。 传入Ruby代码的Java字符串将被编码为UTF-8,这暗示了你应该在接收参数的代码中用UTF-8 byte[]来工作。 Ruby 字符串传出到Java时也被假定为UTF-8,Java端调用的返回结果应该符合该假定。
REJ是一个我已经启动的项目,它将成为MRI 1.8.6正则表达式引擎的直接端口。这一点很重要,因为这样JRuby的语义将与MRI紧密匹配。我们将能够匹配UTF-8、SJIS和EUC正则表达式等,并且我们将具有像MRI一样的特别功能,即使人们并不一定依赖于这样的特别功能。
Wolfram|Alpha与Google究竟是什么关系,Wolfram|Alpha自己是如何定位的?Wolfram|Alaph在多大程度上是语义网搜索呢?InfoQ中文站就等等这些问题采访了Wolfram研究公司中国区商务经理王翔。
Vijay Narayanan在这篇文章中对数据服务的几个方面进行了介绍,它们都是SOA实践者和数据架构师感兴趣的内容。本文对数据服务的几个方面进行了介绍,包括需求定义,基本原理和好处、范围、开发以及消费模式。
罗马不是一天建成的,豆瓣的技术架构也是随着用户规模的增长一直在持续变化中。在本次演讲中,豆瓣的首席架构师洪强宁将与大家一起分享从上线时的单台服务器架构开始一直到现在的豆瓣架构变迁历程。
Billy McCafferty展示了S#arp架构,它在ASP.NET MVC框架的基础上,荟萃了当今的最佳实践,应用在ASP.NET Web应用程序的架构设计中。
中国作为新兴市场中的新兴市场,是Sun在美国之外实施SSE(SUN Startup Essentials)项目重点关注的地区。在QCon Beijing 2009期间,InfoQ中文站有幸对此项目的负责人王雷先生进行了采访,探讨了关于开源、新兴市场、SSE等话题。
HTML5 是由 WHATWG发起的,最开始的名称叫做Web Application 1.0,而后这个标准吸纳了Web Forms 2.0的标准,并一同被W3C组织所采用,合并成为下一代的HTML5标准。
1 条回复
关注此讨论 回复