BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

Jackson创始人Tatu Saloranta回应JSON基准测试

| 作者 Matt Raible 关注 12 他的粉丝 ,译者 梅雪松 关注 0 他的粉丝 发布于 2014年5月20日. 估计阅读时间: 6 分钟 | QCon上海2018 关注大数据平台技术选型、搭建、系统迁移和优化的经验。

上周,InfoQ报道了Groovy 2.3的JSON解析器比之前的版本快了很多。当写那篇文章时,我们发了封邮件给Jackson JSON处理器的创始人Tatu Saloranta。我们想听听他对Rick Hightower报道的Groovy和Boon提供了JVM上最快的JSON解析器有什么看法。

InfoQ:你觉得那些基准测试是否准确?

Tatu Saloranta:在一个非常低的水平,我认为测试方法是一致的。JMH是个好框架,使用适当的迭代计数等,结果是可以重复的。

我认为在某些或者很多测试中,Boon和Groovy是有可能比Jackson更快的,但我确实对这种极端的声明表示怀疑,特别是这些挑选的特定测试和/或测试用例。

我的关注主要包括三个方面,都列在下一个问题的回答中。

此外,只是为了确认,我看到的是GitHub上的测试。我认为有很多的衍生工具,也许我的一些意见可能不太适用。

InfoQ:你认为这些基准测试是否反映了真实世界的行为?

TS:真实世界的行为和实际使用情况。我认为他们可能代表了使用情况的一小部分。说穿了,我觉得他们倾向于强调“好的例子”。我注意到三个方面:

  1. 输入源。最常被引用的测试都从Java字符串开始。字符串很少被当作输入源,因为它们是JVM构造,所有外部的输入都是字节流。单元测试中使用字符串,或者难道框架(或平台,也许Groovy这样做?)只公开字符串。对于写操作也是同样如此。这主要因为两件事情:(a)Jackson对字节流或文件存储进行了深度优化,因为这是REST服务经常用的;(b)Boon非常积极地优化字符串的处理,特别是使用sun.misc.Unsafe去访问和修改String类提供的底层的char[]。因此,使用这些较少见,并且确实是Boon有明显优势(无可否认,这是更快的字符串)的用例作为使用源,看似有点可疑。

  2. 处理/访问风格:“无类型的(Untyped)”,处理Map(而不是POJO)的List。这第二个方面虽然没那么可疑,但对我来说很奇怪,更不要说只对List-of-Map对象读和写,而不是真正的POJO。所有现代的JVM REST框架都关注于POJO,尽管有些也允许使用“无类型的”。不同的用户有不同的偏好;所以我认为只测试一种,或者测试两种,都是合法的,但这应该记录在案。

  3. 懒构建测试没有访问和校验数据。Boon有不少面向输入懒处理的优化。对于只访问很小的数据子集的用例,这是有帮助的。但这儿的问题是性能测试没有做任何数据访问,事实上,解析器可能返回任何对象,而测试可能没有真正注意到这点。所以我觉得这些测试碰巧让懒处理得到了优化,正因为此,它们不代表你真的能得到这些优化。

也许我该重新整理一下上面所说的,这些测试似乎没有使用实际有效的使用模式,说得好听点是在做作。它们只读/写JSON,但不使用它。我明白从某种角度来说这是有道理的,尽量不增加处理的开销,但不幸的是,由于不同的取舍,它歪曲了结果。所以当用户使用,例如JAX-RS风格的REST处理,InputStream的所有JSON数据都绑定到POJO;以及反方向的从其它POJO到OutputStream,性能体验将与基准测试的结果完全不同。

另一方面,如果使用“无类型的”对象,至少代码要做某种形式的遍历;并且,如果同一对象要用于双向传递,同样要修改。

在Boon的例子中,叠置(Overlay)的使用(对原始输入进行索引,以便能够提取数据),以及Map的懒构造,隐藏了实际将遇到的真实开销。并且如果字符串用于源/目标,那么就存在编码/解码开销(Jackson和Boon之间有区别,Jackson这一步更重),这进一步降低了Jackson端到端的相对效率。

InfoQ:你有计划让Jackson将来更快吗?或者它已经“足够快”了?

TS:在这点上,我会做些小事情,但我没有大计划去关注性能。我希望能做一些研究(基准测试是有用的!)降低读取字符串源的消耗;Jackson Afterburner模块已经有一些积极的优化。但这很可能是渐进式的。

自从最早的1.x版本开始,性能从来就不是第一目标;尽管我确实想保持开销适中或较低,但有更重要的事情要关注:易用性、支持其它格式(XML、CSV、CBOR和Smile)、惯例和模块化数据类型处理库(Joda,Guava)等等。

我想这应该是公平的,在正确的场景下,我觉得它非常接近于“足够快”。

InfoQ:谢谢你的坦诚回应!

TS:没问题,谢谢你发掘出这个。我认为总的来说Boon对JSON是有用的;特别是Groovy取得现代高性能支持,这非常棒。但我真的希望两者的比较是苹果对苹果的比较,同时声明应该有证据支持。:)

原文链接:Jackson Founder, Tatu Saloranta, responds to JSON Benchmarks

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT