BT

如何利用碎片时间提升技术认知与能力? 点击获取答案

W3C高效XML交换格式草案发表

| 作者 Arnon Rotem-Gal-Oz 关注 0 他的粉丝 ,译者 胡键 关注 0 他的粉丝 发布于 2007年7月25日. 估计阅读时间: 2 分钟 | QCon上海2018 关注大数据平台技术选型、搭建、系统迁移和优化的经验。

最近,W3C发布了高效XML交换格式第一版公开草案,该格式建议压缩XML以增加在线或CPU间的效率。可以预料的是,我们很快就能看到对于这个新标准的批评……是的,另一场关于二进制XML的争论正在酝酿之中。

该建议格式如下:

“EXI(Efficient XML Interchange)格式使用由信息和正规语言理论衍生出的一种混合方法,加上经测量验证有效的实际技术,用于熵编码XML信息。利用相对简单的算法(它遵循快速而简洁的实现),以及少量的数据类型,它可靠地产生XML事件流的高效编码。”

简单的说,就是:XML的压缩算法。正如所预料的,批评很快随之而来。首先发难的是Elliotte Harold

高效XML交换格式既不高效,也非XML,同样也不具有可交换性。

Joe Gregorio说他们爱怎么称呼它都行,但是它仍是二进制XML。同时,在XML开发者邮件列表中,Michael Champion问道:“再次启动二进制XML这一永恒思路的时机到了吗?”。在随后的讨论线索中,有些人就EXI与以前的二进制交换格式的努力(如快速信息集格式(FI))之间的区别发起讨论。

Santiago Pericas-Geerstsen(他是W3C XML二进制描述工作组的编辑)对最后一个讨论进行了回应,并说EXI比FI要强,因为它“知道”处理XML,且没有一些通用的信息集。这种先知先觉允许EXI产生更简洁的结果。同样,EXI以字节为单位工作,而不象FI以位为单位,这使得EXI的CPU计算量更小。Santiago还提到了EXI的内部效率测试,测试结果非常好。

无论如何,同样值得注意的是,在2005年5月,技术架构组(TAG)发行的报告中对二进制XML格式表示了厌烦:

因此,我们相信二进制XML的好处必须是可预见的和引人注目的,以证明建议的开发是正确的。

……

如果XML 1.x内在就能满足用户的需要,那么我们的努力方向应该放在探究调节我们的XML实现上,而不是设计新的格式。测量环境应该尽可能的代表全面优化的实现,不只是XML解析器,还有应用或中间件组的周边事物。

二进制XML会再次抓住这次时机吗?只有时间能说明一切。

查看英文原文:W3C Efficient XML Interchange format draft published

评价本文

专业度
风格

您好,朋友!

您需要 注册一个InfoQ账号 或者 才能进行评论。在您完成注册后还需要进行一些设置。

获得来自InfoQ的更多体验。

告诉我们您的想法

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我
社区评论

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

允许的HTML标签: a,b,br,blockquote,i,li,pre,u,ul,p

当有人回复此评论时请E-mail通知我

讨论

登陆InfoQ,与你最关心的话题互动。


找回密码....

Follow

关注你最喜爱的话题和作者

快速浏览网站内你所感兴趣话题的精选内容。

Like

内容自由定制

选择想要阅读的主题和喜爱的作者定制自己的新闻源。

Notifications

获取更新

设置通知机制以获取内容更新对您而言是否重要

BT