InfoQ

InfoQ

新闻

我的书签

登录注册 以永久保存书签。

该内容已经被标记书签!

标记书签错误,请重试!

MapReduce是倒退:拿它与关系数据库比较公平吗?

作者 Scott Delap 译者 宋玮 发布于 2008年1月19日

领域
语言 & 开发,
架构 & 设计,
运维 & 基础架构,
企业架构
主题
Java ,
网格计算
标签
MapReduce ,
Hadoop

最近David J. DeWitt和Michael Stonebraker在the Database Column上写了一篇文章试图将日益流行的MapReduce编程范式与关系数据库进行比较。该文章说道:

……作为数据处理范式,MapReduce代表着一个巨大退步。数据库社区已经学到了如下三个经验,这些经验从40年前IBM第一次在1968年发布IMS时就已经揭示出来了……根据迄今为止的评估实验,我们严重怀疑MapReduce应用程序能有多大伸缩性。此外,MapReduce的实现者应该好好学习近25年来的并行DBMS研究文献。

文章接着给罗列了如下判据:

  • MapReduce是一个糟糕的实现(与B-trees相比)
  • MapReduce不是革新
  • MapReduce缺乏某些特性(如装载和索引)
  • MapReduce与DBMS工具不兼容

博客界很快就声称这一比较及其理由都是漏洞百出的。Greg Jorgensen进行了逐条反驳。在这些条目中,他指出MapReduce不是数据库,而是用于分布式处理的算法技术,不能这么比较。Jorgensen建议更好的比较对象应该是SimpleDB:

……作者真正想抱怨的是分布式“云”数据管理系统,如亚马逊的SimpleDB;实际上,如果你将“MapReduce”换为“SimpleDB”,原文差不多就有意义了……

Rich Skrenta从打破习惯的角度发表了评论:

……打破了你的习惯的东西总是有些地方看不顺眼的。功能不足,发展得也不成熟。但要是在价格上能赢10倍,不牢靠的廉价货最终也会胜出。想想Linux对阵AT&T的Unix,或mysql对阵Oracle……

关于这篇文章冗长的争论和评论还可以从redditycombinator上找到。

查看英文原文:MapReduce A Step Backwards: Is Comparison to Relational Databases Fair?

译者 宋玮 有多年软件开发经验,长期担任技术管理和项目管理工作,一直关心开源软件的发展动态以及软件过程和敏捷开发的实践探索。

深度内容

大规模视频网站的计费与流量管理

本次分享将会就大规模视频网站的计费与流量管理这个话题,从操作层面细细进行讲解和分析,为系统工程师们揭示平日里我们没有关心的另一些内容。同时也希望本次分享能揭示行业中的一些“潜规则”,让互联网行业的流量与带宽管理更为开放与简洁。
本次演讲视频录制于QCon杭州2011

专访Jeffrey Richter:Windows 8是微软的重中之重

Jeffrey Richter以其多本Windows核心技术的经典著作而闻名,同时,他深入掌握微软的.NET等一系列核心技术,2012年1月,Jeffrey Richter在北京接受了InfoQ中文站的专访,谈到Windows 8和WinRT编程,并就异步编程、Windows编程中的可扩展性、性能和安全性方面给出自己的建议。

应用云平台的可用性——从新浪SAE看云平台设计

云计算平台的可用性,相比传统互联网服务而言,更加复杂和困难,也更具有挑战性。本文借助新浪SAE云平台为读者讲述了云平台可用性的定义、如何打造高可用的平台,以及对云计算的用户提出了建议。

JVM定制改进 @ 淘宝

淘宝高度重视Java平台的健康发展,组建了一个团队专注于Java平台的底层部分的性能、功能与稳定性改进;工作主要基于OpenJDK中的HotSpot VM开展,其中一些通用的功能随后也会逐渐反馈给OpenJDK社区。希望能与使用Java平台开发应用的大家交流经验。
本次演讲视频录制于QCon杭州2011

"伤得起"的云计算应用——对云端应用之架构的思考

2011年4月21日至22日是值得云计算从业者纪念的日子。Amazon的IaaS服务出现故障,导致许多商业网站的服务中断,影响非常严重。作为云计算用户,我们需要思考的是,如何保证即便在云服务不可用的情况,我们的应用架构仍然能够屹立不倒?本文正是站在云计算用户的角度试图探讨这一问题。

让交付的速度跟上思考的速度

12人的技术团队,4组刀片服务器,每月20亿的访问量,每日1次准时部署,99.9%的可用性。这可能吗?当然。想知道如何做的吗?百姓网将与您分享他们在DevOps实践过程中的经验和技巧。
本次演讲视频录制于QCon杭州2011

架构之路——穿行在产品和业务之间

篱笆作为一家起源于社区的电子商务公司,反映到技术层面就是同时要面对产品和业务,以及经营战略的变化调整。如何在产品和业务的夹缝之间完成技术架构的抽象与平衡,寻找更有效的价值定位,这当中有些经验教训和个人感悟愿与众人分享。
本次演讲视频录制于QCon杭州2011

特性注入:成功三部曲

本文将对特性注入以及相关方法做一个扫盲性的介绍。我们会解释这个框架的关键要素,并附上实例来证实它们。为了让文章保持相对较短,我们不会深入到某个工具或方法中,而是会给出一些参考资料,以便大家做进一步的研究。