InfoQ

新闻

MapReduce是倒退:拿它与关系数据库比较公平吗?

作者 Scott Delap 译者 宋玮 发布于 2008年1月19日 上午4时38分

社区
Java
主题
网格计算
标签
MapReduce,
Hadoop

最近David J. DeWitt和Michael Stonebraker在the Database Column上写了一篇文章试图将日益流行的MapReduce编程范式与关系数据库进行比较。该文章说道:

……作为数据处理范式,MapReduce代表着一个巨大退步。数据库社区已经学到了如下三个经验,这些经验从40年前IBM第一次在1968年发布IMS时就已经揭示出来了……根据迄今为止的评估实验,我们严重怀疑MapReduce应用程序能有多大伸缩性。此外,MapReduce的实现者应该好好学习近25年来的并行DBMS研究文献。

文章接着给罗列了如下判据:

  • MapReduce是一个糟糕的实现(与B-trees相比)
  • MapReduce不是革新
  • MapReduce缺乏某些特性(如装载和索引)
  • MapReduce与DBMS工具不兼容

博客界很快就声称这一比较及其理由都是漏洞百出的。Greg Jorgensen进行了逐条反驳。在这些条目中,他指出MapReduce不是数据库,而是用于分布式处理的算法技术,不能这么比较。Jorgensen建议更好的比较对象应该是SimpleDB:

……作者真正想抱怨的是分布式“云”数据管理系统,如亚马逊的SimpleDB;实际上,如果你将“MapReduce”换为“SimpleDB”,原文差不多就有意义了……

Rich Skrenta从打破习惯的角度发表了评论:

……打破了你的习惯的东西总是有些地方看不顺眼的。功能不足,发展得也不成熟。但要是在价格上能赢10倍,不牢靠的廉价货最终也会胜出。想想Linux对阵AT&T的Unix,或mysql对阵Oracle……

关于这篇文章冗长的争论和评论还可以从redditycombinator上找到。

查看英文原文:MapReduce A Step Backwards: Is Comparison to Relational Databases Fair?

深度内容

和Google互补的搜索引擎Wolfram|Alpha

Wolfram|Alpha与Google究竟是什么关系,Wolfram|Alpha自己是如何定位的?Wolfram|Alaph在多大程度上是语义网搜索呢?InfoQ中文站就等等这些问题采访了Wolfram研究公司中国区商务经理王翔。

SOA契约成熟度模型

本文说明了所推荐的契约版本管理设计策略是如何与SOA成熟度模型发生联系的。文章目的是为实现版本管理和可组合性提供一个路线图。

数据服务简介

Vijay Narayanan在这篇文章中对数据服务的几个方面进行了介绍,它们都是SOA实践者和数据架构师感兴趣的内容。本文对数据服务的几个方面进行了介绍,包括需求定义,基本原理和好处、范围、开发以及消费模式。

分块云计算

在本文中,Jimmy Nilsson描述了一种他在过去数年间观察到的一种正在缓慢成长的架构风格,他把这种风格称为“分块云计算”。

豆瓣网技术架构变迁

罗马不是一天建成的,豆瓣的技术架构也是随着用户规模的增长一直在持续变化中。在本次演讲中,豆瓣的首席架构师洪强宁将与大家一起分享从上线时的单台服务器架构开始一直到现在的豆瓣架构变迁历程。

融合思想:深入探索S#arp架构

Billy McCafferty展示了S#arp架构,它在ASP.NET MVC框架的基础上,荟萃了当今的最佳实践,应用在ASP.NET Web应用程序的架构设计中。

王雷谈开源以及新兴市场计划

中国作为新兴市场中的新兴市场,是Sun在美国之外实施SSE(SUN Startup Essentials)项目重点关注的地区。在QCon Beijing 2009期间,InfoQ中文站有幸对此项目的负责人王雷先生进行了采访,探讨了关于开源、新兴市场、SSE等话题。

使用HTML5构建下一代的Web Form

HTML5 是由 WHATWG发起的,最开始的名称叫做Web Application 1.0,而后这个标准吸纳了Web Forms 2.0的标准,并一同被W3C组织所采用,合并成为下一代的HTML5标准。