
Hadoop基本流程与应用开发
本文介绍了Hadoop的基本流程、业务场景、代码范例以及集成测试。本文是《分布式计算开源框架Hadoop入门实践》三部曲的最后一部。

本文介绍了Hadoop如何配置分布式框架运行环境,同时特别讲解了其中的一些细节。Hadoop可以单机跑,也可以配置集群跑,这里主要重点说一下集群配置运行的过程。本文是Hadoop入门实践三部曲的第二部。

Hadoop是Apache开源组织的一个分布式计算开源框架,在很多大型网站上都已经得到了应用,如亚马逊、Facebook和Yahoo等等。本文是Hadoop入门实践三部曲的第一部,主要讲述了What和Why的问题。
现在人们面临的挑战不再是收集信息,而是挖掘数据以回答特定研究问题。Benjamin Lieberman向大家介绍了用分布式数据挖掘来处理这些分布式海量数据的技术。
最近有几个流行的Ruby项目开始使用Erlang了。让我们看看EngineYard的Vertebra和Powerset的Fuzed,以及Github最近是如何使用Erlang的。
Appistry最近发布了他们EAF产品的一个免费的、5个服务器规模的社区版。InfoQ有幸采访到了其副总裁Sam Charrington,讨论了这一变化及Appistry在网格/云计算领域的总体地位。
“云计算”这个术语已是无处不在,从Web2.0大会,到业界巨头的企业架构会议的白板上,以及创业公司开发者的笔记本上,你都能看到它的身影。如今被问起最多的问题就是:“什么是云计算?”
8年前,网络的接口几乎就是浏览器,虽然已经开始有Web Service等一系列把网络作为面向服务的技术出现,但用户的计算还是集中在本地PC的软件完成;8年后,用户不仅已经习惯于通过Blog、Wiki使用网络提供的消费性计算,文档、电子表格等以往只能在本地PC完成的工作也逐步从PC搬到了网络,此时微软却反过来强调网络与软件的协作,为什么?