InfoQ

InfoQ

News

マイブックマーク

ブックマークするためにログイン または 会員登録 する

ブックマークされました!

ブックマークがエラーになりました。もう一度お願いします。

AmazonがEC2向けHadoopベースのMapReduceをリリース

作者 Scott Delap , 翻訳者 ガーナー 淳子 投稿日 2009年4月17日

セクション
運用/インフラ,
設計/アーキテクチャ,
デベロップメント,
エンタープライズ・アーキテクチャ
トピック
Java ,
グリッドコンピューティング ,
クラウドコンピューティング
タグ
EC2 ,
MapReduce ,
Hadoop

原文(投稿日:2009/4/2)へのリンク

ポピュラーになったApache Hadoop(参考記事) MapReduceフレームワークをAmazon EC2(参考記事)上で実行する方法を詳しく述べているチュートリアルが、かなり長期に渡り利用可能になっている。Amazonは4月2日にAmazon Elastic MapReduceによる公式サポートを提供し、そのレベルアップを行った。以下はその製品情報ページ(リンク)からである。

Amazon Elastic MapReduceはAmazon EC2インスタンス上で自動的にMapReduceフ レームワークのHadoop実装を行い、並列処理ができるようジョブ・フロー中のデータを細分化し(「map」機能)、最後に処理データを最終結果に再結 合します(「reduce」機能)。Amazon S3は分析対象データのソースおよび最終結果の出力先としての役割を果たします。

Amazon Elastic MapReduceの価格設定は既存のEC2料金に15%追加となっている。FAQ(リンク)には価格設定および使用法の詳細が記されている。AWSの公式ブログ(リンク)にも、サービスのカバー範囲が記載されている。

…Elastic MapReduceで の処理は、ジョブ・フローのコンセプトを中心に展開されています。各ジョブ・フローには1つ以上のステップがあります。それぞれのステップはAmazon S3からある程度の量のデータを取り込み、Hadoopを実行する特定数のEC2インスタンスに分配し(必要に応じインスタンスを起動します)、全ての作 業を行います。その後S3に結果を返します。各ステップはアプリケーション、すなわち特定の「mapper」や「reducer」コード(ストリーミン グ・モデルを介して使うためのJava JARまたはスクリプト・コード)を参照しなくてはいけません。私たちは、Sum、Min、Max、Histogram、そしてCountといった複数の 共通オペレーションのビルトイン・サポートを伴うAggregate Packageも追加しました。コードを書き始める前に多くのことを終わらせることができるのです。

私たちはElastic MapReduceに対して3つの異なるアクセス・ルートを設けています。Elastic MapReduce APIによって完全なコントロールをすることができますし、あるいはElastic MapReduceコマンドライン・ツールも使用できます。またAWS Management ConsoleのElastic MapReduceタブではポインタの移動とクリックだけで全てを行うことができます。ではそれぞれを簡単に見てみましょう…

ZDNetのDana Gardner氏はビジネス・インテリジェンス・マーケットへ向けたAmazonの新サービス実施について考えをめぐらせている(リンク)

特集コンテンツ一覧

GAE開発の落とし穴

Googleのクラウド環境をつかったGoogle App Engineによる開発するにあたり、初めての試みで苦悩する開発者達の経験をもとに、各開発フェーズにあわせて問題点やどう解決したかをご紹介します

イベントレポート:「Coqチュートリアル#1」

去る1月12日、定理証明支援系ツールCoqの初心者向けチュートリアルが開催さ れた(http://kokucheese.com/event/index/23667/)。今後も2月2日 (http://kokucheese.com/event/index/23744/)、2月9日、2月16日と引き続き開 催されていく予定である。本記事では、開催の様子をレポートする。

Javaの未来についてのNeal Gafter氏とのディスカッション

Choosing Options

Neal Gafter氏はOracleによるJava買収の影響に関する議論、Javaにセグメンテッドスタックやメタオブジェクトプロトコルを追加することについての主張、そしてJavaとC#との比較について話をしてくれた。

Google Dartのエッセンス:アプリケーションの構築、スナップショット、Isolate

GoogleはVMをともなう新しい言語であり、JSコンパイラでもあるDartをプレビューした。 InfoQはDartのアプリの構築に貢献する文法の裏側を探った:スナップショット、Isolate、モジュール方式

CSPベースのモデル検査ツール「Process Analysis Toolkit」

本記事ではCSPベースの「マルチドメイン・モデル検査ツール」である、PAT(Process Analysis Toolkit)について紹介する。モデル検査は、形式手法(Formal Method)という方法論を基礎とする技術であり、複雑さが増大しながらも安全性を求められる、現在のソフトウェア開発の状況に対する処方箋の1つとして注目されている手法である。

Jenkinsによる継続的インテグレーションのススメ(4) ~CloudBeesでJenkinsをサービスとして使う~

前回まで、Jenkinsの幾つかの側面に注目して解説をしてきました。シリーズ最後の今回は、Jenkinsをサービスとして使う方法を紹介します。

書籍『抽象によるソフトウェア設計-Alloyではじめる形式手法-』の紹介

Alloyは、MITにて開発された仕様記述言語であり、ツールによる自動解析を使い、インクリメンタルに形式仕様が書けることが特長である。筆者らはAlloy開発者による、Alloyを使った形式手法入門書を翻訳、今夏にオーム社より刊行した。本記事では、Alloyの簡単な概要と、翻訳書『抽象によるソフトウェア設計』(「Alloy本」)を紹介する。

Windows デバイスで開発するタッチユーザーインターフェイス

スマートフォンを中心としたマルチデバイスにおけるタッチユーザーインターフェイスへの対応は、既に必須の項目となりつつある。本記事では、Windows デバイスにおける UX のベースとなっている「メトロ」というデザイン言語を掘り下げながら、既存環境を意識しつつもどのようにタッチユーザーインターフェイス開発に取り組んでいくべきであるかについて解説していく。