
Oozieの紹介
複数のMap/Reduceジョブを論理的なひとつのユニットに組み上げるフレームワーク、Oozieを紹介します。

このInfoQスペシャルインタビューでは、YahooにおいてHadoopがどのように使われているか、その開発におけるチャレンジ、そしてプロジェクトの将来的な方向性についてCuttingが語ってくれています。
6年間の熟成の後、Big DataフレームワークであるApache Hadoop 1.0.0が最近リリースされた。新リリースのコアフィーチャにはKerberos 認証, Apache HBase、HDFSへのRESTful APIをサポートが含まれている。InfoQは Apache Hadoop ProjectのVPである Arun Murthy氏に新リリースについて聞いた。
Baidu Technical Salon は定期的なオフラインコミュニケーション活動である。Baidu がホスト,InfoQ が計画・実行・実装を担当する。取り上げるトピックはクラウドコンピューティング,モバイルインターネット,ビッグデータ,ログ解析など人気のものだ。この記事では主に Technical Salon を通じた Baidu の技術企業サポート,これらアクティビティに対するコミュニティからのフィードバック,さらに 2012 年の簡単な計画について検討した。
LexisNexis傘下のHPCC SystemsがAmazon EC2にThor Data Refinery Clusterをローンチした。HPCC Systemsは企業向けのオープンソース化されたビッグデータ分析技術プラットフォームであり、膨大なデータの取り込み、変換、連結、インデックス作成ができ、ノードに分散した並列処理能力を備えている。
Hadoop Worldのキーノートにおいて、eBayは完全に再構築したサーチエンジンCassiniのアーキテクチャについて説明し、2012年に稼動させる予定であることを表明した。このシステムはランキング生成を改善するためにコンテンツとユーザメタデータをすべてインデックス化しており、毎時それらインデックスを更新する。毎時のインデックス更新にはApache Hadoopを、アイテム情報へのランダムアクセスにはApache HBaseが使われている。
Joe McKendrick氏の新しい投稿は、共通のエンタープライズデータプラットフォーム上に作られた改善されたデータアクセスによって、エンタープライズSOAサービスを格段に単純化できるHadoopの能力について概要している。
企業はますます意思決定をビックデータに頼るようになっている。Amazon、Cloudera、IBMはそれぞれHadoop-as-a-Serviceの提供を発表した。Microsoftも来年、同様のサービスを発表する。
マイクロソフトは、コードネーム"Denali"として知られるSQL Serverの次期バージョンであるSQL Server 2012をアナウンスした。これは、Apache HadoopによるBig Dataの処理、タッチベースのビジネスインテリジェンスツールであるPower View機能が提供される。