
SOAエージェント:グリッドコンピューティングがSOAと出会う
本稿では、Boris LublinskyがグリッドコンピューティングをSOAアーキテクチャ全体でどのように利用することができるのかを説明します。そして、SOAサービスの実装の中で、グリッドを利用したプログラミングモデルを紹介します。

本稿では、Boris LublinskyがグリッドコンピューティングをSOAアーキテクチャ全体でどのように利用することができるのかを説明します。そして、SOAサービスの実装の中で、グリッドを利用したプログラミングモデルを紹介します。
6年間の熟成の後、Big DataフレームワークであるApache Hadoop 1.0.0が最近リリースされた。新リリースのコアフィーチャにはKerberos 認証, Apache HBase、HDFSへのRESTful APIをサポートが含まれている。InfoQは Apache Hadoop ProjectのVPである Arun Murthy氏に新リリースについて聞いた。
企業がソーシャルメディアを使って製品や企業自体の評判を調べる傾向が顕著になっている。これに伴い、単語と定量的メトリクスを使い、ブログの記事に含まれる感情を分析するという独特の課題が現れている。InfoQはブログの感情分析プロジェクトついてSubramanian Kartik氏に詳しい話を聞いた。
LexisNexis傘下のHPCC SystemsがAmazon EC2にThor Data Refinery Clusterをローンチした。HPCC Systemsは企業向けのオープンソース化されたビッグデータ分析技術プラットフォームであり、膨大なデータの取り込み、変換、連結、インデックス作成ができ、ノードに分散した並列処理能力を備えている。
Cap Gemini の Steve Jones 氏が先日の記事で NoSQL/Big Data について,本当にベンダが我々に信じ込ませようとしているような万能策なのか疑問を呈している。氏が指摘するのは,場合によってはインメモリ RDBMS が最善のソリューションとなり得ること,そして典型的な IT 部門にとって Map Reduce のようなアプローチの理解は難しすぎることだ。結論として氏は,Big Data が場合によっては Big Con (大嘘) であり得る,と忠告する。
Amazon Web Service (AWS) チームは,科学分野におけるハイパフォーマンスコンピューティングへのニーズを対象とするリソースセットを発表した。特に "スポット料金 (spot pricing)" マーケットについて,Amazon クラウド環境における費用対効果の高い大規模コンピューティングの手段として強調している。
MapR Technologies社は、Apache HadoopをベースとしHDFSの代わりとなる独自の分散ストレージを備えたビッグデータツールキットをリリースした。このソフトウェアは商用製品であり、無償バージョンであるM3と、有償バージョンであるM5が提供されている。M5には、データのスナップショット、ミラーリングのためのJob Tracker recoveryおよび商用サポートが含まれている。MapRのM5エディションはEMC Greenplumの近々リリースされるHD Enterprise Editionの基盤をなす。
Google の Daniel Peng,Frank Dabek の両氏は "分散トランザクションと通知を用いた大規模逐次処理 (Large-scale Incremental Processing Using Distributed Transactions and Notifications)" という論文を発表した。この中で両氏は,Google のインデックスシステムのような,数十ペタバイトのデータを数千台のマシンを用いて1日当たり数十億回更新するようなシステムに求められるストレージあるいはスループット要件に対しては,データベースが適切な選択ではないことを論証している。
CouchDBの開発会社であるCloudant がCouchDB用のJava View Serverをごく最近、リリースした。その意味は、Map-Reduce のジョブ書くのに、Erlang とJavascript やPythonのようなインタープリタ言語だけではなく、JVMベースの言語でも使える、ということである。