InfoQ ホームページ Big Data に関するすべてのコンテンツ
-
Oracle、NoSQLへ参入
OracleはOracle Berkeley DB Java EditionをベースにしたキーバリューストレージであるOracle NoSQL Databaseを搭載したBig Data Applianceを発表した。これは、数十億の行、数テラバイトを格納する能力を持ち、トランザクションのACID特性、CRUD、シャーディングをサポートする。また、単一障害点は無く、データセンターレプリケーションを利用したデザスタディカバリも実現できる。
-
ハイパフォーマンスコンピューティング用の新リソースで,科学技術コミュニティへの展開を図る AWS
Amazon Web Service (AWS) チームは,科学分野におけるハイパフォーマンスコンピューティングへのニーズを対象とするリソースセットを発表した。特に "スポット料金 (spot pricing)" マーケットについて,Amazon クラウド環境における費用対効果の高い大規模コンピューティングの手段として強調している。
-
CassandraSF2011:進歩と将来
Johnathan Ellis氏はCassandra SF 2011で基調講演を行った。昨年の主なプロジェクト成果は、複数データセンターへのデプロイのサポートにおける改善、最適化された読み込みパフォーマンス、統合されたキャッシング、SQLに似た言語のCQLを含んだクライアントAPIの改善などである。 将来は、効率的なデータベース修復、ストレージの圧縮、最適化されたパフォーマンス、拡張されたCQL言語の全てに磨きをかけることである、と強調していた。
-
Yahoo HadoopからスピンアウトしたHortonworksが計画を発表
Yahooは中核Hadoopチームをスピンアウトし、新しくHortonworks社を作った。CEOのEric Baldeschwieler氏はHadoopの採用を容易にし、可用性、パフォーマンス、管理に関する同社の中核技術の改善に関するビジョンを発表した。Hortonworks社は主にパートナーを通じてサポート、トレーニング、保障が販売される。
-
MapR社がHadoopをベースとした商用ディストリビューションをリリース
MapR Technologies社は、Apache HadoopをベースとしHDFSの代わりとなる独自の分散ストレージを備えたビッグデータツールキットをリリースした。このソフトウェアは商用製品であり、無償バージョンであるM3と、有償バージョンであるM5が提供されている。M5には、データのスナップショット、ミラーリングのためのJob Tracker recoveryおよび商用サポートが含まれている。MapRのM5エディションはEMC Greenplumの近々リリースされるHD Enterprise Editionの基盤をなす。
-
-
Ravi Kannan氏がACM SIGACT Knuth Prize 2011を受賞
Microsoft ResearchのRavi Kannan氏が ACM SIGACTの(Special Interest Group on Algorithms and Computation Theory) Knuth Prize 2011の受賞者に指名された。プレス発表によると Microsoft Researchの科学者である氏は、長い間あった計算上の問題を解くことを目的にした、有力なアルゴリズム上の技法に関する研究に対して受賞した。
-
CouchbaseがCouchbase Serverとアドバイザリー・メンバを発表
Couchbase(先ごろMembaseとCouchOneの合併により設立された会社)は、Membase ServerとMobile Couchbaseに加えて、Couchbase Serverのリリースをアドバイザリー・メンバの紹介とともに発表した。
-
アップグレードと異なるプログラミングパラダイムのためのHadoop再設計
YahooはHadoopのMap-Reduceのアーキテクチャの中核部分を再設計し、簡単に更新でき、より多くのクラスタで動作し、高速回復をサポートすることを発表した。また、Map-Reduce以外のプログラミングパラダイムもサポートする予定だ。再設計されることでMap-Reduceを制御するHadoopの中核部分はリソースマネージャに切り出される。このリソースマネージャがさまざまな分散処理のパラダイムをサポートする。また、Map-Reduceはユーザが利用できるライブラリになるので、同じクラスタで複数のバージョンのMap-Reduceコードを実行できるようになる。新しい設計はクラスタマネジメントプロジェクトであるオープンソースのMesosに似ている。Yahoo!とMesosは両者の違いと利用機会についてコメントした。
-
NASAのOODTがApacheトップレベルプロジェクトに選出
Apacheソフトウェア財団はObject Oriented Data Technology(OODT)アーキテクチャをトップレベルプロジェクト(TLP)に選出した。OODTはもともとPasadenaにあるNASAのJet Propulsion Laboratory(JPL)でつくられたもので、地理的に分散した異種のコンピューティングとメタデータミドルウェアによるデータリソースの透過的な統合を実現する。
-
Revolution Analytics - 統計用言語Rの商用化
InfoQは大規模データのカンファレンスであるStrataで、Revolution AnalyticsのコミュニティバイスプレジデントであるDavid Smith氏にインタビューした。同社はオープンソースのR統計プロジェクトの商用の拡張を提供する。そして、Rエンタープライズv4.2スイートとSASのユーザがRに移行するためのツールを発表した。
-
-
-
Strata Big Dataカンファレンス プログラムが公開された
Big Dataの新しい O'Reilly Strataカンファレンスが今日アナウンスされ、登録が始まった。カンファレンス主催者のEdd Dumbilll氏にカンファレンスについてインタビューした。
-
Percolator: 大規模データ用の逐次更新処理システム
Google の Daniel Peng,Frank Dabek の両氏は "分散トランザクションと通知を用いた大規模逐次処理 (Large-scale Incremental Processing Using Distributed Transactions and Notifications)" という論文を発表した。この中で両氏は,Google のインデックスシステムのような,数十ペタバイトのデータを数千台のマシンを用いて1日当たり数十億回更新するようなシステムに求められるストレージあるいはスループット要件に対しては,データベースが適切な選択ではないことを論証している。