InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Googleは、Key-ValueデータストアであるLevelDBをオープンソース化した
Googleは、新しいBSDライセンス下でLevelDBをオープンソース化した。LevelDBは、置き換え可能なソートメカニズムによってソートされた任意のバイト配列で、キーと集約された値による埋め込み型のkey-valueデータベースである。データストアは非常にシンプルで、Put、Get、Deleteによる前方、後方への反復コマンドが許可されている。
-
CassandraSF2011で発表されたCassandraのインデクシングガイドライン
Ed Anuff氏はCassandraのビルトインセカンダリインデックスをレビューし、それらがカーディナリティが高い場合にはうまく機能しないことや、少なくとも1度は等価比較を行わなければならないこと、ソートされていない結果を返すことに気がついた。Anuff氏は、ワイドローやCassandra 0.8.1で追加された複合コンパレータといった、これらの制限を打開するための代替インデクシングパターンについてプレゼンテーションを行った。
-
CassandraSF2011:進歩と将来
Johnathan Ellis氏はCassandra SF 2011で基調講演を行った。昨年の主なプロジェクト成果は、複数データセンターへのデプロイのサポートにおける改善、最適化された読み込みパフォーマンス、統合されたキャッシング、SQLに似た言語のCQLを含んだクライアントAPIの改善などである。 将来は、効率的なデータベース修復、ストレージの圧縮、最適化されたパフォーマンス、拡張されたCQL言語の全てに磨きをかけることである、と強調していた。
-
Yahoo HadoopからスピンアウトしたHortonworksが計画を発表
Yahooは中核Hadoopチームをスピンアウトし、新しくHortonworks社を作った。CEOのEric Baldeschwieler氏はHadoopの採用を容易にし、可用性、パフォーマンス、管理に関する同社の中核技術の改善に関するビジョンを発表した。Hortonworks社は主にパートナーを通じてサポート、トレーニング、保障が販売される。
-
MapR社がHadoopをベースとした商用ディストリビューションをリリース
MapR Technologies社は、Apache HadoopをベースとしHDFSの代わりとなる独自の分散ストレージを備えたビッグデータツールキットをリリースした。このソフトウェアは商用製品であり、無償バージョンであるM3と、有償バージョンであるM5が提供されている。M5には、データのスナップショット、ミラーリングのためのJob Tracker recoveryおよび商用サポートが含まれている。MapRのM5エディションはEMC Greenplumの近々リリースされるHD Enterprise Editionの基盤をなす。
-
-
Ravi Kannan氏がACM SIGACT Knuth Prize 2011を受賞
Microsoft ResearchのRavi Kannan氏が ACM SIGACTの(Special Interest Group on Algorithms and Computation Theory) Knuth Prize 2011の受賞者に指名された。プレス発表によると Microsoft Researchの科学者である氏は、長い間あった計算上の問題を解くことを目的にした、有力なアルゴリズム上の技法に関する研究に対して受賞した。
-
グラフデータベースNeo4jがライセンス形態をアップデートし、使い勝手を改善した
Neo TechnologyはNeo4jのバージョン1.3 GA (General Availability)をリリースした。このリリースでライセンス形態をアップデートし、いくつかのフィーチャを追加した。コミュニティ版はGPLv3の下でライセンスされる。MySQLと同じライセンスである。
-
NoSQL、NewSQL、そしてその先
The 451 Groupは今月初旬、増加し続けている情報管理領域に関する意見の詳細を説明するレポートのまとめを公開した。その中で、同時に彼らが"NewSQL"という言葉で表しているものについても明らかにしている。
-
CouchbaseがCouchbase Serverとアドバイザリー・メンバを発表
Couchbase(先ごろMembaseとCouchOneの合併により設立された会社)は、Membase ServerとMobile Couchbaseに加えて、Couchbase Serverのリリースをアドバイザリー・メンバの紹介とともに発表した。
-
Structure Big DataでのHadoopの未来:DataStax Brisk, EMC, MapR
DataStaxはBriskを新しいHadoopのディストリビューションでCassandraにデータを保持すると説明する。EMCは広告を出してHadoopとGreenplumに関する大きなニュースを約束した。GigaOmはMapR TechnologiesがプロプライエタリなHadoopのバージョンを構築していると報告した。DataStaxによればCassandraの700ノードのクラスタや数百テラバイトの保存、秒間200,000回の書き込みが既に運用されているという。
-
ジャーナリングで信頼性が向上した MongoDB 1.8
MongoDB の新しいジャーナリング機能は,ライトアヘッド REDO ログによって信頼性を向上する。永続化ストレージの更新に先立ってログエントリが記録され,クラッシュ後のリスタート時に存在するジャーナルファイルの内容が,オンライン移行前に再実行される仕組みだ。その他の変更としてはシェーディングのパフォーマンス向上,shell のタブ補完,カバーリングおよびスパースインデックスの追加などがある。
-
アップグレードと異なるプログラミングパラダイムのためのHadoop再設計
YahooはHadoopのMap-Reduceのアーキテクチャの中核部分を再設計し、簡単に更新でき、より多くのクラスタで動作し、高速回復をサポートすることを発表した。また、Map-Reduce以外のプログラミングパラダイムもサポートする予定だ。再設計されることでMap-Reduceを制御するHadoopの中核部分はリソースマネージャに切り出される。このリソースマネージャがさまざまな分散処理のパラダイムをサポートする。また、Map-Reduceはユーザが利用できるライブラリになるので、同じクラスタで複数のバージョンのMap-Reduceコードを実行できるようになる。新しい設計はクラスタマネジメントプロジェクトであるオープンソースのMesosに似ている。Yahoo!とMesosは両者の違いと利用機会についてコメントした。
-
NASAのOODTがApacheトップレベルプロジェクトに選出
Apacheソフトウェア財団はObject Oriented Data Technology(OODT)アーキテクチャをトップレベルプロジェクト(TLP)に選出した。OODTはもともとPasadenaにあるNASAのJet Propulsion Laboratory(JPL)でつくられたもので、地理的に分散した異種のコンピューティングとメタデータミドルウェアによるデータリソースの透過的な統合を実現する。
-
Revolution Analytics - 統計用言語Rの商用化
InfoQは大規模データのカンファレンスであるStrataで、Revolution AnalyticsのコミュニティバイスプレジデントであるDavid Smith氏にインタビューした。同社はオープンソースのR統計プロジェクトの商用の拡張を提供する。そして、Rエンタープライズv4.2スイートとSASのユーザがRに移行するためのツールを発表した。