InfoQ ホームページ Distributed_Systems に関するすべてのコンテンツ
-
Clojure総まとめ:Craneによる配布、Incanterによる算術計算、Leiningen 1.0によるビルド
Clojureインスタンスwの配布と遠隔操作のためのツールであるFlightCasterのオープンソースCraneは、現在EC2に特化されている。IncanterはClojureを使って簡単にR風の統計計算ができるClojureライブラリとツールである。また、ビルドと依存関係管理ツールであるLeiningen 1.0がリリースされた。
-
Goat Rodeo: ウェブアプリケーション用統合データモデル
David Pollak氏 (ウェブフレームワークLiftのファウンダ、および「Beginning Scala」の著者) は、21世紀にデータモデリングをもたらすことを目指した新たなイニシアチブ「Goat Rodeo」を発表した。
-
新リモーティングフレームワーク-CRISPY
非常に多い既存のリモーティングメカニズムを利用するにあたって、利用しているプロトコルを別のものに変更する、または新規で導入する際に影響を少なく、またはまったくなくクライアントコードを実装することが必要なときがあります。新しいフレームワーク - CRISPYはそういった場合のサポートを提供します。
-
Apache Mahout: 拡張性の高い機械学習アルゴリズム
Apache Mahoutプロジェクトは、拡張性の高い機械学習に関するライブラリのセットであるが、先日初めてのパブリック・リリースを発表した。InfoQではMahoutの共同設立者でありLucid Imaginationにおける技術スタッフでもあるGrant Ingersoll氏とプロジェクトについて、及び機械学習全般について話をした。
-
AmazonがEC2向けHadoopベースのMapReduceをリリース
ポピュラーになったApache Hadoop MapReduceフレームワークをAmazon EC2上で実行する方法を詳しく述べているチュートリアルが、かなり長期に渡り利用可能になっている。Amazonは4月2日にAmazon Elastic MapReduceによる公式サポートを提供し、そのレベルアップを行った。
-
Cloudera、パッケージ配布でHadoopをさらに利用しやすく
昨年、MapReduceのオープン・ソース実装として普及しているHadoopに関する数々のプロジェクトが著しく進行した。そこでCloudera は、企業がより簡単にHadoopの使用を開始できることを目的としたオープン・ソース製品のCloudera Distribution for Hadoopをリリースする。
-
Cascading -- Hadoop MapReduce向けデータ処理系API
CascadingCascadingはHadoopHadoopクラスタ上でデータ処理する新しい処理系APIであり、Hadoop MapReduceアルゴリズムを直接実装するのとは対照的に、表現豊かなAPIを使って複雑な処理ワークフローの構築をサポートする。
-
Googleがバイナリエンコード形式「Protocol Buffers」を公開
Googleは最近、データ交換フォーマット「Protocol Buffers」をオープンソースとして公開した。その平凡な名前の裏には、とある要素が隠されている。
-
HBaseの開発者がHadoop、BigTable、分散データベースについて語る
Google が最近リリースしたGoogle Application Engineと、それが持つBigTableへのアクセス機能により、(RDBの)代替となるデータベース技術への感心が新たに盛り上がっている。
-
Hypertable のリード開発者が Hadoop と分散データベースを語る
InfoQ は Hypertable 産みの親で、Zvents, Inc の Principal Search Architect もつとめる Doug Judd 氏と、Hypertable の実装について話をした。
-
Lucene 2.3: インデックス作成パフォーマンスの大幅な向上と新たな機械学習プロジェクト
Java で記述された高性能でフル機能の全文検索エンジンを開発する Apache Luceneプロジェクトは 1 月 24 日、バージョン 2.3をリリースした。InfoQ はプロジェクトのコミッタで PMC メンバーでもある Grant Ingersoll 氏と話をし、今回のリリースと Lucene の今後についてより多くの情報を得た。
-
MapReduce 一歩戻って: その比較となるのはリレーショナルデータベースでよいのか?
David J. Dewitt氏とMichael Stonebraker氏が記した最近の記事において、両氏は人気の高まっているMapReduceプログラミングパラダイムをリレーショナルデータベースと比較している。一方ブログスフィアはその比較と根拠においてそれを非難している。
-
MapReduceが牽引~Amazon EC2をサポートするEclipseプラグインがリリース
IBMのAlphaworksのウェブサイト上で、Hadoopを使用したアプリケーションの開発を簡単にするためのEclipseプラグインをリリースしたと発表された。Hadoopは、当初、Googleがクラスタによる大規模データの並列処理として広く利用している分散ファイルシステムと、MapReduceのプログラミング構造を含んだNutchのために作成されたものであった。
-
Googleライクなオープンソースインフラストラクチャ「Hadoopプロジェクト」が弾みをつける
この一年の間、GoogleライクなインフラストラクチャであるHadoopプロジェクトは、開発コミュニティによって広く知られるようになった。