BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ Hadoop に関するすべてのコンテンツ

  • MembaseとClouderaがインテグレーションを発表

    MembaseとClouderaは、Membase NoSQLデータベースと分散Map-ReduceおよびストレージシステムであるCloudera's Distribution for Hadoopのインテグレーションを発表した。これによりシステム間の双方向データレプリケーションが可能になる。

  • Cloudera Enterpriseがリリース:Charles Zedlewski氏とのインタビュ

    Cloudera は、最近 Cloudera Enterpriseアナウンスした、これは、Hadoopといくつもの他のオープンソース製品を商用にパッケージ化したものである。InfoQは、Product ManagerのCharles Zedlewski氏にインタビュして、更に詳しく、従来型のエンタプライズとHadoopの将来の顔にとっての何を意味するのかを聞いた。

  • LinkedInのデータ基盤

    LinkedInのJay Kreps氏はどのようにデータを処理しているか、最近のHadoop Summitの発表で詳しく説明した。Kreps氏は、LinkedIn が大量ユーザ/短応答時間でサイトのサービスを提供しながら、1日に1200億もの関連を高速処理し大規模データの計算結果を集計している方法について解説した。

  • FacebookによるHadoop, Hive, HBaseそして A/B Testingへの取組み

    2010年のHadoop Summitでは、数多くのHadoopと関連技術の大規模ユーザから、発表があった。とりわけ、 Facebookは、分析にHiveを使っていることについて、基調講演で詳細に発表した。 FacebookでEngineering のVPである Mike Schroepfer氏がHadoopによるデータ処理の規模について基調講演を行った。

  • Hadoop Summit 2010からAmazon Elastic MapReduceをアップデート

    2010年のHadoop Summitで、Amazon のElastic MapReduce (EMR)のGeneral Manager である Peter Sirota氏の基調講演があった。EMRは、Amazonによるホスト型Hadoop製品で、webベースの管理ツールを含んでいる。

  • Hadoop Summit 2010からYahoo! のアップデート

    2010年の Hadoop Summitが Yahooの Chief Product Officerである Blake Irving氏によるブブゼラの鳴り響きで始まった。 Yahooは、基調講演で、彼らのHadoop の使用規模、貢献の技術的方向、そしてこの技術の応用方法でのアーキテクチャ上のパターンについて要約した。

  • Mahout 0.3: オープンソースの機械学習プロジェクト

    クラスタリング、協調フィルタリング そしてカテゴリー化のような機械学習の技術の必要性が、大量の生データを関連する情報に変換するためのアルゴリズムを必要とする、いくつかのソリューションといっしょに、この10年間に、着実に増えてきた。 Apache Mahout 0.3が3月にアナウンスされ、機能性、安定性、パフォーマンスが改善された。

  • Clojure総まとめ:Craneによる配布、Incanterによる算術計算、Leiningen 1.0によるビルド

    Clojureインスタンスwの配布と遠隔操作のためのツールであるFlightCasterのオープンソースCraneは、現在EC2に特化されている。IncanterはClojureを使って簡単にR風の統計計算ができるClojureライブラリとツールである。また、ビルドと依存関係管理ツールであるLeiningen 1.0がリリースされた。

  • Goat Rodeo: ウェブアプリケーション用統合データモデル

    David Pollak氏 (ウェブフレームワークLiftのファウンダ、および「Beginning Scala」の著者) は、21世紀にデータモデリングをもたらすことを目指した新たなイニシアチブ「Goat Rodeo」を発表した。

  • Apache Mahout: 拡張性の高い機械学習アルゴリズム

    Apache Mahoutプロジェクトは、拡張性の高い機械学習に関するライブラリのセットであるが、先日初めてのパブリック・リリースを発表した。InfoQではMahoutの共同設立者でありLucid Imaginationにおける技術スタッフでもあるGrant Ingersoll氏とプロジェクトについて、及び機械学習全般について話をした。

  • AmazonがEC2向けHadoopベースのMapReduceをリリース

    ポピュラーになったApache Hadoop MapReduceフレームワークをAmazon EC2上で実行する方法を詳しく述べているチュートリアルが、かなり長期に渡り利用可能になっている。Amazonは4月2日にAmazon Elastic MapReduceによる公式サポートを提供し、そのレベルアップを行った。

  • Cloudera、パッケージ配布でHadoopをさらに利用しやすく

    昨年、MapReduceのオープン・ソース実装として普及しているHadoopに関する数々のプロジェクトが著しく進行した。そこでCloudera は、企業がより簡単にHadoopの使用を開始できることを目的としたオープン・ソース製品のCloudera Distribution for Hadoopをリリースする。

  • Cascading -- Hadoop MapReduce向けデータ処理系API

    CascadingCascadingはHadoopHadoopクラスタ上でデータ処理する新しい処理系APIであり、Hadoop MapReduceアルゴリズムを直接実装するのとは対照的に、表現豊かなAPIを使って複雑な処理ワークフローの構築をサポートする。

  • HBaseの開発者がHadoop、BigTable、分散データベースについて語る

    Google が最近リリースしたGoogle Application Engineと、それが持つBigTableへのアクセス機能により、(RDBの)代替となるデータベース技術への感心が新たに盛り上がっている。

  • Hypertable のリード開発者が Hadoop と分散データベースを語る

    InfoQ は Hypertable 産みの親で、Zvents, Inc の Principal Search Architect もつとめる Doug Judd 氏と、Hypertable の実装について話をした。

BT