BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Cloudera、パッケージ配布でHadoopをさらに利用しやすく

Cloudera、パッケージ配布でHadoopをさらに利用しやすく

ブックマーク

昨年、MapReduceのオープン・ソース実装として普及しているHadoopに関する数々のプロジェクトが著しく進行した。そこでClouderaは、企業がより簡単にHadoopの使用を開始できることを目的としたオープン・ソース製品のCloudera Distribution for Hadoopをリリースする。プレス・リリースによると、

…Cloudera Distribution for Hadoopはダウンロードおよび即時使用が自由に可能となっている。この製品は、Red Hat LinuxシステムまたはAmazon EC2イメージ用にパッケージされたRPMバンドルとして配布される。Hadoopのインストールおよび使用を簡便にするため、Clouderaはmy.cloudera.comと呼ばれる新しいポータルを開設し、そこではウェブ・ベースの設定ツールを使用して個別のニーズに対して最適化されたカスタム・パッケージを作成できる。クラスタの設定もポータルに保存でき、自動更新が可能。my.cloudera.comは無料で使用できる。RPMパッケージおよびEC2イメージはApache 2ソフトウェアライセンスのもと無料で配布される…

Clouderaは評価や無料のオンライン・トレーニング(http://www.cloudera.com/hadoop-training)との使用に自由に利用できるよう予め設定されたVMwareイメージも作成している。Cloudera Distribution for Hadoopを試したい、あるいはHadoopおよびClouderaのオンライン・トレーニングについてもっと知りたいという場合は、イメージをダウンロードしてLinux、Mac、もしくはWindowsのデスクトップで実行できる。イメージはサンプル・コードおよびマスタ・サーバやシングル・ノードなどCloudera Distribution for Hadoopの使用に必要な全てのコンポーネントが装備されている。

現在、全ての配布形態で以下が含まれている。

    HDFS - HDFS(Hadoop Distributed File System)はコモディティ・ハードウェア上で実行できるよう設計された分散およびフォールト・トレランスなファイル・システムである。HDFSはハードウェアの障害が当然のことであると想定しており、迅速な発見と自動修復をもたらす。

    MapReduce -自動並列化および大規模クラスタ上での実行のため、アプリケーションを多数の小さな作業ブロックに分割する。

    Hive - これはHadoop上に設けられたデータ・ウェアハウス基盤で、容易なデータ・サマリー生成、アドホック・クエリ、そして分析用のツールを提供する。HiveにはSQLをベースとしたシンプルなクエリ言語であるHQLがついている。
     

さらに詳しい情報は www.cloudera.com/hadoopで。

 

原文はこちらです:http://www.infoq.com/news/2009/03/cloudera-hadoop

この記事に星をつける

おすすめ度
スタイル

BT