Yahooは昨日中核Hadoop技術チームをベンチャーキャピタルからの投資をもとに スピンアウトした。CEOのEric Baldeschwieler氏は今日Hadoop Summitのキーノートで同社のビジョンを発表した。彼らは他の企業とのパートナーシップを中心としてサポート、トレーニング、保障を販売する。Hortonworksはインストールを簡易化したり、継続的にリリースを発表し、Hadoopをより利用しやすくすることにフォーカスしていく。2012年までに、同社は次世代MapReduceを持ったHadoop 0.23やパフォーマンスの強化、管理の簡易化にフォーカスし、Hadoopの単一障害点を取り除くことに投資をしていく。Baldeschwieler氏はHadoop、HBase、Pig、Hiveのサポートに関しても強調した。
Baldeschwieler氏は「Fortune 2000の取引先データのすべてでHadoopを見る事が出来る」というアナリストグループの発言を引用した。氏は現在技術が利用し辛く、エキスパートやコンサルタントを雇う必要があり、そのためHortonworksが技術とナレッジのギャップを埋めることにフォーカスするとも発言。同社は製品開発同様にパートナーを通じてトレーニングやサポートを販売する。また、同社はディストリビューションは販売せず、オープンソースのディストリビューションに関するサポートを販売する。
同社の目的はApache Hadoopの開発である。
- インストール、管理、利用がしやすい
- より堅牢に(より良いパフォーマンス、高可用性、管理、モニタリング)
- オープンなAPIにより統合や拡張がしやすい
2011年は同社は以下にフォーカスしていく。
- 「我々がチームに参加する事」により「今までで最も安定したHadoopバージョンである0.20.203」を含むHadoopやその他のプロジェクトに関するアクセシビリティの改善
- Apacheを通じて安定版のコードをリリースし、インストールを簡単にしていく(例えばRPMやdeb)
- 安定したブランチバージョンの継続的なリリース
2012年までに同社は以下に注力していく。
- 新しいMapReduceやHDFSフェデレーション、ジョブパフォーマンスの大幅な改善を含む次世代Apache Hadoop(ベータ版が2011年8月にリリース)
- 主要製品のギャップの改善(単一障害点を徐々に取り除くことにより)HBaseと高可用性に関する新しいパイプライン
- コミュニティとパートナーがモジュールアーキテクチャやオープンAPIを通じてイノベーションを可能にする。その際、コミュニティと共同で統合されたスタックを定義する
- HCatalog 0.3を通じたデータのサポート。ファイルメタデータの標準であり、Hiveのメタデータストアを一般化したり、Pig、Hive、HBaseのサポートを可能にしたり、HDFSやHBaseにストレージを含めることが可能になり、パフォーマンスの強化やストレージの拡張も可能になる。
- 管理と使いやすさ。すべてのコンポーネントを一緒にテストし、それらをスタックとしてインストール可能にし、集中的に設定を管理できるようにし、管理ツールに対するREST APIとGUIを用意する
Baldeschwieler氏はApacheを通じて仕事していくことを強調する。「我々のすべての仕事はHadoopをたどる事です。絶対言い訳はしません」 「Apacheがリリースする製品に対する技術提供の土台を企業の皆様に作ってもらいたいです。そうして頂けるすべての企業が我が社のパートナーです」 注目すべきはApacheが最近Hadoopに関するトレードマークのルールをより積極的に主張するようになったことである。 Baldeschwieler氏はYahooがHortonworksにとって顧客であり投資家であるのと同様に開発パートナーであるという事にも言及している。YahooはApache Hadoopのリリースプロセスにおいて中心的な役割を引き続き演じているからだ。また、同社のビジネス活動に関してはSpringSourceとJBossの旧COOであるRob Bearden代表取締役によって執り行われることも発表された。HortonworksとClouderaの関係に関する質問に対して氏は次のように答えている。「それはまだ決まっていません。我々はApache Hadoopをよりよくしていくために一緒に仕事をしてきました。過去においては我々は異なる部分もありましたが、先ほども述べたようにApache Hadoopにフォーカスしている企業はすべて我々のパートナーです」