リアルタイムHadoopの実装競争が激しくなってきた

原文(投稿日：2013/03/01)へのリンク

GoogleのDremel論文の公開以来、HadoopコミュニティはHadoopの周りに同じような機能を構築しようとしてきた。最初、オープンDremel、現在Apache Drillの一部である、は昨年Apacheのインキュベータプロジェクトになった。次に、やはり昨年、ClouderaがImpalaを導入した。これは現在ベータ段階で、 Cloudera Hadoopディストリビューションである CDH 4.1の一部になっている。

この世界の新しい競争相手は、Stinger Initiativeで、先週 Hortonworksによって、Apacheのインキュベートプロセスに持ち込まれた。目指しているのは、

Hiveを人が耐えられる時間内のユースケース（すなわち５～30秒の範囲でクエリする）に答えられるようになることです。例えば、ビッグデータ探索、視覚化、パラメータ化されたレポートは、別のツールをインストール、保守、学習することに頼ることなく、既存のHiveのスキルを持ち、投資をしているユーザーの大きなコミュニティに多大な価値を提供できる。

Hortonworksは、この目標を達成するために、以下のことを実現しようとしている。

· HiveをもっとSQL準拠にする。Hiveに欠けているSQLタイプや‘where’クローズでのサブクエリをサポートすることを含む。

· Hiveの実行計画を最適化する。

· 新しいHadoopの列フォーマットをサポートする。これは、ORCFileと呼ばれる（ Dremel, Drillそして ClouderaのTreviniに似ている）

· 新しいランタイムフレームワークTezの導入。YARNをベースにしている。

　ヒンズー語で「スピード」を意味するTezは、現在Apacheでインキュベーション投票の下にある。

… 汎用目的で、高度にカスタマイズ可能なフレームワークは、Hadoopにおいて小規模（低遅延）と大規模（高スループット）の両方の作業負荷に跨って、データ処理タスクの作成を簡単にする。それは、MapReduce パラダイムをもっと強力なフレームワークに一般化している。このことは、1つのジョブに、複数タスクの複雑なDAG（非循環有向グラフ）を実行する機能を提供することで実現され、その結果 Apache Hadoopエコシステムにおけるプロジェクト、例えば、 Apache Hive, Apache Pig 、Cascading は、人とやりとりする応答時間やペタバイト規模での強烈なスループットの要求を満足することができる。（明らかに MapReduceは、この実現におけるキードライバーである）。

現在の「リアルタイム」Hadoopクエリ実装の３つ全て－ Drill, Impala、このStingerは、既にあるいは、近々オープンソースプロジェクトになり、リアルタイムHadoopクエリの重要な問題を解決するために、コミュニティのサポートとインプットを活用できる。

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックはエンタープライズアーキテクチャです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

Mezzalira氏のQCon London講演：「マイクロフロントエンド～設計から企業メリットと社内実装まで～」

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

Transformers v5、よりモジュール化され相互運用性の高いコアを導入

OpenAI、GPT-5.1モデルを発表。より高速で会話的に

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

Groupe SNCF、Talos OSとKubernetesでインフラを近代化

QCon London

QCon AI Boston

QCon San Francisco