BT

InfoQ ホームページ ニュース HortonworksがStinger.nextのロードマップを発表,Apache HiveによるHadoopスケールのSQL提供へ

HortonworksがStinger.nextのロードマップを発表,Apache HiveによるHadoopスケールのSQL提供へ

ブックマーク

原文(投稿日:2014/09/25)へのリンク

Apache Hive 0.13で提供されたStinger initiativeに続いて,Hortonworksは,完全なACIDトランザクション,サブセカンド(秒以下)で動作するクエリエンジン,充実度を高めたSQL 2011の解析サポートを提供する,Stringer.nextのロードマップを策定した。これらはすべて,Hiveによって"SQLサポートの速度,スケール,範囲を拡張"するという,同社の目標に向けてのものだ。

Stringer.nextの開発はすべて,Hiveコミュニティによって主導されている。第1フェーズで提供されるトランザクションは,2014年末にはユーザの手元に届く予定である。完全なACIDトランザクションは,現行のWORM(Write-Once-Read-Many)モデルに比べて大きな進歩であり,周期的な更新を要件とするユースケースへの道を開くものだ。

最初のStinger initiativeでは,YARNの活用で100倍という速度向上を実現した。Stinger.nextの計画においても,処理速度は主要な機能である。サブセカンドのクエリは,2015年前半の第2フェーズにスケジュールされている。Apache Tezと,LLAP(Live Long And Process)と呼ばれる新技術をベースに構築されて,複数のノード上でオプションプロセスとして動作する,新たなハイブリッドエンジンが使用される予定だ。LLAPでは,効率的なデータキャッシュと低レイテンシの処理を採用することによって,高速なレスポンス時間を実現する。

最終フェーズでは非同一joinやset関数,インターバルタイプやサブクエリを追加して,HiveのSQL機能を拡張する予定だ。今回のサブセットは,SQL 2011で頻繁に利用されている機能を選択したものだが,ユーザからの要求があれば,さらに多くの機能が追加される可能性もある。

他にもいくつかの機能が,コミュニティによって約束されている。機械学習タスク用のHive on Sparkや最新データを処理するためのHive Streaming Ingest,地理条件を越えたクエリのサポート,マテリアライズドビュー,ユーザビリティとデプロイメントの改善,といったものだ。

HadoopにおいてSQLを提供するのはHiveだけに限らない。ClouderaのImpalaIBMのBig SQL,さらにはApacheのPhoenixDrillなど,プロプライエタリあるいはオープンソースの競合相手には枚挙にいとまがないほどだ。SQLジョブがHadoopデータのユースケースとして理想的なのか,あるいは,その人気はTabelauやInformaticaのような既存のBIツールにビッグデータのスケールを実現するためのものなのか,今はまだ明らかではない。

この記事に星をつける

おすすめ度
スタイル

特集コンテンツ一覧

.NET CoreとDevOps

Dave Swersky 2019年2月6日 午後11時46分

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

BT

あなたのプロファイルは最新ですか?プロフィールを確認してアップデートしてください。

Eメールを変更すると確認のメールが配信されます。

会社名:
役職:
組織規模:
国:
都道府県:
新しいメールアドレスに確認用のメールを送信します。このポップアップ画面は自動的に閉じられます。