BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース HortonworksがStinger.nextのロードマップを発表,Apache HiveによるHadoopスケールのSQL提供へ

HortonworksがStinger.nextのロードマップを発表,Apache HiveによるHadoopスケールのSQL提供へ

ブックマーク

原文(投稿日:2014/09/25)へのリンク

Apache Hive 0.13で提供されたStinger initiativeに続いて,Hortonworksは,完全なACIDトランザクション,サブセカンド(秒以下)で動作するクエリエンジン,充実度を高めたSQL 2011の解析サポートを提供する,Stringer.nextのロードマップを策定した。これらはすべて,Hiveによって"SQLサポートの速度,スケール,範囲を拡張"するという,同社の目標に向けてのものだ。

Stringer.nextの開発はすべて,Hiveコミュニティによって主導されている。第1フェーズで提供されるトランザクションは,2014年末にはユーザの手元に届く予定である。完全なACIDトランザクションは,現行のWORM(Write-Once-Read-Many)モデルに比べて大きな進歩であり,周期的な更新を要件とするユースケースへの道を開くものだ。

最初のStinger initiativeでは,YARNの活用で100倍という速度向上を実現した。Stinger.nextの計画においても,処理速度は主要な機能である。サブセカンドのクエリは,2015年前半の第2フェーズにスケジュールされている。Apache Tezと,LLAP(Live Long And Process)と呼ばれる新技術をベースに構築されて,複数のノード上でオプションプロセスとして動作する,新たなハイブリッドエンジンが使用される予定だ。LLAPでは,効率的なデータキャッシュと低レイテンシの処理を採用することによって,高速なレスポンス時間を実現する。

最終フェーズでは非同一joinやset関数,インターバルタイプやサブクエリを追加して,HiveのSQL機能を拡張する予定だ。今回のサブセットは,SQL 2011で頻繁に利用されている機能を選択したものだが,ユーザからの要求があれば,さらに多くの機能が追加される可能性もある。

他にもいくつかの機能が,コミュニティによって約束されている。機械学習タスク用のHive on Sparkや最新データを処理するためのHive Streaming Ingest,地理条件を越えたクエリのサポート,マテリアライズドビュー,ユーザビリティとデプロイメントの改善,といったものだ。

HadoopにおいてSQLを提供するのはHiveだけに限らない。ClouderaのImpalaIBMのBig SQL,さらにはApacheのPhoenixDrillなど,プロプライエタリあるいはオープンソースの競合相手には枚挙にいとまがないほどだ。SQLジョブがHadoopデータのユースケースとして理想的なのか,あるいは,その人気はTabelauやInformaticaのような既存のBIツールにビッグデータのスケールを実現するためのものなのか,今はまだ明らかではない。

この記事に星をつける

おすすめ度
スタイル

BT