Big DataのStrata カンファレンスへの 登録 が今日始まった。 Strataは、カルフォルニア州の Santa Claraで、2011年2/1~3まで開催される。 O'Reillyが組織しており、データを使うことの関する広範囲な情報を技術者やビジネス アプリケーションを探している人々に提供する。スケジュールは今日公開され、3つのトラックで以下のトピックスが扱われる。
- 幹部による概要
- インタフェース
- 実践者
- 混乱とチャンス
- 実世界
- データ ビジネス
最近、カンファレンスの事務局である Edd Dumbill氏にカンファレンスとSMAQ スタックに関する彼の最近の記事についてインタビューした。
InfoQ: あなたは、Strataカンファレンスでデータ ビジネスを主催していますね。この1年で何が変わって、このカンファレンスのあり方やSMAQスタックの認知に繋がりましたか?
Edd: 我々は、O'Reilly で数年間このテーマを追跡していますが、特に2つのものが「大きくなる」ような変曲点に我々はいる、と感じています。1つ目がSMAQ 技術で、Hadoopは成熟して、たくさんの深いJavaプログラミングの苦痛無しで使えるまでになりましたし、NoSQLデータベースも花開き、成熟しています。2つ目がデータ科学者の出現です。統計と開発を合体させる新しい専門家です。数値とプログラミングの両方を得意とする人々で、今後10年にわたってビジネスを変えていくような画期的な製品を開発します。
Strataには、2つの意味があります。人々が急成長するデータ、処理能力そして分析論が、いかに自分たちに影響するのかを理解する方法と、データ科学の専門家が集まる新しいコミュニティのための家、という意味です。
InfoQ: どの業界がこのような技術に最も興味を持つと、あなたは考えていますか?
Edd: 我々は、広範囲の業界が興味を持つと考えています。銀行、医療保険、製薬、旅行、広告、そしてweb分析などです。今、データに起きていることは、 Web 2.0のインパクトより大きいのです。すべての会社がソーシャルwebサイトが必要なわけではありません。しかし、すべての会社は、もっと処理できるデータを持っています。
InfoQ: Big Dataの世界で最も重要なサブ コミュニティは何ですか?
Edd: 何を最も重要と見なすかは、できませんが、いくつか広い範囲で言うと、
- データ科学者 – 統計とプログラムのニンジャ、彼らはデータで何ができ、それで何をすべきかを理解しています
- 可視化の専門家 – 可視化は2つの機能を行ないます。探査と物語り。Big Dataは、新しい探査と分析インタフェースを意味します。データのストーリーを話すことは、正しい判断に導くために重要です。
- Hadoop – Big Dataの世界のLinuxです。 Hadoopは、製品、プロジェクトそしてBig Data用のツール開発会社が提供するAPIから成る盛況なエコシステムです。
- ベンダー – Greenplum と Vertica から Karmasphere と Datameerまで、ベンダーは、Big Dataの重要な部分です。自社のツールの売上を伸ばして喜んでいるweb上の新興企業ではなく、ベンダーは、Big Dataの力を広範囲な利用者に仲介する上で重要な役割を演じます。
カンファレンスは、ものすごい関心を集めており、多くの人々が講演、パネルそしてチュートリアルの提案を提出しており、総じて、Big Dataとこのカンファレンスへのコミュニティの興味が非常に大きいことを物語っている。