年次開催されるIgniteカンファレンスで、Microsoftによる今年の発表のひとつとして、Azure Synapseという新しい分析サービスに関するものがあった。Azure SQL Data Warehouseの後継となるこのサービスは、企業規模のデータウェアハウスとビッグデータ解析をひとつの場所で実現するものだ。
実際に、MicrosoftがAzure Synapseによって目指しているのは、データウェアハウスとデータレイクをひとつにまとめて、データの共同制作、構築、管理、分析をひとつのサービスで提供することだ。これらすべてのロールが、Azure Synapse studioという同一のツール上で作業を行う。ツールのルック・アンド・フィールは、このデータを扱う作業者ごとに、パイプラインの可視化から馴染みあるSQL構文までさまざまだ。さらにMicrosoftは、ペタバイト規模のTPC-Hクエリも同じように実行可能であるとも述べている。ただし、これ程のパフォーマンスに到達するためには、同社が提示するベストプラクティスに従う必要はある。Azure Synapseは全体で4つのコンポーネントで構成されており、さまざまなワークロードに対してそれぞれ異なる部分の処理に特化している。
- SQL Analytics — T-SQLベースの分析機能の実装に加えて、従来のAzure SQL Data Warehouseにあった機能を備えたもので、近日中に一般供与が開始される。これには2つの課金スキーマが用意されている。
- プロビジョンされたデータウェアハウスユニット毎に課金されるSQL pool
- 処理データのTB単位で課金されるSQL on-demand(プレビュー)
- Spark — 深部に統合されたApache Sparkエクスペリエンスを提供する。(プレビュー)
- Data Integration — ハイブリッドデータ統合シナリオを可能にする。(プレビュー)
- Studio — このすべてを単一の統合ユーザエクスペリエンス内で提供する。(プレビュー)
コンポーネントの一部はまだプレビュー版だが、サービスそのものは一般供与が開始されている。従って、実務レベルでのワークロードの運用を完全にサポートする一方で、新機能が並行的にロールアウトされることになる。また、Azureでは珍しくないケースだが、Power BIやAzure Machine Learningなどのさまざまなデータプラットフォームやツーリングを含む他のAzureサービスと強い結合関係がある。ただしAzure Sysnapseは自身のエコシステムだけではなく、DataBricksやInfomatica、Accenture、Talend、Panoply、Attunity、Pragmatic Works、Adatisといったパートナとも統合されている。その結果としてこのサービスは、AWS RedshiftやGoogle Cloud's BigQueryといった、他のクラウドプロバイダが提供するデータウェアハウスと似通ったものになっている。
さまざまな機能に加えて、Azre Synapseは、セキュアで管理の容易な環境の構築も目標に置いている。例えばネットワーク接続に関しては、統合型ファイアウォール、送受診時や保存中のデータ暗号化など、接続性に関する組み込むオプションがいくつか用意されている。さらには、ユーザ名/パスワード以外にAzure Active Directoryの利用も可能な認証機能や、ユーザの権限を定義したさまざまなロールの実装を選択するオプションもある。自動化されたセキュリティ対策も用意されており、ディスカバリとクラシフィケーションを含むデータの自動クラス分類がオプションとして選択可能である他、疑わしい動作の発生を警告するAdvanced Thread Processingもオプション供されている。