BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Amazon Redshiftデータ共有が一般向け提供へ

Amazon Redshiftデータ共有が一般向け提供へ

原文(投稿日:2021/03/20)へのリンク

Amazonは最近、Amazon Redshiftデータ共有機能の一般向け提供を発表した。これは、Amazon Redshiftクラスタ間でライブデータを共有するためのものである。これにより、単一のデータウェアハウスクラスタをマルチクラスタデプロイに使用し、データをコピーまたは移動することなく即座に共有できる。

共有データにアクセスするクエリは、データへのライブアクセスを提供する。しかし、プロデューサークラスタのパフォーマンスに影響を与えることなく、コンシューマークラスタのコンピューティングリソースを使用して実行される。同じAmazon Redshiftデータベースに複数のデータ共有を作成することができると共に、Amazon Redshiftによって各データ共有は単一のデータベースに関連付けられる。スーパーユーザとデータベース所有者はデータ共有を作成でき、関連付けられたデータベースのオブジェクトのみをデータ共有に追加できる。

Amazonは、共有のための4つの主要なユーザケースを区別している。すべてがコストの最適化に関連しているわけではない。1つ目は、ハブアンドスポークアーキテクチャの中央クラスタからのデータ共有である。2つ目は、複数のビジネスグループ間でのデータ共有である。各クラスタは、あるデータのプロデューサーになることができるが、他のデータセットのコンシューマーになることもできる。3つ目は、組織全体および外部企業とのサービスとしてのデータ共有である。最後は、開発、テスト、および実稼働環境間でのデータ共有である。

CloudStaqの創設者であるRaghu氏は次のようにツイートしている。

あるクラスタから別のクラスタにデータをコピーする必要なしに、新しいユースケースの簡単に提供可能にすることは、Redshiftにとっての重要なステップです。

 

出典: https://aws.amazon.com/blogs/big-data/announcing-amazon-redshift-data-sharing-preview

AWSのプロダクトマネージャーであるDebu Panda氏は、次のように付け加えている

データ共有によって、異なるAmazon Redshiftクラスタ間で多様なタスクを分離できます。その一方で、Redshift Managed Storageを活用することで、これらのクラスタ間でトランザクション整合性のあるデータをライブで共有できます。データのコピーやデータ移動に関連する複雑さや遅延なしにです。

別の記事「データ共有を使用したAmazon Redshiftでのマルチテナントパターンの実装」では、AWSは、Amazon Redshiftの新しいデータ共有機能を使用して、どのようにして、マルチテナントアーキテクチャのAnalytics as a Serviceソリューションを実装するかを説明している。著者は、3つの異なるストレージ戦略をカバーしている。1つ目は、データがすべてのテナントに対して単一のデータベーススキーマに保存されるプールモデルである。2つ目は、各テナントのストレージが個々のスキーマレベルで制御されるブリッジモデルである。最後は、各テナントのデータのストレージとアクセス制御は、別々のデータベースで維持されるサイロモデルである。

Amazonは、Amazon Redshiftクロスデータベースクエリの一般向け提供も発表した。これは、Redshiftクラスタ内のデータベース間でクエリを実行する機能である。この新機能により、プロジェクトは複数のデータベース横断でデータを整理し、マルチテナント構成をサポートし、異なるデータセット間でクエリと結合を行うことができる。

2020年にAmazonはデータアナリスト向けにAmazon Redshift MLや他の新機能のプレビュー版を導入した。一方で、クラウドベースのデータストレージおよび分析サービスのSnowflakeの成長により、Redditの一部のユーザはRedshiftの長期的な成長性に疑問を抱いた。The Duckbill GroupのクラウドエコノミストであるCorey Quinn氏は、週刊ニュースレターに次のように書いている。

クロスデータベースクエリに加えて、Amazon Redshiftは力強く新機能をリリースし、そして、Snowflakeに、昼食代だけ受け取って、後はそっとしておいてほしいと切に願っています。

Redshiftデータ共有とRedshiftクロスデータベースクエリはどちらも、RA3ノードタイプが利用可能なすべてのリージョンで利用できる。

 

この記事に星をつける

おすすめ度
スタイル

BT