AWSは最近、Amazon Elastic MapReduce(EMR)サーバレスが一般向け提供(GA)となったことを発表した。この製品はサーバレスデプロイメントの選択肢の1つである。これは、クラスタやサーバを設定、管理、スケーリングすることなく、Apache SparkやHiveなどのオープンソースフレームワークを使ってビッグデータ分析アプリケーションを実行する顧客を対象としたものである。
re:Inventは昨年、データ分析サービス向けに3つの新しいサーバレスのオプションを発表した。Amazon MSKサーバレスは、先月から一般向けに提供されている。そして、Amazon RedShiftサーバレス(まだ公開プレビュー中)と現在GAのAmazon EMRサーバレスである。
Amazon EMRでは、さまざまなニーズに合わせてアプリケーションを実行するためのさまざまなデプロイオプションを提供する。ニーズとして、Amazon Elastic Compute Cloud(Amazon EC2)上のEMRクラスタ、Amazon Elastic Kubernetes Service(Amazon EKS)クラスタ、AWS Outposts、EMR Serverlessなどがある。たとえば、Amazon EC2でのEMRのデプロイは、アプリケーションをどのように実行するかに対して最大限の制御と柔軟性を必要とする顧客に適している。あるいは、EKSで標準化してアプリケーション間でクラスタを管理したり、同じクラスタで異なるバージョンのオープンソースフレームワークを使用したりする顧客のために、KubernetesでのEMRのデプロイがある。
EMRサーバレスジョブを始めるには、顧客は使用するオープンソースフレームワークを選択し、API、CLI、AWSマネジメントコンソール、Amazon EMR Studioのいずれかを使ってアプリケーションをトリガーして実行する。
同社は、Amazon EMRにより顧客があらゆる規模で分析処理を実行できると述べている。Amazon EMRには自動スケーリングがあり、変化するデータ量と処理要件に合わせてリソースのサイズを数秒で変更する。自動スケーリングを使うと、顧客は分析処理をより費用効率の高い方法で実行できる。
AWSの主任ディベロッパーアドボケートのChanny Yun氏は、Amazon EMRのGAリリースに関するAWSニュースブログの投稿に次のように書いている。
プレビュー中に、私はEMRサーバレスは費用対効果が高いと顧客から聞きました。需要の急増に対処するためにリソースを過剰にプロビジョニングする費用がかからないためです。
さらに、テクノロジーに熱心なMarius Karma氏はツイートした。
Amazon EMRサーバレス(現在はGA)を使うと、クラスタやサーバを管理せずにApache Spark & Hiveを実行・スケーリングできます。規模によらず単純なのです。
それでも、Redditスレッドの回答者はそれほど熱心ではなかった。
ベータ版の提供から大幅に改善されない限り、プライムタイムの準備が整った(他のGA製品と同レベルの品質になった)とは言えません。スポットの価格設定、ブートストラップスクリプト、VPCアクセスがありません。これらの3つが準備されるまではちらっと見るつもりさえありません。
Amazon EMR Serverlessは現在、ノースバージニア、オレゴン、アイルランド、東京のAWSリージョンで利用できる。顧客は、アプリケーションで消費されるvCPU、メモリ、ストレージリソースの料金を支払う必要がある。製品の価格設定の詳細は、価格ページで確認できる。