InfoQ ホームページニュース Googleが機械学習開発を簡素化するCloud AI Platform Pipelinesを発表

Googleが機械学習開発を簡素化するCloud AI Platform Pipelinesを発表

2020年12月24日読了時間 6 分

原文(投稿日：2020/03/29)へのリンク

先頃のブログ投稿で、GoogleはCloud AI Platform Pipelinesのベータ版を発表した。これは、監視、監査、バージョン追跡、再現性とともに、堅牢で再現性のある機械学習パイプラインをデプロイする方法をユーザーに提供する。

Cloud AI Pipelinesを使用して、Googleは組織がMLOpsとも呼ばれる機械学習オペレーションのプラクティスを採用するのを支援できる。MLOpsは、ユーザがMLワークフローを自動化、管理、監査するのに役立つDevOpsプラクティスを適用するための用語である。通常、これらのプラクティスには、データの準備と分析、トレーニング、評価、展開などが含まれる。

GoogleのプロダクトマネージャであるAnusha Ramesh氏とスタッフ開発者の支持者であるAmy Unruh氏は、ブログ投稿に次のように書いている:

ノートブックで機械学習 (ML) モデルのプロトタイプを作成しているだけの場合、それはかなり簡単に思えるかもしれません。しかし、MLワークフローを持続可能でスケーラブルにするために必要な他の部分に注意を払い始める必要がある場合、事態はより複雑になります。

さらに、複雑さが増すと、反復可能で監査可能なプロセスを構築するのがより面倒になる。

Cloud AI Platform Pipelines - Google Kubernetes Engine (GKE) クラスタ上で実行され、Cloud AI Platformダッシュボードからアクセス可能 – には、2つの重要な部分がある:

BigQuery、Dataflow、AI Platform Training and Serving、Cloud FunctionsなどのGCPサービスと統合された構造化AIワークフローをデプロイして実行するためのインフラストラクチャ
パイプラインとコンポーネントを構築、デバッグ、共有するためのパイプラインツール。

Cloud AI Platform Pipelinesを使用すると、ユーザは Kubeflow Pipelines (KFP) ソフトウェア開発キット (SDK) を使用するか、TFX SDKを使用して TensorFlow Extended (TFX) パイプラインテンプレートをカスタマイズすることでパイプラインを指定できる。後者は現在、ライブラリ、コンポーネント、およびいくつかのバイナリで構成されており、目前のタスクに適切なレベルの抽象化を選択するのは開発者の責任である。さらに、TFX SDKには、ワークフローに関連付けられたメタデータを記録および取得するための (独立して実行することもできる) ライブラリ ML Metadata (MLMD) が含まれている。

完全にカスタム化されたパイプラインまたはビルド済みのKFPコンポーネントを使用するパイプラインにはKPF SDKを使用し、TensorFlowに基づくE2E MLパイプラインにはTFX SDKとそのテンプレートの使用が推奨される。時間の経過とともに、Googleはブログ投稿でこれら2つのSDKエクスペリエンスがマージされると述べていることに注意してください。最終的に、SDKはパイプラインをコンパイルし、それをPipelines REST APIに送信する。AI Pipelines REST APIサーバは、パイプラインを保存して実行するようにスケジュールする。

Argoと呼ばれるKubernetesで並列ジョブを調整するためのオープンソースのコンテナネイティブワークフローエンジンがパイプラインを実行する。これには、メタデータを記録し、コンポーネントIOを処理し、パイプラインの実行をスケジュールするための追加のマイクロサービスが含まれる。Argoワークフローエンジンは、GKEクラスタ内の個々の分離されたポッドで各パイプラインを実行する。これにより、各パイプラインコンポーネントは、Dataflow、AI Platform Training and Prediction、BigQueryなどのGoogle Cloudサービスを活用できる。さらに、パイプラインには、クラスタ内で多くのGPUおよびTPU計算を実行するステップを含めることができ、オートスケーリングやノードの自動プロビジョニングなどの機能を直接活用する。

出典: https://cloud.google.com/blog/products/ai-machine-learning/introducing-cloud-ai-platform-pipelines

AI Platform Pipelineの実行には、MLMDの使用と、各パイプラインステップで使用されるアーティファクト、パイプラインパラメーター、入力/出力アーティファクト間のリンク、およびそれらを作成および消費したパイプラインステップをログに記録する、自動メタデータ追跡が含まれる。

Cloud AI Platform Pipelinesを使用して、顧客が得るのは、ブログ投稿によると:

Google Cloud Consoleを通してボタンをクリックしてインストール

パイプラインのバージョン管理、アーティファクトと実行の自動メタデータトラッキング、Cloud Logging、視覚化ツールなど、MLワークロードを実行するためのエンタープライズ機能

BigQuery、Dataflow、AI Platform Training and Serving、Cloud FunctionsなどのGoogle Cloudマネージドサービスとのシームレスな統合

独自のカスタムコンポーネントを簡単に構築できる、MLワークフロー用の多くの事前構築されたパイプラインコンポーネント (パイプラインステップ)

Google AI Cloud PipelineのHacker Newsスレッドの回答者が述べているように、Kubeflowのサポートにより、他のクラウドプラットフォームへの直接的な移行が可能になる:

Cloud AI Platform Pipelinesは、オープンソースでKubernetes上で実行されるバックエンドでKubeflow Pipelinesを使用しているようです。Kubeflowチームは、AWSやAzureなどのさまざまなパブリッククラウドに簡単にデプロイできるようにするために多くの時間を費やしてきました。Googleがそれを消した場合、他のホストされているKubernetesサービスで簡単に実行できます。

AI Cloud Pipelinesのリリースは、Cloud AutoML、Kubeflow、AI Platform Predictionなどの他のML中心のサービスで構成されるサービスとしての機械学習 (MLaaS) ポートフォリオのGoogleによるさらなる拡張を示している。この拡張は、アナリストが2025年までに84.8億米ドルに達すると予測している市場で、MLベースのクラウドサービスに対する需要の高まりをGoogleがさらに活用し、AmazonのSageMakerやMicrosoftのAzure Machine Learningなどの同様のサービスを提供する他の大規模なパブリッククラウドベンダと競合できるようにするために必要である。

現在、GoogleはAI Cloud Pipelinesにさらに機能を追加する予定である。これらの機能は次の通り:

クラスタアップグレードを簡単に
MLワークフローを作成するためのより多くのテンプレート
バックエンドデータのオフクラスタストレージのより簡単なUIベースのセットアップ
GCPサービス等への透過的なアクセスをサポートするためのワークロードID
マルチユーザの分離 – パイプラインクラスタにアクセスする各ユーザが、パイプラインやその他のリソースにアクセスできるユーザを制御できるように

最後に、Google Cloud AI Pipelineの詳細については、Getting Startedドキュメントをご覧ください。

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

Googleが機械学習開発を簡素化するCloud AI Platform Pipelinesを発表

この記事に星をつける

このコンテンツのトピックは Cloud です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

Cloudflare社の年次総括：AIボットの過剰クロールと耐量子暗号50％到達、Goが倍増

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Uberのクエリアーキテクチャ：レイヤーの簡素化とオブザーバビリティの向上

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開

PyTorch FoundationがRayを歓迎し、簡素化された分散AIのためのMonarchを発表

Memori、AIエージェント向けのSQLとMongoDBを活用したフルスケールのメモリレイヤーへ拡張

APIプラットフォーム「Unkey」、パフォーマンス問題を受けサーバーレスを廃止

GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

QCon London

InfoQ Architect Certification

QCon AI Boston

QCon San Francisco

Googleが機械学習開発を簡素化するCloud AI Platform Pipelinesを発表

この記事に星をつける

このコンテンツのトピックは Cloud です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター