GoogleがクラウドAIプラットフォームに新たにWhat-Ifツールの統合を追加

原文(投稿日：2019/07/26)へのリンク

Googleは最近のブログ投稿で、What-Ifツールの新しい統合を発表した。これにより、データサイエンティストはAIプラットフォーム（コードベースのデータサイエンス開発環境）でモデルを分析できる。顧客は、AIプラットフォームにデプロイされたXGBoostおよびScikit Learnモデルに対してWhat-Ifツールを使用できるようになった。

昨年、GoogleのTensorflowチームはWhat-Ifツールを立ち上げた。それは、データサイエンティストがデータセットを視覚化し、TensorFlowモデルの出力をよりよく理解できるように設計されたインタラクティブなビジュアルインターフェイスである。それが、XGBoostとScikit Learnモデルのサポートも提供するようになり、Tensorflowだけに制限されなくなった。データサイエンティストは、AIプラットフォームノートブック、Colabノートブック、Jupyterノートブックを使うローカルから新しい統合を使用できる。

このツールを使用すると、データサイエンティストはコードを記述せずにさまざまなデータポイントを調整し、モデルがどのように振る舞うかを分析できる。さらに、同じデータセットで2つの異なるAIモデルのパフォーマンスを同時にテストできる。これにより、高度な対比を可能にし、個々のデータポイントまたはデータセットスライス全体を検査する比較を行うことができる。また、次のことができる。

「ファセットダイブ」機能を使用して、データセットでのAIモデルのパフォーマンスを別のモデルと比較し、カスタムの視覚化を作成する
推論結果を混同マトリックス、散布図、ヒストグラムに整理することにより、単一モデルのパフォーマンスを検査する
AIモデルのパフォーマンスで堅牢なテストを実行する機能を追加または削除して、データポイントを編集する

ソース: https://pair-code.github.io/what-if-tool/

Googleの意思決定インテリジェンスヘッドであるCassie Kozyrkov氏は、datascienceのブログ投稿に向けて次のように述べています。

What-Ifツールは初心者向けには設計されていないが（基本を理解する必要がありますが、Pythonやノートブックの初心者でない場合に最適です）、実務アナリストおよびMLエンジニアにとって業務を促進してくれる素晴らしいツールです。

新しい統合を使用するには、データサイエンティストがgcloud CLIを使用してモデルをトレーニングし、Google Cloud AIプラットフォームにデプロイする必要がある。次に、データサイエンティストは、WitConfigBuilderオブジェクトを設定することにより、What-Ifツールでデータセットのパフォーマンスを表示できる。

config_builder = (WitConfigBuilder(test_examples)
  .set_ai_platform_model('your-gcp-project', 'gcp-model-name', 'model-version')
  .set_target_feature('thing-to-predict')
WitWidget(config_builder)

テストサンプルは、JSON辞書のリスト、JSONリスト、グラウンドトゥルースラベルを含むtf.exampleプロトのいずれであっても、モデルによって期待される形式です。それによって、異なる機能がモデルの予測にどのように影響するかを調査できる。

データサイエンティストが最初に見るのはデータポイントエディタである。そこには、提供されたデータセットのすべての例と、モデルによる予測の結果が表示されます。さらに、メインパネルのこのエディタから、データサイエンティストはデータポイントについて何でも変更し、モデルを再実行して、変更が予測にどのように影響するかを確認できる。

ソース: https://twitter.com/7wData/status/1152606660743110656/photo/1

次の[Performance + Fairness]タブでは、データサイエンティストがデータセット全体のモデルの集計結果を表示できる。さらに、このタブについて、Google Cloud Platformの開発支援者であるSara Robinson氏はブログで次のように述べています。

機能ごとにデータセットをスライスし、それらのスライスを通してパフォーマンスを比較し、モデルが最高または最低のパフォーマンスとなるデータのサブセットを特定できます。これは、MLの公平性調査に非常に役立ちます。

最後に、What-Ifツールの機能の詳細については、ウォークスルーガイドとドキュメントを参照してください。

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

12のソフトウェア・アーキテクチャの落とし穴とその避け方

AI、ML、データエンジニアリングのInfoQトレンドレポート - 2023年9月

エンジニアリングマネージャーへのアドバイス: 開発者が(より)クリエイティブになれるようにすること

Low Code/No Codeを採用する：確認するべき6つの適性

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックは Cloud です。

関連記事:

関連記事

関連スポンサーコンテンツ

開発環境マネージャー Daytonaがオープンソースに

Spring BootによるAPIバックエンド構築実践ガイド第2版

Erlangランタイムの静的型付け関数型言語Gleamがバージョン1.0に到達

QCon London: Trainline社における、マイクロサービスアーキテクチャと技術組織のスケーリング

Decathlon社、Backend for Frontend (BFF)パターンを採用し、フロントエンドチームを強化

HashnodeがStep Functions、EventBridge、RedisでAWS上にスケーラブルなフィードアーキテクチャを構築

ソフトウェアチームにおけるテストの影響

エンジニアリングマネージャーへのアドバイス: 開発者が(より)クリエイティブになれるようにすること

ソフトウェア開発における"実験文化"の育成

Apple社の研究者、異なるLLMを組み合わせて最先端の性能を実現する手法を詳説

Meta社、24000基以上のGPUから成るAIインフラ設計を発表

Databricks、オープンソースの汎用LLM "DBRX" を発表

CNCF、Kubernetes上のKafkaを簡素化するStrimziをインキュベートする

オラクル、ARMとKubernetes 1.28をサポートするOracle Cloud Native 1.8を発表

SUSE、Kubernetesとエッジ管理製品のアップグレードを発表

QCon London

InfoQ Live Roundtable

InfoQ Dev Summit Boston

InfoQ Dev Summit Munich

QCon San Francisco

Login with:

アカウントをお持ちでない方