BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース GoogleがML KITを使ってFirebaseで機械学習を実現

GoogleがML KITを使ってFirebaseで機械学習を実現

ブックマーク

原文(投稿日:2018/05/24)へのリンク

読者の皆様へ:ノイズを減らすための一連の機能を開発しました。関心のあるトピックについて電子メールとWeb通知を受け取ることができます新機能の詳細をご覧ください。

Googleは最近、ML KITを導入した。ML KITは、Firebaseモバイル開発プラットフォームに完全に統合され、iOSとAndroidの両方で利用できるマシン学習モジュールである。この新しいFirebaseモジュールを使うことで、Googleは携帯電話で実行される、マシン学習を活用したアプリケーションの作成を容易にする。そして、計算能力的に強力な機能をモバイルデバイスに実装する際のいくつかの課題を解決する。

ML Kitを使用すると、モバイル開発者は、イメージラベリング、OCR、顔検出などのディープラーニングVision APIで利用できるいくつかのモデルに基づいて、機械学習の機能を作成できる。ML Kitは、AndroidのiOSの両方のアプリケーション向けに利用可能であり、認証やストレージなどの他のGoogle Cloudベースのモジュールとともに、Firebaseプラットフォーム内で直接利用できる。

ML Kitは、計算集約的な操作によって引き起こされるモバイルデバイスに固有のいくつかの課題を解決することを目指している。その課題の解決は、人工知能に必要とされるものである。目標は、要件を満たすように、次の2つの間のトレードオフに到達することである。1つは、バッテリを維持しながら、圧縮したサイズのモデルで、妥当なモデル精度を提供することである。もう1つは、非常に限られた計算リソースを持っている環境上のモデルをローカルデータでリフレッシュ間で十分なトレードオフに到達することである。

モバイル機器向けに機械学習を最適化するには、階層的なアプローチを用いる。ハードウェアレベルでは、Android Neural Net APIは、利用できるオンデバイスプロセッサ間で計算ワークロードを分散させることで、計算集約型操作を実行するために設計されたAndroid C APIである。

モデルレイヤに話を移すと、モデルの複雑さとサイズを減らすことで最適化が得られる。これについては、Googleは1年前にTensorflow Liteをリリースしている。一方で、Appleは以前Core MLとFacebook Coffee2Goを開始していた。この軽量フォーマットによって、ローカルデータの推論を実行するために、事前に訓練されたモデルをデバイス上でダウンロードすることが容易になる。しかし、Mobile Machine LearningエンジニアであるEric Hsiao氏によると、たとえばTensorflowからTensorflow Liteへの変換は複雑である。

Google I/O 2018のML KITのプレゼンテーションで、GoogleのML KITプロダクトマネージャであるBrahim Elbouchikhi氏が強調したように、ML KITは、Firebaseモバイルアプリ開発プラットフォームにおいてまさに、モバイル開発者がディープラーニングモデルを手にすることで機械学習を携帯電話にもたらすために必要な第3のレイヤである。

ML KITでは、オンデバイス推論とクラウドベース推論の両方が可能である。オンデバイス推論では、より小さいモデルで動作し、精度は低下するが、無償である。クラウドベースモデルでの推論は、最初の1000回のAPI呼び出しのみ無償だが、精度は向上する。一例として、オンデバイスのイメージラベリング機能は400以上のラベルの集合にタップできるが、クラウドベースのモデルでは10000以上のラベルにアクセスできる。しかし、オンデバイス推論では、リアルタイムのやりとりによりユーザエクスペリエンスが向上し、ユーザのデータが携帯電話に残っているため、プライバシーの問題に対処する。

ML KITでは、Firebase Remote Configを使って動的モデルをダウンロードすることもできる。モデルはFirebaseプラットフォームにアップロードされ、ユーザに動的に提供される。そのため、モデルをAndroid Development Kitにバンドルする必要がなくなる。この柔軟なモデルデプロイにより、ユーザセグメンテーションに合わせたモデルのシンプルなA/Bテストとデプロイが可能になる。

MLキットには、事前にトレーニングされたモデルが付属しており、また、Google Machine Learning APIサービスの一部にアクセスできる。独自のデータセットでトレーニングされたカスタムモデルの統合もできる。現時点では、基本APIで利用できる機能には、テキスト認識(OCR)、イメージラベリング、バーコードスキャン、顔検出、ランドマーク認識などがある。顔の輪郭とスマートリプライは近い将来にリリースされる予定である。Learn2Compressに基づくTensorflowからTensorflowへの新しい変換サービスもすぐに開始される予定である。その間、開発者は変換サービスのベータ版にサインアップできる。

ML KITは数週間しか利用できないことに留意してください。フォーラムで開発者から挙げられた問題について、バーコードを検出できなかったり、テキスト認識のトラブルなどの大部分は解決しているが、イメージ分類についてはほとんど解決していない。

 
 

Rate this Article

Adoption Stage
Style
 
 

この記事に星をつける

おすすめ度
スタイル

BT