BT

InfoQ ホームページ ニュース Teachable Machine: カメラを使ってブラウザで機械学習

Teachable Machine: カメラを使ってブラウザで機械学習

ブックマーク

原文(投稿日:2017/10/05)へのリンク

Teachable Machineは、Webカメラを使ってトレーニングすることで、モノや表情を認識させることができるブラウザアプリケーションだ。

デモでは、Webカメラを使って、モノや表情の3つの異なるクラスを認識させることができる。カメラ入力に基づいて、サイトは異なるGIFを表示したり、録音済みサウンドを再生したり、音声を再生したりする。ユーザーはコーディングする必要がなく、ハイパーパラメータやネットワークアーキテクチャをプログラムする必要もない。ユーザーがマシンから得られるフィードバックは、予測したクラスごとの信頼度だけだ。認識されたクラスに基づいて、マシンは3つのGIF(ネコ、イヌ、ウサギ)のひとつを表示する。ユーザーは音や言葉をプログラムすることもできるが、出力を組み合わせることはできない。YoutubeにTeachable Machineの使い方に関するすばらしい説明がある。

トレーニングはすべて、deeplearn.jsライブラリを用いてブラウザで行われる。これはGoogle Brain PAIRチームが作成したハードウェアアクセラレーションされたJavascriptライブラリで、フリーで利用することができる。このライブラリは2017年8月にGoogleのブログで発表されたもので、deeplearn.jsのWebサイトから、このライブラリを用いたアプリケーションを利用することができる。

ユーザーがやらなくてはならないのは、認識したいモノの写真をいくつか撮ることだけだ。"SqueezeNet" と呼ばれるトレーニング済みのニューラルネットワークをダウンロードすることで、トレーニングを高速化している。研究論文によると、SqueezeNetのトレーニング可能なパラメータ数は、同等のニューラルネットワークと比べて50分の1しかない。おかげで、500KB以下のファイルとしてダウンロードすることができる。ネットワークのパラメータ数は少ないものの、出力は大きなニューラルネットワークと同等であり、このようなシンプルなブラウザアプリケーションには十分だ。アプリケーションはこのトレーニング済みネットワークの出力を使って、あなたがWebカメラに見せているモノを学習する。

Teachable MachineのソースコードはGithubから入手できる。deeplearn.jsの使い方やライブラリのソースコードもGithubにある

 
 

Rate this Article

Adoption Stage
Style
 
 

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

BT

あなたのプロファイルは最新ですか?プロフィールを確認してアップデートしてください。

Eメールを変更すると確認のメールが配信されます。

会社名:
役職:
組織規模:
国:
都道府県:
新しいメールアドレスに確認用のメールを送信します。このポップアップ画面は自動的に閉じられます。