BT

新しい あなたは、アーリーアダプター?それともイノベーター?そんな皆様に、InfoQの新機能をご案内しています。詳細はこちら

Teachable Machine: カメラを使ってブラウザで機械学習

| 作者: Roland Meertens フォローする 2 人のフォロワー , 翻訳者 sasai フォローする 0 人のフォロワー 投稿日 2017年10月11日. 推定読書時間: 2 分 |

原文(投稿日:2017/10/05)へのリンク

Teachable Machineは、Webカメラを使ってトレーニングすることで、モノや表情を認識させることができるブラウザアプリケーションだ。

デモでは、Webカメラを使って、モノや表情の3つの異なるクラスを認識させることができる。カメラ入力に基づいて、サイトは異なるGIFを表示したり、録音済みサウンドを再生したり、音声を再生したりする。ユーザーはコーディングする必要がなく、ハイパーパラメータやネットワークアーキテクチャをプログラムする必要もない。ユーザーがマシンから得られるフィードバックは、予測したクラスごとの信頼度だけだ。認識されたクラスに基づいて、マシンは3つのGIF(ネコ、イヌ、ウサギ)のひとつを表示する。ユーザーは音や言葉をプログラムすることもできるが、出力を組み合わせることはできない。YoutubeにTeachable Machineの使い方に関するすばらしい説明がある。

トレーニングはすべて、deeplearn.jsライブラリを用いてブラウザで行われる。これはGoogle Brain PAIRチームが作成したハードウェアアクセラレーションされたJavascriptライブラリで、フリーで利用することができる。このライブラリは2017年8月にGoogleのブログで発表されたもので、deeplearn.jsのWebサイトから、このライブラリを用いたアプリケーションを利用することができる。

ユーザーがやらなくてはならないのは、認識したいモノの写真をいくつか撮ることだけだ。"SqueezeNet" と呼ばれるトレーニング済みのニューラルネットワークをダウンロードすることで、トレーニングを高速化している。研究論文によると、SqueezeNetのトレーニング可能なパラメータ数は、同等のニューラルネットワークと比べて50分の1しかない。おかげで、500KB以下のファイルとしてダウンロードすることができる。ネットワークのパラメータ数は少ないものの、出力は大きなニューラルネットワークと同等であり、このようなシンプルなブラウザアプリケーションには十分だ。アプリケーションはこのトレーニング済みネットワークの出力を使って、あなたがWebカメラに見せているモノを学習する。

Teachable MachineのソースコードはGithubから入手できる。deeplearn.jsの使い方やライブラリのソースコードもGithubにある

 
 

Rate this Article

Adoption Stage
Style
 
 

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

あなたの意見をお聞かせください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする
コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

ディスカッション

InfoQにログインし新機能を利用する


パスワードを忘れた方はこちらへ

Follow

お気に入りのトピックや著者をフォローする

業界やサイト内で一番重要な見出しを閲覧する

Like

より多いシグナル、より少ないノイズ

お気に入りのトピックと著者を選択して自分のフィードを作る

Notifications

最新情報をすぐ手に入れるようにしよう

通知設定をして、お気に入りコンテンツを見逃さないようにしよう!

BT