BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース スタートアップ企業のVicariousが脳の視覚野にヒントを得たAIによるCAPTCHAの解読に成功

スタートアップ企業のVicariousが脳の視覚野にヒントを得たAIによるCAPTCHAの解読に成功

ブックマーク

原文(投稿日:2017/10/30)へのリンク

ベイエリアのスタートアップであるVicariousがマシンラーニング技術を改善して、Recursive Cortical Network(再帰的皮質ネットワーク)と呼ばれる新たなネットワークレイアウトによるCAPTCHA問題の解決を可能にした

Vicariousの目標は、あらゆる設定において、特定の文字を常に検出可能なアルゴリズムの開発にある。さまざまな状況下での文字の検出は、マシンにとって困難なことだと考えられてきた。この理由から、CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart、コンピュータと人を区別するための完全自動化チューリングテスト)が発明され、人とロボットの識別を行なってきた。Vicariousは2013年、ニューラルネットワークを使ってCAPTCHAシステムをクラックした最初の一社である。

同社は今回、そのソフトウェアを改良して、すべてのCAPTCHAをより少ないデータで、より一般化することに成功した。通常のニューラルネットワークでは、新たな初見のデータを一般化するために、数千ないし数百万のサンプルを必要とするが、同社の新システムでは、さらに優れた一般化を300分の1のデータによるトレーニングで実現する。

このために同社が発明したものが、RCN(Recursive Cortical Network)である。一般的なニューラルネットワークとは異なり、RCNはトレーニング前の知識を一切持たず、輪郭(contour)と表面(surface)の知識からスタートする。この事前知識は、モデル構築と一般化可能性(generalizability)の向上に用いられる。通常のニューラルネットワークが存在する輪郭と表面を学習し、オブジェクトとバックグラウンドの違いを学習する必要があるのに対して、RCNはそのような知識を備えてスタートするのだ。これにより、いくつかの個々のオブジェクトでRCNをトレーニングすれば、そのオブジェクトが複数存在するシーンでネットワークを使用することができるようになる。

RCNの背景にあるアイデアは、認知科学と神経科学に由来するものだ。人は生まれながらにして、その新皮質(neocortex)によって前景と背景を区別することができる。このおかげで、白紙状態からすべてを学習しなければならない場合よりも、世界の様子を簡単に学ぶことができるのだ。

RCNはコンター(contour、輪郭)とサーフェス(surface、表面)の組み合わせとしてモデル化される。サーフェスは条件付きランダムフィールドを用いるモデルである。コンターはフィーチャの構成階層を使ってモデル化される。このようにしてRCNは、すべての形状や外観の組み合わせをトレーニングすることなく、さまざまな外観のオブジェクト形状を認識することができるのだ。RCNのもうひとつのアドバンテージは、無意味に詳細なトレーニングセットであふれかえることがない、という点だ。これはつまり、他の同様のシーンにおいてもRCNが強い一般化を備えているということである。

CAPTCHAの解読は、マシンラーニング技術の一般化が非常に重要な領域である。Vicariousでは、CAPTCHAのわずかな乱れによって、従来のニューラルネットワークが役に立たなくなることを確認している。以下の図に示すように、トレーニング終了後にCAPTCHAの表現を編集した場合には、いずれのネットワークでもディープラーニングのアプローチが失敗するが、わずか260のトレーニングサンプルを使用した同社の新たなアプローチは、よりよい結果を示している。

トレーニングとテスト用のデータを生成するため、同社の研究者たちは独自のCAPTCHAを作った。これらのCAPTCHAは、広く知られているCAPTCHA生成システムのフォントを複製したものだ。これらデータセットへのダウンロードリンクは同社のブログ記事の末尾に掲載されている。

Vicariousは米国の人工知能企業である。同社では、人間が可能なように、少数のトレーニングサンプルによる一般化を目指している。最終的な目標は、このインテリジェンスをロボット工学に適用することだ。再帰的皮質ネットワークに関しては、Scienceの記事同社Webサイトブログ記事として公開されている。
 

 
 

この記事を評価

採用ステージ
スタイル
 
 

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

BT