BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Microsoftがチャットボットを賢くするための会話のデータセットを公開

Microsoftがチャットボットを賢くするための会話のデータセットを公開

原文(投稿日:2017/04/25)へのリンク

Microsoftの子会社で汎用人工知能の実現を目指しているMaluubaが休暇の取得、とりわけ、飛行機とホテルを見つけるための会話のデータセットを公開した。

FacebookがMessengerプラットフォーム公開して以降、多くのチャットボットが生まれている。ほとんどのボットは単純で線形なやりとりを支援するだけだ。チャットボットにとっては旅行計画のようなより進んだユースケースはまだ難しい。Maluuba(Microsoftに買収された)はこのデータセットを使って研究者や開発者がよりチャットボットをスマートにするのを支援する。

Maluubaはこのデータを二人の人物にチャットボックス内で会話をしてもらうことによって収集した。一人がユーザー、もう一人がコンピューターとして振る舞った。ユーザーは最も良い飛行機を探そうとし、チャットボット役の人はデータベースを使って情報を探す。このやりとりはテキストだけで行う(発話は含まない)、これは研究者にとってはコンセンサスになっている方法だ。ほとんどの人は話すより書くことを好む。したがって、このデータセットは会話認識の悪い精度や背景のノイズに左右されない。生まれたのは、旅行計画についての1,369の対話であり無料でダウンロードできる。

Maluubaは、会話の表現方法についても公開している。旅行計画を難しくしているのはユーザーが頻繁に会話のトピックを変えるからだ。ワーテルローへ行く計画と、モントリオールへ行く計画、トロントへ行く計画を同時に話すかもしれない。人間はこのような状況には難しさを感じない。しかし、ユーザーが予約の前に複数の選択肢を探索すると、コンピューターは困難に直面する可能性がある。新しい会話の方向に突然入ると、ほとんどのチャットボットは話されていたことを忘れてしまう。下の画像の左は"従来"のチャットボットのやりとりだ。ユーザーが新しい街の話をすれば、チャットボットは前の話題の街を忘れてしまう。右はこのデータセットでのパターンだ。ユーザーは複数の街を比較した後に意思決定する。

[クリックして画像拡大]

これがMaluubaが"フレーム"と呼ばれるものを導入した理由だ。ユーザーが事前にセットされた値を変更したら、そのたびに、ウィザードが新しいフレームを作る。全ての追跡されているフレームはユーザーによって言及された制約のセットをメモリで全て保持する。これによって、最大予算が200ドルのモントリオールへの旅行計画と、最大予算が300ドルのトロントへの旅行の計画を同時に話すことができる。この種の会話のメモリはユーザーがオンラインで旅行を計画するときに異なる飛行機を探すのを支援するボットを構築するのに役に立つ。

Pandorabotsを使って構築できるような従来のチャットボットは"スロットフィリング"と呼ばれる方向に会話の舵を切ろうとする。ボットはユーザーからの返答の中からいくつかの属性(例えば名前と年齢)を見つけようとする。チャットボットがこれらの属性を見つけると会話が進み、ボットは次のスロットを見つけようとする。例えば、Facebookが買収したWitのような他の企業はこのアイディアを"ストーリー"を使ってさらに進めようとしている。この柔軟なレイヤは言語理解のレイヤの上で働き、より "自然な感じ"の会話を実現している。Maluubaが公開したデータセットはさらに一歩推し進め、同時に複数の会話トピックを保持できるにした。

先週、Tim Peterson氏が記事を公開し、チャットボットの現在の弱点について書いた。このデータセットは氏が書いた問題の一つに対処する。チャットボットのユーザーが少ないために、開発者が使えるデータが少ないという問題だ。多くのチャットボットは言語理解に問題を抱えているので、開発者はボットに"素早い応答"をする機能を追加している。これに応答するためにユーザーは小さな選択肢の中から選ぶようにする。ボットが確実に理解できる選択肢だ。このやり方は自分が何を言いたいのかわかっているユーザーにとっては便利だが、一般的ではないユーザーからの質問に対する回答は決して開発されない。

[クリックした画像を拡大]

 

 

 

 

 
 

Rate this Article

Relevance
Style
 
 

この記事に星をつける

おすすめ度
スタイル

BT