BT

Microsoft、Project Oxfordでアプリにインテリジェンスをもたらす

| 作者: Sergio De Simone フォローする 12 人のフォロワー , 翻訳者 笹井 崇司 フォローする 0 人のフォロワー 投稿日 2015年5月14日. 推定読書時間: 1 分 |

原文(投稿日:2015/05/12)へのリンク

MicrosoftがProject Oxfordという名で、顔認識、音声処理などの機械学習アルゴリズムを使ったアプリケーションを開発者が構築できるようにする、RESTful APIを公開した。現在、新しいAPIはAzureの一部としてβ版にあり、月5,000コールまでフリーで利用できる。

Project Oxfordはライブデモを提供しており、次の4つのコンポーネントが含まれている。

  • 顔認識:写真の顔を認識し、2つの顔が同一人物かを確認するのに使える。Microsoftによると、顔認識は顔認証につかえるそうだ。

  • 音声処理: 音声合成と音声認識を提供する。

  • 画像ツール: 画像を解析して不適切な内容を特定したり、テキストを検出して理解したり、目に見えるコンテンツを分類したりする(たとえばビーチ、動物、食べ物などの画像)のに使える。

  • 知的言語理解サービス (LUIS: Language Understanding Intelligent Service): ユーザが話したりタイプした自然言語から、アプリケーションがユーザの意図を理解するのを可能にすると約束する。現在のところ、このAPIは招待された人だけ利用できる。

RESTful APIに加えて、Project Oxfordは、そのサービスを.NetおよびAndroidプラットフォームに統合するのを簡単にするためのSDKを提供する。Speech SDKはiOSにも提供される。

それぞれのサービスについて、Project Oxfordには詳細なドキュメントが含まれており、サービスへの登録から基本的なアプリへの統合まで、開発者に一通りの手順を説明している。

TechCrunchが報告している日本語版)ように、MicrosoftはかつてBingの名のもとに同様のAPIを提供していた。Microsoft Technology and ResearchでOxfordプロジェクトのシニアプログラムマネージャを務めるRyan Galgon氏によると、Bingのものはよりデスクトップ体験にフォーカスしていたという。

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

あなたの意見をお聞かせください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする
コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

ディスカッション

InfoQにログインし新機能を利用する


パスワードを忘れた方はこちらへ

Follow

お気に入りのトピックや著者をフォローする

業界やサイト内で一番重要な見出しを閲覧する

Like

より多いシグナル、より少ないノイズ

お気に入りのトピックと著者を選択して自分のフィードを作る

Notifications

最新情報をすぐ手に入れるようにしよう

通知設定をして、お気に入りコンテンツを見逃さないようにしよう!

BT