BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Microsoft、Project Oxfordでアプリにインテリジェンスをもたらす

Microsoft、Project Oxfordでアプリにインテリジェンスをもたらす

原文(投稿日:2015/05/12)へのリンク

MicrosoftがProject Oxfordという名で、顔認識、音声処理などの機械学習アルゴリズムを使ったアプリケーションを開発者が構築できるようにする、RESTful APIを公開した。現在、新しいAPIはAzureの一部としてβ版にあり、月5,000コールまでフリーで利用できる。

Project Oxfordはライブデモを提供しており、次の4つのコンポーネントが含まれている。

  • 顔認識:写真の顔を認識し、2つの顔が同一人物かを確認するのに使える。Microsoftによると、顔認識は顔認証につかえるそうだ。

  • 音声処理: 音声合成と音声認識を提供する。

  • 画像ツール: 画像を解析して不適切な内容を特定したり、テキストを検出して理解したり、目に見えるコンテンツを分類したりする(たとえばビーチ、動物、食べ物などの画像)のに使える。

  • 知的言語理解サービス (LUIS: Language Understanding Intelligent Service): ユーザが話したりタイプした自然言語から、アプリケーションがユーザの意図を理解するのを可能にすると約束する。現在のところ、このAPIは招待された人だけ利用できる。

RESTful APIに加えて、Project Oxfordは、そのサービスを.NetおよびAndroidプラットフォームに統合するのを簡単にするためのSDKを提供する。Speech SDKはiOSにも提供される。

それぞれのサービスについて、Project Oxfordには詳細なドキュメントが含まれており、サービスへの登録から基本的なアプリへの統合まで、開発者に一通りの手順を説明している。

TechCrunchが報告している日本語版)ように、MicrosoftはかつてBingの名のもとに同様のAPIを提供していた。Microsoft Technology and ResearchでOxfordプロジェクトのシニアプログラムマネージャを務めるRyan Galgon氏によると、Bingのものはよりデスクトップ体験にフォーカスしていたという。

この記事に星をつける

おすすめ度
スタイル

BT