BT

Ready for InfoQ 3.0? Try the new design and let us know what you think!

JiroがSDKをリリース、ロボティクスを家庭へ

| 作者: Sergio De Simone フォローする 21 人のフォロワー , 翻訳者 笹井 崇司 フォローする 0 人のフォロワー 投稿日 2016年7月6日. 推定読書時間: 4 分 |

原文(投稿日:2016/05/27)へのリンク

IndieGogoスタートアップのJiboがアプリケーション開発のためのSDK発表した。ここで言うアプリケーションとは、娯楽、教育、IoT統合をターゲットとした家庭用「ソーシャルロボット」のスキルのことだ。

Jiboは、人の声と顔を認識し、会話し、ビジュアルコンテンツを見せ、その「チェスト」と「ヘッド」を含むパーツを動かすことで、環境とインタラクトできるロボットを作ろうとしている。

Jibo SDKが目指しているのは、C/C++で書かれたJiboプラットフォームの処理負荷の高い部分にアクセス可能なJavaScript APIを使って、開発者がスキルを作れるようにすることだ。Jibo SDKを通してアクセス可能な機能には、次のようなものがある。

  • 音声・対話技術。音声を認識、応答するのに使われる。
  • 画像処理。顔や動きの認識を可能にするとともに、アニメーションするビジュアルコンテンツをディスプレイに表示する。
  • 3つのサーボモーターによって補助されるインタラクションおよび動作。Jiboの狙いのひとつは、ロボティクスの複雑さを取り除きながら、豊かな表現力のある動きを作り出せるようにすることだ。

興味深いことに、Jiboには2つのカメラが備わっているが、開発者はカメラに直接アクセスできない。代わりに、Jiboが「見ている」ものの空間表現を得ることができる。Jiboのカメラを使ったスパイ行為をできないようにするためだ。

JiboのSDK開発ヘッドであるJonathan Ross氏によると、JavaScriptを使うという決定に至った動機は、急速に成長している言語のひとつであり、利用可能なライブラリとプログラミングツールの両方の観点から豊かなエコシステムがあったことだという。Jibo SDK自体はElectronを使って作られており、アニメーションエディタ、ビヘイビアエディタ、スピーチエディタ、シミュレータを含んでいる。

InfoQとのインタビューで、デベロッパーエバンジェリストのJustin Woo氏とSDK開発ヘッドのJonathan Ross氏は、JiboはパブリックAPIを提供している任意のIoTデバイスと接続できるため、「ホームコマンダー」として使うことが可能だ、と説明した。

ロボットJiboの最初のリリースでは、テクノロジーに精通した家庭をターゲットにしています - 家に子供のいるX世代(注:1960年代から80年代生まれ)の若者たち、単身者を想定してください - ミレニアル世代(注:1980年代から2000年代初頭生まれ)を想定してください。アプリケーション - 私たちがJoboのスキルと呼んでいるもの - を考えるときには、新しい家族の一員としてJiboが果たす様々な役割について考えます。例えば、教育者としてのJibo、エンターテイナーとしてのJibo、ホームコマンダーとしてのJiboなどです。Jiboを誰かとして考えるようになり、家族の一員であるために彼ができるすべてのことを考え始めると、スキルのアイデアは尽きることがありません。

Jibo SDKはビヘイビアツリーに基づいている。Woo氏とRoss氏によれば、これは自律エージェントの振る舞いとコントロールフローをモデル化するのに、そして、並行アクションと意思決定プロセスを協調させるのに、特に適しているという。

さらにWoo氏とRoss氏は、Jiboは2つのクラウドベースのサービスを使っていると説明した。ひとつは永続データストレージのためだ。これによってスキルデータが失われないよう、クラウドに安全にバックアップすることができる。もうひとつはテキスト非依存音声認識と自然言語理解のためだ。ただし、Jiboは常にクラウドベースの認識を使っているわけではない。

Jiboの起動フレーズ “Hey, Jibo” はオンボードで処理されます。そのフレーズを聞くまで、クラウドにデータを流すことはありません。2つ目は永続データストレージです。それぞれのスキルは、読み書き可能なJoboのローカルメモリに保護エリアを持っています。Jiboはこのデータをクラウドに安全にバックアップするため、何も失われることはありません。

ロボットの多くのタスクはローカルですべて行われる。それには、視覚、認知、音声のローカライゼーション、ボイスID、フェイスID、アニメーション/モーター制御、NLU、テキスト非依存音声認識、音声合成(Jiboの声)、グラフィックス、サウンドなどが含まれる。

Jibo SDKはすでに利用可能だが、Jibo本体のリリースは2016年の後半になる見込みだ。SDKとともに、Jiboはデベロッパーフォーラムも立ち上げている。

 
 

Rate this Article

Relevance
Style
 
 

この記事に星をつける

おすすめ度
スタイル

こんにちは

コメントするには InfoQアカウントの登録 または が必要です。InfoQ に登録するとさまざまなことができます。

アカウント登録をしてInfoQをお楽しみください。

あなたの意見をお聞かせください。

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする
コミュニティコメント

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

HTML: a,b,br,blockquote,i,li,pre,u,ul,p

このスレッドのメッセージについてEmailでリプライする

ディスカッション
BT