InfoQ ホームページ Cognitive-Computing に関するすべてのコンテンツ
ニュース
RSSフィード-
マイクロソフト、言語学習を加速させるCognitive Speech Servicesの新機能を提供開始
マイクロソフトはこのほど、Cognitive Speech Serviceの新機能として、発音評価、新しいSTT(Speech to Text)言語、プリビルドおよびカスタムニューラルボイスの強化により言語学習を加速させることを発表した。
-
MicrosoftがAzure Open AI Serviceをリリース、大規模なGPT-3モデルへのアクセスなどを提供
先日のIgniteカンファレンスにおいて、Microsoftは、Azureプラットフォーム経由でOpenAIのAPIにアクセス可能な新サービスであるAzure OpenAI Serviceのプレビューを発表した。この新たなAzure Cognitive Serviceは、OpenAIのパワフルなGPT-3モデルへのアクセスを、セキュリティ、信頼性、コンプライアンス、データのプライバシなど、Azureプラットフォームを通じて実現されるエンタープライズレベルの機能と合わせた形で実現する。
-
Microsoftがニューラルテキスト読み上げAIへの限定アクセスを発表
最近、Microsoftは、Custom Neural Voiceと呼ばれるニューラルテキスト読み上げAIへの制限付きアクセスを発表した。このサービスにより、開発者はカスタム合成音声を作成できる。
-
MicrosoftがAzure AI PlatformでImmersive Readerサービスの一般向け提供を発表
Microsoft Azure AI Platform内のCognitive Servicesスイートの一部であるImmersive Readerは、読者がテキストを読んで理解するのに役立つ。Microsoftは最近のブログで、サービスの一般向け提供を発表した。
-
MicrosoftがAnomaly DetectorとCustom Visionの2サービスを新たに提供、コグニティブサービスの範囲を拡大へ
Microsoftは先頃、 Anomaly Detectorのパブリックプレビューと、Custom Visionの一般供与を発表した。2つのサービスによってMicrosoftは、ユーザへのコグニティブサービス(Cognitive Service)の提供をさらに拡大する。
-
エンタープライズコンテンツ管理にインテリジェンスを提供するために、GoogleはDocument Understanding AIをリリース
最近のGoogle Cloud Next Conferenceで、GoogleはDocument Understanding AIと呼ばれる新しいベータ版の機械学習サービスを発表した。このサービスはエンタープライズコンテンツ管理(ECM)の業務をターゲットにしており、人工知能(AI)と機械学習(ML)を使用して、顧客が非構造化コンテンツからキーバリューペアを編成、分類、抽出できるようにしている。
-
Facebookが自然言語処理開発を促進するPyTextをオープンソース公開
先日のブログ記��でFacebookは、自然言語処理(NLP)システムで使用されているモデリングフレームワークのPyTextを、オープンソースとして公開すると発表した。PyTextはPyTorch上に構築されたライブラリで、実験レベルにあるプロジェクトの効率を改善し、大規模な実用システムとして展開可能にする。
-
Amazon、インテリジェントなロボットアプリケーション構築のためにAWS RoboMakerを発表
AWS re:Invent 2018において、AmazonはAWS RoboMakerを発表した。これはインテリジェントなロボットアプリケーションの開発、テスト、デプロイを簡単にするサービスだ。RoboMakerにはROS(Robot Operating System)の拡張機能が含まれており、AWSへクラウド接続することで、機械学習、認識、監視、分析サービスが利用できるようになる。
-
Microsoft、ニューラルネットワークによる音声合成機能をプレビュー
最近のブログ記事で、MicrosoftはAzure Cognitive Servicesに含まれるニューラルネットワークによる音声合成機能のパブリックプレビューを発表した。今回のリリースで、生成された音声は実際の録音と区別がつかなくなる。この技術は、チャットボット、バーチャルアシスタント、電子書籍などデジタルテキストのオーディオブック変換に適用できる。
-
Googleのコグニティブへの投資:Cloud Speech APIが一般利用可能レベルに到達
最近のブログ投稿において、Googleは自身のCloud Speech APIが一般利用可能(GA)となったことを発表した。このCloud Speech APIにより、開発者は動的な翻訳に加え、動画、画像、そしてテキストの解析のような、認識処理のための訓練済み機械学習を利用可能になった。Cloud Speech APIは昨年の夏にオープンβの形で開始された。
-
ディープラーニング技術を使用してIBMは音声認識で新たなマイルストーンを達成
IBMの調査チームは最近、SWITCHBOARD言語コーパスを使用して、5.5%の単語誤り率で音声認識における新たな業界記録に達したことを発表した。これは、人の誤認率と言われる5.1%に近づいている。彼らはこのマイルストーンを達成するためにディープラーニング技術と音響モデルを使用した。
-
IBMがコグニティブ・コンピューティングのための相変化メモリによる人工ニューロンの開発に成功
チューリッヒのIBM Researchにて,科学者チームが相変化材料(phase-change materials)を使用し,データの保持と処理が可能な人工ニューロンを開発した。 これら相変化ベースの人工ニューロンは,ビッグデータ(イベントベース・データのリアルタイム・ストリーム)におけるパターン認識や相関の発見に利用できる。また,教師なし学習を高速かつ小エネルギーで実施することができる。