InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
マイクロソフト、マルチモーダルチャットボット「Visual ChatGPT」をオープンソース化
Microsoft Researchは人間が入力したテキストのプロンプトに反応して画像を生成・操作できるチャットボットシステムVisual ChatGPTをオープンソース化した。このシステムはOpenAIのChatGPTと22種類の視覚基盤モデル(VFM)を組み合わせ、マルチモーダルなインタラクションをサポートする。
-
OpenAI、強力で費用対効果が高く、ユーザーフレンドリーなエンベッディングモデルを発表
OpenAIは、テキスト検索、テキスト類似性、コード検索など、これまでの5つのモデルの機能を統合した最先端のエンベッディングモデルであるtext-embedding-ada-002を発表した。この新しいモデルは、従来のもっとも高性能なモデルであるDavinciをほとんどのタスクで上回り、しかも99.8%の大幅なコスト削減を実現している。また、text-embedding-ada-002はより使いやすくなっており、ユーザーにとってより便利な選択肢となっているのだ。
-
モバイルやノートパソコンでローカル実行可能な大規模言語モデル MLC LLMを公開
MLC LLMは、大規模言語モデルを様々なハードウェアやアプリケーションに展開することを目的とした新しいオープンソースプロジェクトだ。このプロジェクトにはユースケース毎にモデルのパフォーマンスを最適化するためのフレームワークも含まれている。
-
Stability AIが70億パラメータのオープンソースな言語モデル「StableLM」を公開
Stability AIは、大規模言語モデル(LLM)スイートであるStableLMのための訓練済み重みづけモデルを2セット公開した。これらのモデルは、1.5兆個のテキストトークンで学習済で、CC BY-SA-4.0の下で商用利用が許可されている。
-
Hugging FaceがChatGPTに代替版チャットHuggingChatをオープンソースで公開
HuggingChatは、Hugging Faceでテストできる新しいAI搭載のチャットボットだ。記事の下書き、コーディング問題の解決、質問への回答など、ChatGPTが最近多くの関心を集めている多くのタスクを実行できる。
-
責任あるAI ~ 原則から実践へ
QCon Londonカンファレンスにおいて、マイクロソフトのプリンシパルプロダクトマネージャーであるMehrnoosh Sameki氏が"責任あるAI ~ 原則から実践へ"と題して講演した。彼女は責任あるAIの6つの主要な原則と、これらの原則を実践するために不可欠な4つの要素について説明し、Fairlearn、InterpretML、責任あるAI Dashboardなどの有用なツールを紹介した。
-
Microsoft Semantic Kernel、従来のプログラムとのLLM統合を実現
マイクロソフトは、 大規模言語モデル(LLM)と従来のプログラムとの統合を可能にするlightweight SDK「Semantic Kernel(SK)」をオープンソース化し、プロンプトのテンプレート化、ベクトル化メモリ、インテリジェント・プランニングなどの機能を活用を可能にした。
-
マイクロソフト、言語学習を加速させるCognitive Speech Servicesの新機能を提供開始
マイクロソフトはこのほど、Cognitive Speech Serviceの新機能として、発音評価、新しいSTT(Speech to Text)言語、プリビルドおよびカスタムニューラルボイスの強化により言語学習を加速させることを発表した。
-
レスリー・マイリー氏『AI革命は始まったばかりだ、CO2に対して今すぐ行動を!』
QCon Londonカンファレンスの基調講演で、マイクロソフトのCTOであるLeslie Miley氏はAI バイアスと持続可能性と題した講演で大規模なAIや暗号のような変革的な技術は展開に伴ってCO2排出量の増加を伴うと主張した。
-
AI/MLニュースラウンドアップ OpenAIのGPT-4、MicrosoftのSemantic Kernel、Meta SAMとBloombergGPT
今週 ※1 のラウンドアップは、データサイエンス、機械学習、人工知能の分野から最新のニュースや情報をお届けしたい。本記事ではOpenAI、Microsoft、Meta、Bloombergなど、新たなブレークスルーやイノベーションが注目される市場の主要な競合他社を紹介する。
-
OpenAI、次世代GPTモデル「GPT-4」を発表
OpenAIは、大規模言語モデル(LLM)のGPTファミリーの次世代であるGPT-4を発表した。GPT-4は、テキストと画像の両方の入力を受け付け、いくつかの自然言語処理(NLP)ベンチマークにおいて、最先端のシステムを凌駕している。また、このモデルは、模擬司法試験で90%台のスコアを記録している。
-
MLOps を拡張および進化させるための戦略と原則 - QCon Londonから
QCon Londonにて、DoorDashのMachine Learning PlatformのシニアエンジニアリングマネージャーHien Luu氏は「Strategies and Principles to Scale and Evolve MLOps at DoorDash」と題した講演で、MLOpsのスケーリングと進化に関する洞察を発表した。Luu氏は,MLシステムが製品に価値を提供しないという,企業が直面しがちな課題を克服するための3つの原則を挙げ、DoorDashにおいてはこれらが有効であったことを説明した。
-
ブルームバーグ、GPTファイナンスに特化したAIモデルを公開
ブルームバーグは、金融セクターの様々な自然言語処理(NLP)活動を支援する、膨大な量の金融データで学習させた新しい大規模言語モデル(LLM)、「BloombergGPT」を発表した。このBlooombergGPTは金融データを迅速に評価し、リスク評価、マーケット・センチメント、さらには会計や監査を自動化できる可能性を秘めている。
-
Google AI、ユニバーサルスピーチモデルをアップデートし、自動音声認識の規模を100言語以上に拡大
Google AIは先日、1,000 Languages Initiativeをサポートするユニバーサルスピーチモデルのアップデートを発表した。このモデルは自動音声認識のすべてのセグメントにおいてOpenAI Whisperよりも優れた性能を発揮する。
-
OpenAIが次世代言語機能のためにChatGPTとWhisper APIを公開
OpenAIは、サードパーティの開発者が API経由でChatGPTとWhisperをアプリやサービスに統合して、AI活用した言語と音声テキスト変換機能へのアクセスを提供することを発表した。同社の従来の言語アプローチを使用する場合と比較してこのAPIを使用すると企業は ChatGPTとWhisperを自社のプラットフォームに容易に統合できるようになるのだ。