InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Javaニュース ラウンドアップ: JDK 21アップデート、Spring Data 2023.0、JobRunr 6.2、Micronaut 4.0 Milestone
2023年5月8日のJavaラウンドアップは、OpenJDK、JDK 21、GraalVM Native Build Tools 0.9.22, Spring Framework, Spring Data and Spring Shell releases, Micronaut 4.0-M3, Quarkus 3. 0.3、Eclipse Vert.xリリース、Micrometer Metrics and Tracingリリース、Groovy 4.0.12、Tomcatリリース、Maven 3.9.2, Piranha 23.5.0, Reactor 2022.0.7, JobRunr 6.2, JDKMonリリース、Devoxx UKのニュースを掲載。
-
Googleのユニバーサルスピーチモデルが数百の言語の音声認識を実現
Google Researchは、1,200万時間以上のスピーチ音声で学習させた2Bパラメータの自動音声認識(ASR)モデルであるUniversal Speech Model(USM)を発表した。USMは、低リソース言語を含む100以上の言語の音声を認識でき、いくつかのベンチマークで新しい最先端の性能を達成した。
-
MetaのToolformer、APIを活用したゼロショットNLPタスクでGPT-3を引き離す
Meta AI Researchは、自然言語処理(NLP)タスクの解決を支援するためにAPIの呼び出しを学習する言語モデルToolformerを発表した。 Toolformerはモデルの微調整に使用されるトレーニングデータセットを自動的にアノテートし、いくつかのゼロショットNLPタスクの性能で大きくGPT-3モデルを引き離す。
-
AWSがAmazon BedrockとTitan基盤モデルでド派手に生成AIレース参入
AWSはAmazon BedrockとTitanの基盤モデルを発表し、生成AIレースへの参入を発表した。アマゾンは、生成AI技術へのアクセスを民主化し、さまざまな業界やユースケースの顧客に対応することを目的としている。この画期的な開発により、急速に成長するAI市場においてAmazonは手ごわい競争相手になる。
-
Metaが信頼性向上と運用の簡素化を目的に「MySQL Raft」へ移行
Metaは現在の準同期データベースとしてのMySQLを置き換えるために、MySQL Raftをデータセンターで展開している。新しいコンセンサスエンジンは運用を助け、MySQLサーバーがプロモーションやメンバーシップに責任を持つことを可能にしている。
-
OpenAI、GPT-4を用いてGPT-2でニューロンの行動を解釈
OpenAIの研究グループが最近発表した論文では、現在のディープニューラルネットワーク(DNN)の限界の1つである「解釈可能性の欠如」を解決するための新しいアプローチの概要が示されている。研究者たちはGPT-4を用いることで、DNNの解釈可能性を自動化するための第一歩として、どのような事象がニューロンの活性化を引き起こすかを解釈する技術を構築することを目的としている。
-
Metaが手がけるオープンソースなComputer Vision基盤モデルDINOv2
Meta AI ResearchはComputer Vision(CV)タスクの基盤モデルであるDINOv2をオープンソース化した。DINOv2は142Mの画像からなるキュレーションデータセットで事前学習されており、画像分類(Image Classification)、ビデオアクション認識(Video Action Recognition)、セマンティックセグメンテーション(Semantic Segmentation)、深度推定(Depth Estimation)などのタスクのバックボーンとして使用できる。
-
ChatGPTは何にでも適用可能か?アラン・チューリング研究所のフェローがDevoxx UK基調講演でチェックリストを発表
アラン・チューリング研究所の倫理フェローであるMhairi Aitken氏は、Devoxx UKの基調講演で、AIが人の言語の複雑さを処理するときの限界についてゲール語由来の自分の名前をAIが誤って発音したことを例にあげて語った。彼女はまずアラン・チューリング研究所で、社会における大規模言語モデルの社会的・倫理的リスクの予測に焦点を当てて研究していることを説明した。また、それらのリスクをどのように最小化できるか、そして責任を持って設計・開発された場合にデータやAIが社会全体に提供できる価値を理解しようと努めている。
-
半構造化データ変換のためのLLMの効率的な適用について
半構造化(Semi-Structured)データから構造化データを生成するための手段としてLLMは有効だが相応のコストを要する。スタンフォード大学とコーネル大学の研究チームは推論品質を向上させながら、推論コストを110分の1に削減する技術を発見したとしている。
-
Twitterがレコメンデーションアルゴリズムをオープンソース化
Twitterは最近、ユーザーのTwitterタイムラインにツイートをレコメンドするシステムのいくつかのコンポーネントをオープンソース化した。このリリースには、アルゴリズムを実行するいくつかのサービスやジョブのコード、ツイートを埋め込んでランキングする機械学習モデルをトレーニングするコードが含まれている。
-
Google、Android開発向けコーディングボット「Studio Bot」をプレビュー公開
Google I/O 2023で、GoogleはAndroid Studio最新版に統合されたAI搭載のコーディングボットStudio Bot(コードネーム:Hedgehog)をプレビュー公開した。Studio Botは開発者がコードとユニットテストを書き、エラー修正をするのを支援することを目的としている。
-
マイクロソフト、マルチモーダルチャットボット「Visual ChatGPT」をオープンソース化
Microsoft Researchは人間が入力したテキストのプロンプトに反応して画像を生成・操作できるチャットボットシステムVisual ChatGPTをオープンソース化した。このシステムはOpenAIのChatGPTと22種類の視覚基盤モデル(VFM)を組み合わせ、マルチモーダルなインタラクションをサポートする。
-
OpenAI、強力で費用対効果が高く、ユーザーフレンドリーなエンベッディングモデルを発表
OpenAIは、テキスト検索、テキスト類似性、コード検索など、これまでの5つのモデルの機能を統合した最先端のエンベッディングモデルであるtext-embedding-ada-002を発表した��この新しいモデルは、従来のもっとも高性能なモデルであるDavinciをほとんどのタスクで上回り、しかも99.8%の大幅なコスト削減を実現している。また、text-embedding-ada-002はより使いやすくなっており、ユーザーにとってより便利な選択肢となっているのだ。
-
ML.NETモデルビルダーに文章類似度トレーニングのシナリオを追加
マイクロソフトはモデルビルダーに「Sentence Similarity」シナリオを追加する情報を公開した。このシナリオは文章の類似度モデルのトレーニングを可能にするものだ。このシナリオがモデルビルダーに追加されたことと合わせて、モデルビルダー GPU extensionをインストールする必要がなくなった。さらにマイクロソフトはdeep learning、LightGBM algorithm、AutoMLの分野での開発について、今後数ヶ月の作業について通知している。
-
モバイルやノートパソコンでローカル実行可能な大規模言語モデル MLC LLMを公開
MLC LLMは、大規模言語モデルを様々なハードウェアやアプリケーションに展開することを目的とした新しいオープンソースプロジェクトだ。このプロジェクトにはユースケース毎にモデルのパフォーマンスを最適化するためのフレームワークも含まれている。