InfoQ ホームページ AIと機械学習、データエンジニアリングに関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

Java

Javaニュースラウンドアップ： JDK 21アップデート、Spring Data 2023.0、JobRunr 6.2、Micronaut 4.0 Milestone

2023年5月8日のJavaラウンドアップは、OpenJDK、JDK 21、GraalVM Native Build Tools 0.9.22, Spring Framework, Spring Data and Spring Shell releases, Micronaut 4.0-M3, Quarkus 3. 0.3、Eclipse Vert.xリリース、Micrometer Metrics and Tracingリリース、Groovy 4.0.12、Tomcatリリース、Maven 3.9.2, Piranha 23.5.0, Reactor 2022.0.7, JobRunr 6.2, JDKMonリリース、Devoxx UKのニュースを掲載。

Michael Redlich 翻訳者 Ayako Ueno
投稿日 2023年6月20日午前3時53分
AIと機械学習、データエンジニアリング

Googleのユニバーサルスピーチモデルが数百の言語の音声認識を実現

Google Researchは、1,200万時間以上のスピーチ音声で学習させた2Bパラメータの自動音声認識（ASR）モデルであるUniversal Speech Model（USM）を発表した。USMは、低リソース言語を含む100以上の言語の音声を認識でき、いくつかのベンチマークで新しい最先端の性能を達成した。

Anthony Alford 翻訳者 Naoko Koshimura Ayako Ueno
投稿日 2023年6月9日午前4時26分
AIと機械学習、データエンジニアリング

MetaのToolformer、APIを活用したゼロショットNLPタスクでGPT-3を引き離す

Meta AI Researchは、自然言語処理（NLP）タスクの解決を支援するためにAPIの呼び出しを学習する言語モデルToolformerを発表した。 Toolformerはモデルの微調整に使用されるトレーニングデータセットを自動的にアノテートし、いくつかのゼロショットNLPタスクの性能で大きくGPT-3モデルを引き離す。

Anthony Alford 翻訳者 Ayako Ueno
投稿日 2023年6月9日午前4時23分
AIと機械学習、データエンジニアリング

AWSがAmazon BedrockとTitan基盤モデルでド派手に生成AIレース参入

AWSはAmazon BedrockとTitanの基盤モデルを発表し、生成AIレースへの参入を発表した。アマゾンは、生成AI技術へのアクセスを民主化し、さまざまな業界やユースケースの顧客に対応することを目的としている。この画期的な開発により、急速に成長するAI市場においてAmazonは手ごわい競争相手になる。

Daniel Dominguez 翻訳者 Ayako Ueno
投稿日 2023年6月9日午前4時21分
AIと機械学習、データエンジニアリング

Metaが信頼性向上と運用の簡素化を目的に「MySQL Raft」へ移行

Metaは現在の準同期データベースとしてのMySQLを置き換えるために、MySQL Raftをデータセンターで展開している。新しいコンセンサスエンジンは運用を助け、MySQLサーバーがプロモーションやメンバーシップに責任を持つことを可能にしている。

Renato Losio 翻訳者 Ayako Ueno
投稿日 2023年6月2日午後3時21分
AIと機械学習、データエンジニアリング

OpenAI、GPT-4を用いてGPT-2でニューロンの行動を解釈

OpenAIの研究グループが最近発表した論文では、現在のディープニューラルネットワーク（DNN）の限界の1つである「解釈可能性の欠如」を解決するための新しいアプローチの概要が示されている。研究者たちはGPT-4を用いることで、DNNの解釈可能性を自動化するための第一歩として、どのような事象がニューロンの活性化を引き起こすかを解釈する技術を構築することを目的としている。

Sergio De Simone 翻訳者 Ayako Ueno
投稿日 2023年6月2日午後3時2分
AIと機械学習、データエンジニアリング

Metaが手がけるオープンソースなComputer Vision基盤モデルDINOv2

Meta AI ResearchはComputer Vision（CV）タスクの基盤モデルであるDINOv2をオープンソース化した。DINOv2は142Mの画像からなるキュレーションデータセットで事前学習されており、画像分類(Image Classification)、ビデオアクション認識(Video Action Recognition)、セマンティックセグメンテーション(Semantic Segmentation)、深度推定(Depth Estimation)などのタスクのバックボーンとして使用できる。

Anthony Alford 翻訳者 Ayako Ueno
投稿日 2023年6月2日午後2時58分
AIと機械学習、データエンジニアリング

ChatGPTは何にでも適用可能か？アラン・チューリング研究所のフェローがDevoxx UK基調講演でチェックリストを発表

アラン・チューリング研究所の倫理フェローであるMhairi Aitken氏は、Devoxx UKの基調講演で、AIが人の言語の複雑さを処理するときの限界についてゲール語由来の自分の名前をAIが誤って発音したことを例にあげて語った。彼女はまずアラン・チューリング研究所で、社会における大規模言語モデルの社会的・倫理的リスクの予測に焦点を当てて研究していることを説明した。また、それらのリスクをどのように最小化できるか、そして責任を持って設計・開発された場合にデータやAIが社会全体に提供できる価値を理解しようと努めている。

Olimpiu Pop 翻訳者 Ayako Ueno
投稿日 2023年6月2日午後2時55分
AIと機械学習、データエンジニアリング

半構造化データ変換のためのLLMの効率的な適用について

半構造化(Semi-Structured)データから構造化データを生成するための手段としてLLMは有効だが相応のコストを要する。スタンフォード大学とコーネル大学の研究チームは推論品質を向上させながら、推論コストを110分の1に削減する技術を発見したとしている。

Sergio De Simone 翻訳者 Ayako Ueno
投稿日 2023年6月2日午後2時53分
AIと機械学習、データエンジニアリング

Twitterがレコメンデーションアルゴリズムをオープンソース化

Twitterは最近、ユーザーのTwitterタイムラインにツイートをレコメンドするシステムのいくつかのコンポーネントをオープンソース化した。このリリースには、アルゴリズムを実行するいくつかのサービスやジョブのコード、ツイートを埋め込んでランキングする機械学習モデルをトレーニングするコードが含まれている。

Anthony Alford 翻訳者 Ayako Ueno
投稿日 2023年5月25日午前4時18分
モバイル

Google、Android開発向けコーディングボット「Studio Bot」をプレビュー公開

Google I/O 2023で、GoogleはAndroid Studio最新版に統合されたAI搭載のコーディングボットStudio Bot（コードネーム：Hedgehog）をプレビュー公開した。Studio Botは開発者がコードとユニットテストを書き、エラー修正をするのを支援することを目的としている。

Sergio De Simone 翻訳者 Ayako Ueno
投稿日 2023年5月25日午前4時16分
AIと機械学習、データエンジニアリング

マイクロソフト、マルチモーダルチャットボット「Visual ChatGPT」をオープンソース化

Microsoft Researchは人間が入力したテキストのプロンプトに反応して画像を生成・操作できるチャットボットシステムVisual ChatGPTをオープンソース化した。このシステムはOpenAIのChatGPTと22種類の視覚基盤モデル（VFM）を組み合わせ、マルチモーダルなインタラクションをサポートする。

Anthony Alford 翻訳者 Ayako Ueno
投稿日 2023年5月25日午前4時15分
AIと機械学習、データエンジニアリング

OpenAI、強力で費用対効果が高く、ユーザーフレンドリーなエンベッディングモデルを発表

OpenAIは、テキスト検索、テキスト類似性、コード検索など、これまでの5つのモデルの機能を統合した最先端のエンベッディングモデルであるtext-embedding-ada-002を発表した��この新しいモデルは、従来のもっとも高性能なモデルであるDavinciをほとんどのタスクで上回り、しかも99.8%の大幅なコスト削減を実現している。また、text-embedding-ada-002はより使いやすくなっており、ユーザーにとってより便利な選択肢となっているのだ。

Daniel Dominguez 翻訳者 Ayako Ueno
投稿日 2023年5月25日午前4時10分
.NET

ML.NETモデルビルダーに文章類似度トレーニングのシナリオを追加

マイクロソフトはモデルビルダーに「Sentence Similarity」シナリオを追加する情報を公開した。このシナリオは文章の類似度モデルのトレーニングを可能にするものだ。このシナリオがモデルビルダーに追加されたことと合わせて、モデルビルダー GPU extensionをインストールする必要がなくなった。さらにマイクロソフトはdeep learning、LightGBM algorithm、AutoMLの分野での開発について、今後数ヶ月の作業について通知している。

Robert Krzaczyński 翻訳者 Ayako Ueno
投稿日 2023年5月24日午後3時47分
AIと機械学習、データエンジニアリング

モバイルやノートパソコンでローカル実行可能な大規模言語モデル MLC LLMを公開

MLC LLMは、大規模言語モデルを様々なハードウェアやアプリケーションに展開することを目的とした新しいオープンソースプロジェクトだ。このプロジェクトにはユースケース毎にモデルのパフォーマンスを最適化するためのフレームワークも含まれている。

Sergio De Simone 翻訳者 Ayako Ueno
投稿日 2023年5月24日午後3時46分