InfoQ ホームページ MachineLearning に関するすべてのコンテンツ
-
カーネギーメロン大学の研究者、WiFi経由で人を検知するAIモデルを開発
カーネギーメロン大学(CMU)のヒューマンセンシング研究所の研究者は、WiFi送信機からの信号のみを用いて、部屋にいる複数の人間のポーズを検出するAIモデルのDensePose from WiFiに関する論文を発表した。実世界のデータを用いた実験では、このアルゴリズムは50%のIOU閾値で平均87.2という精度を達成したのである。
-
Wayveの自動運転車向けEnd-to-Endディープラーニングモデル
ディープラーニングAI技術に注力するWayveは、CARLAのシミュレーションデータを基に世界モデルと車両の運転方針を学習し、HDマップのない車への自律性を実現する最先端のエンドツーエンドモデルを発表した。
-
Googleの新たなImagen AIが、テキストから画像を生成するベンチマークでDALL-Eの性能を上回る
GoogleのBrain Teamの研究者がImagenを発表した。これはテキストによる説明が与えられたシーンから、写真のような現実感のある画像を生成できるテキスト-to-イメージAIモデルである。Imagenは、COCOベンチマークでDALL-E 2の性能を上回り、多くの同様のモデルと異なり、テキストデータでのみ事前トレーニングされている。
-
Microsoftの新しいシミュレーションフレームワークFLUTEが連合学習アルゴリズムの開発を加速
Microsoft Researchは最近、連合学習ユーティリティと実験用ツール(FLUTE)をリリースした。これは連合学習のMLアルゴリズム開発を促進するための新しいシミュレーションフレームワークである。連合学習の主な目標は、一か所でデータを共有する必要なしに、大量のデータに対して複雑な機械学習モデルをトレーニングすることである。
-
Metaが1750億パラメータAI言語モデルのOPTをオープンソース化
Meta AI Researchは、1750億パラメーターAI言語モデルのOpen Pre-trained Transformer(OPT-175B)をリリースした。このモデルは1800億のトークンを含むデータセットでトレーニングされている。GPT-3と同等のパフォーマンスを示す一方で、必要なカーボンフットプリントはGPT-3トレーニングの7分の1のみである。
-
Allen Institute for AI、AIモデル検査ツール”LM-Debugger”をオープンソースとして公開
Allen Institute for AI(AI2)は、言語モデル(LM)の予測出力を解釈し制御する、対話型ツールのLM-Debuggerをオープンソースとして公開した。LM-DebufferはすべてのHuggingFace GPT-2モデルを対象に、モデルのニューラルネットワークの隠れ層(hidden layer)の更新をダイナミックに修正することにより、ユーザのテキスト生成プロセスへの介入を可能にする。
-
Amazon RekognitionがStreaming Video Eventを導入
AWSは先頃、Amazon Rekognitionの新機能として、ライブビデオストリーム上でリアルタイムなアラートを提供するStreaming Video Eventsの提供を開始すると発表した。
-
グラフニューラルネットワークのベンチマークを高速化する新ツール GraphWorld
Google AIは先頃、グラフニューラルネットワーク(Graph Neural Networks、GNNs)分野のパフォーマンスベンチマークを加速するツールとして、GraphWorldをリリースした。異なるノード次数分布やジニ係数のように、さまざまな構造特性でグラフを生成するための、コンフィギュレーション可能なフレームワークである。
-
TensorFlow DTensor:分散ディープネットワークトレーニング向けの統合API
最近リリースされたTensorFlow v2.9では、モデル、データ、スペースパラレル(別名、空間タイル)ディープネットワークトレーニングのための新しいAPIが追加された。DTensorの目的は、シャーディング命令をモデルコードから分離することである。そのためにDTensorは、デバイス間でモデルとバッチパラメータを分割するための高レベルのユーティリティを提供する。
-
Amazonが51言語のAIトレーニングデータセット”MASSIVE”を公開
Amazon Alexa AIのNatural Language Understandingグループは "Multilingual Amazon SLURP (SLU resource package) for Slot Filling, Intent Classification, and Virtual-Assistant Evaluation"(MASSIVE)をリリースした。自然言語理解(NLU)AIモデルのトレーニングを目的として、51言語から100万件のアノテーション付きサンプルを収めたデータセットだ。データを使用するためのコードやツールも含まれている。
-
Meta AIが提供する新しいデータセットにより、水素燃料向けの再生可能エネルギー触媒の発見が加速
Meta AIは最近、グリーン水素燃料MLモデリングとシミュレーションに関するまったく新しいデータセットを間もなくリリースすると発表した。これは、酸素発生反応(OER)のための酸化物触媒に焦点を当てたものである。OERは風力と太陽光のエネルギーを介したグリーン水素燃料の生産に使われる重要な化学反応である。
-
LAION、50億の画像-テキストペア・データセットLAION-5Bを公開
Large-scale Artificial Intelligence Open Network(LAION)は、50億を越える画像とテキストのペアを収めたAI用トレーニングデータセット"LAION-5B"をリリースした。LAION-5Bには、インターネットから収集した画像とキャプションが、前作であるLAION-400Mの14倍という規模で含まれており、無償で入手可能な最大の画像-テキストデータセットとなっている。
-
GoogleがCloud TPU VMの一般向け提供(GA)を発表
昨年、GoogleはCloud TPU仮想マシン(VM)を導入した。これにより、プレビュー版としてTPUホストマシンに直接アクセスできるようになる。現在、Cloud TPU VMは、新たなTPU Embedding APIを含め、一般向けに利用可能(GA)である。これにより、MLベースのランキングとレコメンドの処理を高速化できる。
-
DeepMindが核融合研究装置のAIコントローラをトレーニング
Google子会社のDeepMindとEPFL(スイス連邦工科大学ローザンヌ校) Swiss Plasma Centerの研究者らが、核融合研究で使用するトカマク(tokamak)デバイスの制御アルゴリズムを生成する深層強化学習(RL)AIを開発した。このシステムは、シミュレータとのインタラクションを通じて制御ポリシを学習することで、実際のデバイスの制御への適用において、新たなプラズマ配位(plasma configuration)の実現を可能にしている。
-
Amazon SageMakerサーバーレス推論が一般向け提供へ
Amazonは最近、SageMakerサーバレス推論が一般向けに利用可能となったことを発表した。この新しいオプションは、断続的、あるいは、まれなトラフィックパターンを伴う処理向けに設計されており、モデルが受信する推論要求の量に応じて計算能力をプロビジョニング・スケーリングする。