InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
GitHub、法的論争が続く中、Copilotをビジネス向けにリリース
GitHubは、OpenAIを搭載したコーディングアシスタント「Copilot」のビジネスプラン「Copilot for Business」を発表した。今回のリリースは、オープンソースライセンスに違反しているとして、Microsoft、GitHub、OpenAIに対して最近起きた集団訴訟を受けたものである。
-
マイクロソフト、ChatGPTでロボットを言語で制御することを目指す
Microsoft Autonomous Systems and Robotics Groupの研究者は論文でOpenAIのChatGPTをロボット工学アプリケーションに活用する方法を発表した。プロンプトの設計方法と、手元のタスクをプログラムするために特定のロボットライブラリを使用するようにChatGPTに指示する方法などである。
-
Wayveの自動運転車向けEnd-to-Endディープラーニングモデル
ディープラーニングAI技術に注力するWayveは、CARLAのシミュレーションデータを基に世界モデルと車両の運転方針を学習し、HDマップのない車への自律性を実現する最先端のエンドツーエンドモデルを発表した。
-
ディープラーニングのパイオニアGeoffrey Hinton氏、新しいアルゴリズムを発表
トロント大学教授でGoogle BrainのエンジニアリングフェローであるGeoffrey Hinton氏は、最近、ニューラルネットワークのトレーニング手法として、バックプロパゲーションの代わりに、ネットワーク内のデータの2回のフォワードパスを使用してモデルの重みを更新するForward-Forwardアルゴリズム(以降、FFアルゴリズム)に関する論文を発表した。
-
Microsoftがストレージに最適化した新たなVMとしてLasv3とLsv3を発表
最近、Microsoftは、ストレージに最適化した新たなAzure仮想マシン(VM)の一般向け提供(GA)を発表した。このVMは、高スループットとIOPSを必要とする処理を実行するために設計されたLasv3シリーズとLsv3シリーズである。そのターゲットは、ビッグデータアプリケーション、SQLデータベースとNoSQLデータベース、分散ファイルシステム、データ分析エンジンなどである。
-
Googleの新たなImagen AIが、テキストから画像を生成するベンチマークでDALL-Eの性能を上回る
GoogleのBrain Teamの研究者がImagenを発表した。これはテキストによる説明が与えられたシーンから、写真のような現実感のある画像を生成できるテキスト-to-イメージAIモデルである。Imagenは、COCOベンチマークでDALL-E 2の性能を上回り、多くの同様のモデルと異なり、テキストデータでのみ事前トレーニングされている。
-
Microsoftが、自社のMarketplaceでSaaSソリューションとしてDynatrace for Azureのパブリックプレビュー版を開始
Microsoftは最近、Dynatrace for Azureを発表した。これはDynatraceのネイティブ統合ソフトウェア(SaaS)ソリューションで、Azure Marketplaceからプレビュー版として入手できる。
-
Microsoftの新しいシミュレーションフレームワークFLUTEが連合学習アルゴリズムの開発を加速
Microsoft Researchは最近、連合学習ユーティリティと実験用ツール(FLUTE)をリリースした。これは連合学習のMLアルゴリズム開発を促進するための新しいシミュレーションフレームワークである。連合学習の主な目標は、一か所でデータを共有する必要なしに、大量のデータに対して複雑な機械学習モデルをトレーニングすることである。
-
Microsoftが中核となる新たなプラットフォームを発表:Microsoft Intelligent Data Platform
Microsoftは最近、Microsoft Intelligent Data Platformと呼ばれる新しいプラットフォームを発表した。このプラットフォームでは、データベース、分析、ガバナンスの製品を完全に統合する。この新しいプラットフォームには、Azure Dataスペースで既に利用できるすべてのもの(Azure Data Factory、Azure Data Explorer、SQL Server 2022、Azure SQL、Cosmos DBなど)からSynapse Analytics製品、Power BI、および新しくブランド変更されたPurviewデータガバナンスが含まれる。
-
Metaが1750億パラメータAI言語モデルのOPTをオープンソース化
Meta AI Researchは、1750億パラメーターAI言語モデルのOpen Pre-trained Transformer(OPT-175B)をリリースした。このモデルは1800億のトークンを含むデータセットでトレーニングされている。GPT-3と同等のパフォーマンスを示す一方で、必要なカーボンフットプリントはGPT-3トレーニングの7分の1のみである。
-
Amazon Elastic MapReduceがサーバーレス製品として一般向け提供へ
AWSは最近、Amazon Elastic MapReduce(EMR)サーバレスが一般向け提供(GA)となったことを発表した。この製品はサーバレスデプロイメントの選択肢の1つである。これは、クラスタやサーバを設定、管理、スケーリングすることなく、Apache SparkやHiveなどのオープンソースフレームワークを使ってビッグデータ分析アプリケーションを実行する顧客を対象としたものである。
-
Allen Institute for AI、AIモデル検査ツール”LM-Debugger”をオープンソースとして公開
Allen Institute for AI(AI2)は、言語モデル(LM)の予測出力を解釈し制御する、対話型ツールのLM-Debuggerをオープンソースとして公開した。LM-DebufferはすべてのHuggingFace GPT-2モデルを対象に、モデルのニューラルネットワークの隠れ層(hidden layer)の更新をダイナミックに修正することにより、ユーザのテキスト生成プロセスへの介入を可能にする。
-
グラフニューラルネットワークのベンチマークを高速化する新ツール GraphWorld
Google AIは先頃、グラフニューラルネットワーク(Graph Neural Networks、GNNs)分野のパフォーマンスベンチマークを加速するツールとして、GraphWorldをリリースした。異なるノード次数分布やジニ係数のように、さまざまな構造特性でグラフを生成するための、コンフィギュレーション可能な���レームワークである。
-
TensorFlow DTensor:分散ディープネットワークトレーニング向けの統合API
最近リリースされたTensorFlow v2.9では、モデル、データ、スペースパラレル(別名、空間タイル)ディープネットワークトレーニングのための新しいAPIが追加された。DTensorの目的は、シャーディング命令をモデルコードから分離することである。そのためにDTensorは、デバイス間でモデルとバッチパラメータを分割するための高レベルのユーティリティを提供する。
-
Amazonが51言語のAIトレーニングデータセット”MASSIVE”を公開
Amazon Alexa AIのNatural Language Understandingグループは "Multilingual Amazon SLURP (SLU resource package) for Slot Filling, Intent Classification, and Virtual-Assistant Evaluation"(MASSIVE)をリリースした。自然言語理解(NLU)AIモデルのトレーニングを目的として、51言語から100万件のアノテーション付きサンプルを収めたデータセットだ。データを使用するためのコードやツールも含まれている。