InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
MLCommons、最新のMLPerfトレーニングベンチマークの結果を発表
エンジニアリングコンソーシアムのMLCommonsは先頃、MLPerf Trainingベンチマークコンペティションの最新ラウンドの結果を発表した。14の組織から158を越えるAIトレーニングジョブのパフォーマンスメトリクスが提出され、最高値には前回ラウンドに比較して2.3倍の向上が確認されている。
-
Googleが2800億パラメータのAI言語モデル”Gopher”をトレーニング
Google子会社のDeepMindが、2,800億のパラメータを持つAI自然言語処理(NLP)モデルGopherを発表した。Transformerアーキテクチャをベースとし、MassiveTextと呼ばれる10.5TBのコーパスでトレーニングされたGopherは、124評価タスク中の100件において現在の最高記録を凌駕する。
-
Microsoft、分散マシンラーニングライブラリSynapseMLをオープンソース公開
Microsoftは、分散マシンラーニング(ML)パイプラインの構築と管理を行うオープンソースライブラリのSynapseMLをリリースすると発表した。SyanpseMLはApache Spark上で動作し、複数のデータストアを対象に言語非依存のAPI抽象化を提供するもので、Open Neural Network Exchange(ONNX)など既存のMLテクノロジに統合される。
-
DeepMindが天気予報AIである降水のDeep Generativeモデルをリリース
DeepMindはDeep Generative Models of Rainfall(DGMR)のデータセットとトレーニング済みモデルスナップショットをオープンソース化した。短期の降水量予測用のAIシステムだ。58人の専門気象学者が、他の既存の方法との比較で実施した評価で、DGMRはテストケースの89%で精度と有用性で1位にランクインした。
-
Azure SpaceがAzure Orbitalのプレビューと新しい地理空間機能を導入
Microsoft は先ごろ、Azure Space の新しい衛星接続と地理空間機能を発表した。同クラウドプロバイダは、衛星の通信と制御を提供するサービスとしての地上局である Azure Orbital のプレビューを導入し、Esri、Blackshark.ai、および Orbital Insight との地理空間とデータ分析のパートナシップを追加した。
-
AWSが機械学習を学習し実験するための無料ツールSageMaker Studio Labを発表
AWSはSageMaker Studio Labを発表した。開発者が機械学習技術を学び、その技術を実験するのに役立つ無料サービスだ。SageMaker Studio Labは、JupyterLab IDE、CPUとGPUのモデルトレーニング、15GBの永続ストレージなど、開始するためのベースとなるものをすべてユーザに提供する。
-
MITの研究者がディープラーニングの計算負荷を調査
MIT、延世大学、ブラジリア大学の研究者チームが新しいWebサイトComputer Progressを立ち上げた。1,000を超える深層学習研究論文の計算負荷を分析するものだ。このサイトのデータにより、計算負荷が予想よりも速く増加していることが示されている。アルゴリズムにはまだ改善の余地があることを示している。
-
Hazelcastがバージョン5.0で新しい統合プラットフォームを発表
分散コンピューティング、ストレージプラットフォームのHazelcastは、Hazelcast Platformバージョン5.0のリリースを発表した。この新しいプラットフォームは、既存の製品であるHazelcast IMDGとHazelcast Jetを統合するものである。前者はデータを保存、取得、変更するための高速な方法を提供し、後者はデータの高速処理を提供する。
-
リアルタイムMLのためのストリーミングファーストなインフラストラクチャ - Chip Huyen氏の講演より
先日のQCon PlusオンラインカンファレンスでChip Huyen氏は、"Streaming-first Infrastructure for Real-time ML"と題して、継続的マシンラーニング(continual machine learning)について講演し、リアルタイムで継続的なマシンラーニングのためのストリーミングファーストなインフラストラクチャの持つアドバンテージ、リアルタイムMLのメリット、リアルタイムML実現のための課題、といった話題を取り上げた。
-
AWS Data Exchange for API によりサードパーティAPIへの一貫したアクセスの提供
先ごろのラスベガスでの AWS re:Invent の間に同社は AWS Data Exchange for API を発表した。この新機能により、顧客は AWS Data Exchange のプロバイダからサードパーティのAPI 製品 を検索、サブスクライブ、そして使用できる。
-
Katharine Jarmul氏のMachine Learning at the Edge
先ごろの QCon Plus オンラインカンファレンスで、Katharine Jarmul 氏は、「Machine Learning at the Edge」というタイトルで連合機械学習 (federated machine learning) について講演した。彼女は、連合 ML アーキテクチャとユースケースを取り上げ、連合 ML の長所と短所について説明し、連合 ML が特定の問題の優れたソリューションであるかどうかを判断するためのヒントを示した。
-
Facebook、ディープラーニングモデルの初期化を高速にするGHN-2 AIをオープンソースとして公開
Facebook AI Research(FAIR)とゲルフ大学(University of Guelph)の共同チームは、ディープラーニング・ニューラルネットワークの初期パラメータを予測するGraph HyperNetworks(GHN-2)メタモデルの強化版をオープンソースとして公開した。GHN-2は単一CPU上で1秒未満で動作し、CIFAR-10データセット上において、追加的なトレーニングを必要とせず、最高77パーセントのtop-1精度でコンピュータビジョン(CV)ネットワークの値を予測することができる。
-
MicrosoftはNDm A100 v4シリーズのバーチャルマシンの一般提供を発表
先ごろ、Microsoft は、Azure の最新のバーチャルマシン (VM) シリーズ NDm A100 v4 シリーズの一般提供 (GA) を発表した。これは、NVIDIA A100 Tensor Core 80 GB GPU を搭載している。このハイパフォーマンスコンピューティング (HPC) VM は、さまざまな実際の HPC ワークロードに高性能、スケーラビリティ、およびコスト効率を提供するよう設計されている。
-
D2iQがDKP 2.0をリリース、Kubernetesアプリの大規模運用が可能に
D2iQは先頃、Kubernetesワークロードを大規模運用する企業を支援するプラットフォームとして、D2iQ Kubernetes Platform(DKP) バージョン2.0をリリースした。 新リリースでは、プライベートクラウド、パブリッククラウド、あるいはネットワークエッジを含む任意のインフラストラクチャを対象として、マルチクラスタ環境の管理とアプリケーションの実行を単一ウィンドウで行うことができる。
-
PyTorch 1.10がリリース - CUDA Graphs APIを追加、コンパイラを改善、Android NNAPIをサポート
Facebookが開発するオープンソースのディープラーニングフレームワークであるPyTorchが、バージョン1.10のリリースを発表した。CUDA Graphs APIのインテグレーション、JITコンパイラのアップデートによるCPUパフォーマンスの向上に加え、Android Networks API(NNAPI)のベータサポートが含まれている。ドメイン固有ライブラリであるTorchVisionとTorchAudioの新バージョンもリリースされた。