AMDがディープラーニングアクセラレーターInstinct MI200シリーズGPUを発表

原文(投稿日：2021/12/03)へのリンク

AMDは最近のAccelerated Data Center Premiere Keynoteで、MI200アクセラレータシリーズのInstinct MI250xと、それよりもわずかにローエンドのInstinct MI250 GPUを発表した。

現在まで、それらはAMDの最高性能のサーバーアクセラレータであり、以前のInstinct MI100を上回り、Nvidiaの最新のAmpereシリーズGPU（A100など）と競合するものである。CDNA-2アーキテクチャとTSMCの6nm FinFETリソグラフィで設計されたハイエンドMI250Xは、47.9 TFLOPsのピーク倍精度（FP64）パフォーマンスと128GBのHBM2eメモリを提供する。モデルのシャーディングを最小限に抑えることで、より大規模なディープネットワークのトレーニングを実現する。仕様の技術的な詳細は、公式ページにも記載されている。

図1：AMD ROCm 5.0ディープラーニングとHPCスタックコンポーネント。詳細については、ROCmラーニングセンターをご覧ください。

AMDは、オープンソースの並列化ライブラリをサポートしていることで知られている。低レベルでは、AMD ROCm（別名Radeon Open Compute）4.5リリースにより、CUDA互換プログラミング用のOpenCL、OpenMP、HIP（別名、移植可能なヘテロジニアスコンピューティングインターフェイス）を介した並列化が実現された。5.0リリース（図-1）では、AMDは新しいMI200シリーズGPUのROCmサポートを拡大し、さらに最適化する計画だ。高レベルでは、AMDはプラットフォームでONNX、PyTorch、TensorFlow、MXNet、CuPyをサポートし、機械学習コードを移植できる。新しいMI200シリーズによって提供される浮動小数点処理速度を考えると、コントリビュータが残りのAPIをこれらのライブラリに移植するために急いでいると予想される。

AMDはマイクロサービスのサポートを大幅に改善した。これはアクセラレータ用にパフォーマンスが調整されたコンテナーを提供するInfinity Hubを確立することによるものだ。公式のPyTorchとTensorFlowのコンテナイメージに加えて、Infinity Hubには、AMDハードウェアでの高性能コンピューティングと並列処理が必要となるアプリケーションのためのツールが含まれている。

ビジュアルコンピューティングアプリケーションに対しては、AMDは、GPUOpenグラフィックエコシステム内に個別にMIVisionXプロジェクトを保持する。OpenCVのようなプラットフォームに最適化されたエンコード、デコード、および処理モジュールもある。同社はまた、一般的な行列乗算と線形代数APIを備えた機械学習プリミティブライブラリMIOpenを提供する。OpenCLとHIPコンパイラを使った低レベルの開発に使用できる。

MI200 GPUは、2022年までにクラウドプラットフォームで利用される予定である。詳細については、AMD CDNA-2アーキテクチャのホワイトペーパーを参照してください。

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

もう一つのRust書き換え：OpenAIのCodex CLIをネイティブ化、NodeとTypeScriptをRustで再構築

マイクロソフトCTO、Rust Nation UKでRustの成功と課題、Rustへのコミットメントについて語る

Meta社、Rustで構築された高性能なPython型チェッカー「PyreFly」をオープンソース化

Instagram、新ランキングフレームワークで通知疲れを軽減し、エンゲージメントを向上

Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成

Mezzalira氏のQCon London講演：「マイクロフロントエンド～設計から企業メリットと社内実装まで～」

ソフトウェアエンジニアがスタッフプラスの役割に成長する方法

スペースシャトルとOrion MPCVのソフトウェアをNASAがどのようにテストしているか

デザイナーのサポート(置換えではない)にFigmaはどうAIを使うのか

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

Transformers v5、よりモジュール化され相互運用性の高いコアを導入

OpenAI、GPT-5.1モデルを発表。より高速で会話的に

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

Groupe SNCF、Talos OSとKubernetesでインフラを近代化

QCon London

QCon AI Boston

QCon San Francisco