NVIDIA NIM、Hugging Faceで推論サービスとして利用可能に

原文リンク(2024-08-11)

Hugging Faceは、NVIDIA NIMによる推論サービスの提供開始を発表した。今回の新サービスで、開発者は主要なAIモデルのNVIDIAによる高速化された推論に容易にアクセスできるようになる。

新サービスにより、開発者はNVIDIA DGX Cloud上で動作するNVIDIA NIMマイクロサービスにより最適化された、開発者によるLlama 3ファミリーやMistral AIモデルなどの主要な大規模言語モデルを迅速にデプロイできるようになる。これにより開発者は、Hugging Face Hub上でホストされているオープンソース型AIモデルを用いて迅速にプロトタイプを作成し、本番環境にデプロイできるようになるだろう。

Hugging Faceの推論サービスは、NIMマイクロサービスを活用したNVIDIA DGX Cloud上で提供され、AIデプロイに最適化されたコンピューティングリソースへの容易なアクセスを可能にする。

NVIDIA DGX Cloudプラットフォームは生成AI向けに構築されており、プロトタイプから本番利用まで、AI開発のあらゆる段階をサポートするスケーラブルなGPUリソースを提供する。

このサービスを利用するには、Enterprise Hub組織へのアクセス権限と、細粒度の認証トークンが必要になる。サポート対象の生成AIモデルのNVIDIA NIMエンドポイントは、Hugging Face Hubのモデルページに掲載されている。

現在、サービスのサポート対象はchat.completion.createとmodels.listAPIのみだが、Hugging Faceは多くのモデルを追加しながら、その拡張に取り組んでいる。

DGX CloudでのHugging Face 推論サービスの利用料金は、NVIDIA H100Tensor Core GPUを使う場合のリクエストあたりの計算時間に基づいて課金される。

Hugging FaceはNVIDIAと協力して、AI推論のパフォーマンスやアクセシビリティ向上に向けて、 NVIDIA TensorRT-LLMライブラリとHugging Faceのテキスト生成推論 (TGI)フレームワークの統合を進めている。

新たな推論サービスに加え、Hugging FaceではAIトレーニングサービス Train on DGX Cloudも提供する。

Hugging FaceのCEOClem Delangue氏は、自身のXアカウントに投稿している。

Hugging FaceがAIコンピューティングのゲートウェイになろうとしていることに、とてもワクワクしています！

Kaggle Master のRohan Paul氏は、Xで投稿をシェアしこう述べた。

なので、私たちはNVIDIA DGX Cloudのアクセラレーテッド・コンピューティング・プラットフォームでオープンモデルを推論サービスに利用できます。コードはOpenAI APIと完全な互換性があり、OpenAIのSDKを推論に利用することができます。

SIGGRAPHでNVIDIAは、AIの次の進化に向けて高精度な仮想世界を構築する開発者の能力を加速させるOpenUSDフレームワーク用の生成AIモデルとNIMマイクロサービスも紹介している。

作者について

Daniel Dominguez

もっと見るより少なく

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

作者について

Daniel Dominguez

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

AnthropicがClaude Code品質苦情の6週間を3つのプロダクト変更の重なりと特定

GitHub社、Free、Pro、およびPro+ユーザーからのCopilotインタラクションデータを、AIモデルのトレーニングに使用する方針

23年間潜伏していたリモート悪用可能なLinuxカーネル脆弱性の発見にClaude Codeが使われた

CloudflareがProject Thinkを発表：AIエージェント向け永続ランタイム

Dropbox社がGitHub社と協力し、モノレポのサイズを87GBから20GBに削減

Anthropicが3エージェント・ハーネスを設計、長時間稼働するフルスタックAI開発を支援

プラットフォームエンジニアリングのインパクトをドライブし、測定する

エージェンティックAIパターンがエンジニアリング規律を強化

人工知能によって顧客とのつながりはどう変わるか

GoogleがGemma4をApache 2.0ライセンスでリリース、マルチモーダルおよびエージェント機能搭載

AnthropicがClaude Platformを提供開始、AWS上で

TigerFSは開発者およびAIエージェント向けにPostgreSQLデータベースをファイルシステムとしてマウントする機能を提供

Argo CD 3.3、安全なGitOps削除と円滑な日常運用を実現

Teleport社、企業インフラ全体でAIエージェントを保護するAgentic Identity Frameworkを発表

Cloudflare社は、自社のエッジにアクティブなAPI脆弱性スキャンを追加

Online InfoQ AI Engineering Certification

Online InfoQ Architect Certification

Online InfoQ AI Security & Privacy Engineering Program

QCon San Francisco

QCon London 2027

NVIDIA NIM、Hugging Faceで推論サービスとして利用可能に

作者について

Daniel Dominguez

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。