InfoQ ホームページ クラウドコンピューティング に関するすべてのコンテンツ
-
NVIDIA社のDynamoが、マルチノードLLM推論の課題に対応
大規模な言語モデル(LLM)をスケールで提供することは複雑である。現代のLLMは、単一のGPUや単一のマルチGPUノードのメモリおよび計算能力を超えている。そのため、70B以上や120B以上のパラメータモデル、または大きなコンテキストウィンドウを持つパイプラインの推論ワークロードは、マルチノードの分散GPU展開を必要とする。
-
Amazon S3 VectorsがGAに、「Storage-First」アーキテクチャをRAGに導入
AWSは最近、ベクトルデータの保存およびクエリをネイティブサポートするクラウドオブジェクトストレージサービス、S3 Vectorsの一般提供を発表した。GAリリースにより、同社はインデックスあたりの容量を40倍に拡張、20億ベクトルまで対応するとともに、100ms未満のクエリレイテンシを実現した。
-
Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開
Meta社は、同社プラットフォーム全体で広告推薦を改善するために設計された基盤モデルGenerative Ads Model(GEM)の詳細を公開した。GEMは、クリックやコンバージョンといった有意なシグナルが極めて疎な、1日あたり数十億件規模のユーザーと広告の相互作用を処理することで、推薦システムにおける中核的課題に対処するモデルである。GEMは、広告主の目標、クリエイティブ形式、計測シグナル、複数の配信チャネルにまたがるユーザー行動など、多様な広告データから学習する複雑性に対応する。
-
APIプラットフォーム「Unkey」、パフォーマンス問題を受けサーバーレスを廃止
開発者向けプラットフォームを提供するUnkey社は、API認証サービスを全面的に再構築したことを明らかにした。同社は、サーバーレスアーキテクチャであるCloudflare Workersから、状態を保持するGoサーバーへ移行した。この決定は、サーバーレスアーキテクチャの制約を再評価した結果によるものであるという。同社によれば、この移行によりパフォーマンスが6倍向上し、エンジニアリング作業の大部分を占めていたワークアラウンドが不要になったと述べている。
-
AWS、管理型エグレスセキュリティ簡素化へ 「Network Firewall proxy」をプレビュー公開
AWS社はこのほど、プロキシの管理と展開を担うマネージドサービス「AWS Network Firewall proxy」のプレビュー版を開始した。AWS社によると、このサービスは、顧客が自社のVPCからのアウトバウンドアクセスを統制するセキュリティポリシーに、より注力できるようにするものだ。
-
AWS Lambda Managed Instances:サーバーレスの柔軟性とEC2のコストモデルが融合
AWS Lambda Managed Instancesは、AWS Lambda関数をAmazon Elastic Compute Cloud(Amazon EC2)インスタンス上で実行できる新機能だ。
-
GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入
開発ワークフローを効率化する取り組みとして、Grafana LabsのDaniel Fitzgerald氏が、GitLabのCI/CDイベントをサーバーレスアーキテクチャ経由でGrafanaのオブザーバビリティスタックに連携する新しいオープンソース・ソリューションを公開した。この統合によりプッシュ、マージリクエスト、パイプライン完了といったGitLabのWebhookイベントを、デプロイイベントとパフォーマンスメトリクスの関連をリアルタイムで可視化し、相関分析するためにGrafana Cloud Logs (Grafana Loki上に構築された)へ直接送信できるようになった。
-
Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張
Discord社は、単一GPUトレーニングの限界に直面した後、機械学習プラットフォームを再構築した方法を詳述した。RayとKubernetesを標準化し、ワンクリックでクラスターを作成できるCLIを導入し、DagsterとKubeRayを通じてワークフローを自動化することで、分散トレーニングを日常的な運用に変更できた。これらの変更により、大規模モデルの毎日の再トレーニングが可能となり、広告ランキングの主要指標で200%の向上を達成した。
-
Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善
Helmは、Kubernetesアプリケーションパッケージマネージャーとして公式にバージョン4.0.0に到達した。Helm 4は6年ぶりの大規模アップグレードであり、Cloud Native Computing Foundation(CNCF)の指導のもとでHelmの10周年を迎える節目でもある。このアップデートは、スケーラビリティ、セキュリティ、開発者のワークフローに関するいくつかの課題に対応することを目的としている。
-
AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化
AWSはAmazon ECS Express Modeをリリースし、コンテナ化されたウェブアプリケーションやAPIの展開プロセスを簡素化した。Express Modeでは、IAMロールやロードバランサー、スケーリングなどの付随的な要件に関する詳細を省略し、プロダクション対応のサービスを一度で展開できる。
-
QCon AI New York 2025:「AIは機能するが、プルリクエストは機能しない:AIがソフトウェア開発ライフサイクル(SDLC)を破壊する理由とその対策」
CircleCI社の主任エンジニアであるMichael Webster氏は、2025年に初めて開催された「QCon AI New York 2025において、「AI Works, Pull Requests Don’t: How AI Is Breaking the SDLC and What to Do about it(AIは機能するが、プルリクエストは機能しない:AIがSDLCを破壊している現状とその対策)」と題した講演を行った。
-
Cloudflare、データプラットフォームをエグレス料金ゼロで導入
Cloudflareは最近、Cloudflare Data Platformのオープンベータ版を発表した。これは、Apache Icebergなどのオープンスタンダードを使用して、分析データテーブルを取り込み、保存し、クエリを実行するためのマネージドソリューションである。
-
Groupe SNCF、Talos OSとKubernetesでインフラを近代化
大手鉄道運営会社であるGroupe SNCFは、従来のVMベースのKubernetesデプロイメントから、Talos OSとOpenStackを基盤としたクラウドネイティブプラットフォームに移行し、複雑な組織変革を乗り越えながら、重要な運用上の課題に対処することに成功した。TalosCon 2025での講演後、InfoQはこの移行について、シニアスタ���フエンジニアのThomas Comtet氏にインタビューした。
-
Claude Sonnet 4.5は、オープンソースの監査ツールPetriによって最も安全なLLM(大規模言語モデル)として評価された。
Claude Sonnet 4.5は、Anthropic社の新しいオープンソースAI監査ツールであるPetri(Parallel Exploration Tool For Risky Interactions)による初期評価において、「リスキーなタスク」において最も優れたパフォーマンスを示したモデルとして浮上した。
-
Kubernetes 1.34リリース、KYAML、トラフィックルーティングコントロール、観測性向上
Cloud Native Computing Foundation (CNCF)は先月、「Of Wind & Will」(O’ WaW)と名付けたKubernetes 1.34をリリースした。kubeletやAPIサーバーにおける分散リソース割り当てやプロダクショングレードのトレーシングなどの機能を導入している。