InfoQ ホームページクラウドコンピューティングに関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

DevOps

NVIDIA社のDynamoが、マルチノードLLM推論の課題に対応

大規模な言語モデル（LLM）をスケールで提供することは複雑である。現代のLLMは、単一のGPUや単一のマルチGPUノードのメモリおよび計算能力を超えている。そのため、70B以上や120B以上のパラメータモデル、または大きなコンテキストウィンドウを持つパイプラインの推論ワークロードは、マルチノードの分散GPU展開を必要とする。

Claudio Masolo 翻訳者 Takashi Kawase
投稿日 2026年3月10日午前4時30分
Cloud

Amazon S3 VectorsがGAに、「Storage-First」アーキテクチャをRAGに導入

AWSは最近、ベクトルデータの保存およびクエリをネイティブサポートするクラウドオブジェクトストレージサービス、S3 Vectorsの一般提供を発表した。GAリリースにより、同社はインデックスあたりの容量を40倍に拡張、20億ベクトルまで対応するとともに、100ms未満のクエリレイテンシを実現した。

Steef-Jan Wiggers 翻訳者 Hiroaki.Sugimura
投稿日 2026年3月9日午前3時30分
AIと機械学習、データエンジニアリング

Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開

Meta社は、同社プラットフォーム全体で広告推薦を改善するために設計された基盤モデルGenerative Ads Model（GEM）の詳細を公開した。GEMは、クリックやコンバージョンといった有意なシグナルが極めて疎な、1日あたり数十億件規模のユーザーと広告の相互作用を処理することで、推薦システムにおける中核的課題に対処するモデルである。GEMは、広告主の目標、クリエイティブ形式、計測シグナル、複数の配信チャネルにまたがるユーザー行動など、多様な広告データから学習する複雑性に対応する。

Vinod Goje 翻訳者 Takashi Kawase
投稿日 2026年3月5日午前8時30分
DevOps

APIプラットフォーム「Unkey」、パフォーマンス問題を受けサーバーレスを廃止

開発者向けプラットフォームを提供するUnkey社は、API認証サービスを全面的に再構築したことを明らかにした。同社は、サーバーレスアーキテクチャであるCloudflare Workersから、状態を保持するGoサーバーへ移行した。この決定は、サーバーレスアーキテクチャの制約を再評価した結果によるものであるという。同社によれば、この移行によりパフォーマンスが6倍向上し、エンジニアリング作業の大部分を占めていたワークアラウンドが不要になったと述べている。

Matt Saunders 翻訳者 Takashi Kawase
投稿日 2026年3月5日午前12時30分
Cloud

AWS、管理型エグレスセキュリティ簡素化へ　「Network Firewall proxy」をプレビュー公開

AWS社はこのほど、プロキシの管理と展開を担うマネージドサービス「AWS Network Firewall proxy」のプレビュー版を開始した。AWS社によると、このサービスは、顧客が自社のVPCからのアウトバウンドアクセスを統制するセキュリティポリシーに、より注力できるようにするものだ。

Steef-Jan Wiggers 翻訳者 Takashi Kawase
投稿日 2026年3月2日午前3時30分
Cloud

AWS Lambda Managed Instances：サーバーレスの柔軟性とEC2のコストモデルが融合

AWS Lambda Managed Instancesは、AWS Lambda関数をAmazon Elastic Compute Cloud（Amazon EC2）インスタンス上で実行できる新機能だ。

Steef-Jan Wiggers 翻訳者 Takashi Kawase
投稿日 2026年2月26日午前2時30分
DevOps

GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入

開発ワークフローを効率化する取り組みとして、Grafana LabsのDaniel Fitzgerald氏が、GitLabのCI/CDイベントをサーバーレスアーキテクチャ経由でGrafanaのオブザーバビリティスタックに連携する新しいオープンソース・ソリューションを公開した。この統合によりプッシュ、マージリクエスト、パイプライン完了といったGitLabのWebhookイベントを、デプロイイベントとパフォーマンスメトリクスの関連をリアルタイムで可視化し、相関分析するためにGrafana Cloud Logs (Grafana Loki上に構築された)へ直接送信できるようになった。

Craig Risi 翻訳者 Hiroaki.Sugimura
投稿日 2026年2月19日午前6時30分
AIと機械学習、データエンジニアリング

Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張

Discord社は、単一GPUトレーニングの限界に直面した後、機械学習プラットフォームを再構築した方法を詳述した。RayとKubernetesを標準化し、ワンクリックでクラスターを作成できるCLIを導入し、DagsterとKubeRayを通じてワークフローを自動化することで、分散トレーニングを日常的な運用に変更できた。これらの変更により、大規模モデルの毎日の再トレーニングが可能となり、広告ランキングの主要指標で200%の向上を達成した。

Matt Foster 翻訳者 Takashi Kawase
投稿日 2026年2月10日午前12時30分
DevOps

Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善

Helmは、Kubernetesアプリケーションパッケージマネージャーとして公式にバージョン4.0.0に到達した。Helm 4は6年ぶりの大規模アップグレードであり、Cloud Native Computing Foundation（CNCF）の指導のもとでHelmの10周年を迎える節目でもある。このアップデートは、スケーラビリティ、セキュリティ、開発者のワークフローに関するいくつかの課題に対応することを目的としている。

Matt Saunders 翻訳者 Takashi Kawase
投稿日 2026年1月30日午前1時30分
DevOps

AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化

AWSはAmazon ECS Express Modeをリリースし、コンテナ化されたウェブアプリケーションやAPIの展開プロセスを簡素化した。Express Modeでは、IAMロールやロードバランサー、スケーリングなどの付随的な要件に関する詳細を省略し、プロダクション対応のサービスを一度で展開できる。

Matt Saunders 翻訳者 Naoko Koshimura
投稿日 2026年1月29日午前10時30分
Java

QCon AI New York 2025：「AIは機能するが、プルリクエストは機能しない：AIがソフトウェア開発ライフサイクル（SDLC）を破壊する理由とその対策」

CircleCI社の主任エンジニアであるMichael Webster氏は、2025年に初めて開催された「QCon AI New York 2025において、「AI Works, Pull Requests Don’t: How AI Is Breaking the SDLC and What to Do about it（AIは機能するが、プルリクエストは機能しない：AIがSDLCを破壊している現状とその対策）」と題した講演を行った。

Michael Redlich 翻訳者 Mitsuru Takatsuki
投稿日 2026年1月28日午前12時30分
Cloud

Cloudflare、データプラットフォームをエグレス料金ゼロで導入

Cloudflareは最近、Cloudflare Data Platformのオープンベータ版を発表した。これは、Apache Icebergなどのオープンスタンダードを使用して、分析データテーブルを取り込み、保存し、クエリを実行するためのマネージドソリューションである。

Renato Losio 翻訳者 Naoko Koshimura
投稿日 2026年1月15日午前7時30分
DevOps

Groupe SNCF、Talos OSとKubernetesでインフラを近代化

大手鉄道運営会社であるGroupe SNCFは、従来のVMベースのKubernetesデプロイメントから、Talos OSとOpenStackを基盤としたクラウドネイティブプラットフォームに移行し、複雑な組織変革を乗り越えながら、重要な運用上の課題に対処することに成功した。TalosCon 2025での講演後、InfoQはこの移行について、シニアスタ��フエンジニアのThomas Comtet氏にインタビューした。

Claudio Masolo 翻訳者 Takashi Kawase
投稿日 2026年1月15日午前4時30分
AIと機械学習、データエンジニアリング

Claude Sonnet 4.5は、オープンソースの監査ツールPetriによって最も安全なLLM（大規模言語モデル）として評価された。

Claude Sonnet 4.5は、Anthropic社の新しいオープンソースAI監査ツールであるPetri（Parallel Exploration Tool For Risky Interactions）による初期評価において、「リスキーなタスク」において最も優れたパフォーマンスを示したモデルとして浮上した。

Matt Foster 翻訳者 Mitsuru Takatsuki
投稿日 2026年1月15日午前3時30分
DevOps

Kubernetes 1.34リリース、KYAML、トラフィックルーティングコントロール、観測性向上

Cloud Native Computing Foundation (CNCF)は先月、「Of Wind & Will」（O’ WaW）と名付けたKubernetes 1.34をリリースした。kubeletやAPIサーバーにおける分散リソース割り当てやプロダクショングレードのトレーシングなどの機能を導入している。

Mostafa Radwan 翻訳者 Hiroaki.Sugimura
投稿日 2026年1月15日午前2時30分