InfoQ ホームページ クラウドコンピューティング に関するすべてのコンテンツ
-
オープンソースのAgent Sandbox、Kubernetes上でAIエージェントの安全な展開を可能に
Agent Sandboxは、安定したアイデンティティと永続ストレージを備えた単一のステートフルPodを管理するための宣言的APIを提供する、オープンソースのKubernetesコントローラーである。信頼できないLLM生成コードを実行するための隔離環境の構築に特に適しており、他のステートフルワークロードの実行にも向いている。
-
AWS、第五世代GravitonプロセッサとM9gインスタンスを発表
AWS社は最近、新しいGraviton5プロセッサと、それを搭載した最初のEC2インスタンスである汎用M9gインスタンスのプレビューを発表した。クラウドプロバイダーによると、この最新チップはGraviton4と比べて最大25%高い性能を提供し、Nitro Isolation Engineを導入し、より大きなL3キャッシュを備えることで、レイテンシ、メモリ帯域幅、ネットワークスループットを改善するという。
-
AWS Transform Customが技術的負債に挑む
AWS社は最近、AWS Transformの一部であるAWS Transform Customを発表した。この機能は、開発者がカスタムコードをモダナイズし、リファクタリング可能にする。
-
OpenAIがHarness Engineeringを発表:Codexエージェントが大規模ソフトウェア開発を牽引
OpenAI社はソフトウェア開発ライフサイクルの主要部分をAIエージェントで推進する新しい社内エンジニアリング手法Harness engineeringを詳細に説明した。この仕組みはCodexというAIエージェント群を用い、エンジニアが定義した宣言的プロンプトに基づいてコード記述、テスト生成、オブザーバビリティ管理などのタスクを実行する。Harnessはワークフローを標準化し、手作りスクリプトや個別ツールへの依存を減らす。
-
AI駆動サイバー脅威と戦うには多層防御がキー、CNCFレポートが明らかに
Cloud Native Computing Foundationがan analysis of modern cybersecurity practicesを出版、人工知能を使用した攻撃が現在、重大な脅威になっていることを明らかにした。このレポートは人工知能が脅威の状況と、企業が利用できる防御手段の両方を変革する中で、組織が多層防御戦略を採用することの重要性を強調している。
-
NVIDIA社のDynamoが、マルチノードLLM推論の課題に対応
大規模な言語モデル(LLM)をスケールで提供することは複雑である。現代のLLMは、単一のGPUや単一のマルチGPUノードのメモリおよび計算能力を超えている。そのため、70B以上や120B以上のパラメータモデル、または大きなコンテキストウィンドウを持つパイプラインの推論ワークロードは、マルチノードの分散GPU展開を必要とする。
-
Amazon S3 VectorsがGAに、「Storage-First」アーキテクチャをRAGに導入
AWSは最近、ベクトルデータの保存およびクエリをネイティブサポートするクラウドオブジェクトストレージサービス、S3 Vectorsの一般提供を発表した。GAリリースにより、同社はインデックスあたりの容量を40倍に拡張、20億ベクトルまで対応するとともに、100ms未満のクエリレイテンシを実現した。
-
Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開
Meta社は、同社プラットフォーム全体で広告推薦を改善するために設計された基盤モデルGenerative Ads Model(GEM)の詳細を公開した。GEMは、クリックやコンバージョンといった有意なシグナルが極めて疎な、1日あたり数十億件規模のユーザーと広告の相互作用を処理することで、推薦システムにおける中核的課題に対処するモデルである。GEMは、広告主の目標、クリエイティブ形式、計測シグナル、複数の配信チャネルにまたがるユーザー行動など、多様な広告データから学習する複雑性に対応する。
-
APIプラットフォーム「Unkey」、パフォーマンス問題を受けサーバーレスを廃止
開発者向けプラットフォームを提供するUnkey社は、API認証サービスを全面的に再構築したことを明らかにした。同社は、サーバーレスアーキテクチャであるCloudflare Workersから、状態を保持するGoサーバーへ移行した。この決定は、サーバーレスアーキテクチャの制約を再評価した結果によるものであるという。同社によれば、この移行によりパフォーマンスが6倍向上し、エンジニアリング作業の大部分を占めていたワークアラウンドが不要になったと述べている。
-
AWS、管理型エグレスセキュリティ簡素化へ 「Network Firewall proxy」をプレビュー公開
AWS社はこのほど、プロキシの管理と展開を担うマネージドサービス「AWS Network Firewall proxy」のプレビュー版を開始した。AWS社によると、このサービスは、顧客が自社のVPCからのアウトバウンドアクセスを統制するセキュリティポリシーに、より注力できるようにするものだ。
-
AWS Lambda Managed Instances:サーバーレスの柔軟性とEC2のコストモデルが融合
AWS Lambda Managed Instancesは、AWS Lambda関数をAmazon Elastic Compute Cloud(Amazon EC2)インスタンス上で実行できる新機能だ。
-
GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入
開発ワークフローを効率化する取り組みとして、Grafana LabsのDaniel Fitzgerald氏が、GitLabのCI/CDイベントをサーバーレスアーキテクチャ経由でGrafanaのオブザーバビリティスタックに連携する新しいオープンソース・ソリューションを公開した。この統合によりプッシュ、マージリクエスト、パイプライン完了といったGitLabのWebhookイベントを、デプロイイベントとパフォーマンスメトリクスの関連をリアルタイムで可視化し、相関分析するためにGrafana Cloud Logs (Grafana Loki上に構築された)へ直接送信できるようになった。
-
Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張
Discord社は、単一GPUトレーニングの限界に直面した後、機械学習プラットフォームを再構築した方法を詳述した。RayとKubernetesを標準化し、ワンクリックでクラスターを作成できるCLIを導入し、DagsterとKubeRayを通じてワークフローを自動化することで、分散トレーニングを日常的な運用に変更できた。これらの変更により、大規模モデルの毎日の再トレーニングが可能と���り、広告ランキングの主要指標で200%の向上を達成した。
-
Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善
Helmは、Kubernetesアプリケーションパッケージマネージャーとして公式にバージョン4.0.0に到達した。Helm 4は6年ぶりの大規模アップグレードであり、Cloud Native Computing Foundation(CNCF)の指導のもとでHelmの10周年を迎える節目でもある。このアップデートは、スケーラビリティ、セキュリティ、開発者のワークフローに関するいくつかの課題に対応することを目的としている。
-
AWS、ECS Express Modeを発表。コンテナ化アプリケーションの展開を簡素化
AWSはAmazon ECS Express Modeをリリースし、コンテナ化されたウェブアプリケーションやAPIの展開プロセスを簡素化した。Express Modeでは、IAMロールやロードバランサー、スケーリングなどの付随的な要件に関する詳細を省略し、プロダクション対応のサービスを一度で展開できる。