InfoQ ホームページ Infrastructure に関するすべてのコンテンツ
-
OpenAIがFrontierを発表、企業全体でAI エージェントを構築・デプロイ・管理するプラットフォーム
OpenAI Frontierは、AIエージェントを構築、展開、管理するためのエンタープライズ向けプラットフォームであり、AIエージェントを信頼性高く、スケーラブルで、実際の企業システムや業務フローに統合できるよう設計されている。
-
NVIDIA社のDynamoが、マルチノードLLM推論の課題に対応
大規模な言語モデル(LLM)をスケールで提供することは複雑である。現代のLLMは、単一のGPUや単一のマルチGPUノードのメモリおよび計算能力を超えている。そのため、70B以上や120B以上のパラメータモデル、または大きなコンテキストウィンドウを持つパイプラインの推論ワークロードは、マルチノードの分散GPU展開を必要とする。
-
AWS、管理型エグレスセキュリティ簡素化へ 「Network Firewall proxy」をプレビュー公開
AWS社はこのほど、プロキシの管理と展開を担うマネージドサービス「AWS Network Firewall proxy」のプレビュー版を開始した。AWS社によると、このサービスは、顧客が自社のVPCからのアウトバウンドアクセスを統制するセキュリティポリシーに、より注力できるようにするものだ。
-
AWSが第5世代AMD EPYC(Turin)プロセッサ搭載M8a汎用EC2インスタンスを発表
AWSは最近、最大4.5GHzの5世代目AMD EPYC(コードネーム:Turin)プロセッサ、ゲーム、金融アプリケーション、機械学習の推論、動画エンコード、アプリケーションサーバー、シミュレーションモデリング、中規模データストア、アプリケーション開発環境、キャッシュフリートのような高性能と高スループットを必要とするアプリケーションに適している、を搭載したM8a汎用インスタンスの一般提供(GA)を発表した。
-
AWS ALBがネイティブURLとホストヘッダー書き換えをサポート
AWSは最近、Application Load Balancers(ALB)サービス内でネイティブURLおよびホストヘッダー書き換え機能の一般提供を発表した。この機能によりユーザーは、レイヤー7トラフィック変更を管理するためのカスタムアプリケーションロジックや、サードパーティ・プロキシソリューション(NGINX Ingress Controllerのような)を導入・維持する必要がなくなる。
-
AnthropicがClaudeパフォーマンス問題の背後にある3つのインフラストラクチャバグを公開
Anthropicは最近、Claudeモデルの出力品質が数週間にわたり断続的に低下していた原因について、3つの異なるインフラストラクチャのバグが関与していたことを明らかにするポストモーテムを公開した。同社はこれらの問題を解決し、同様の障害を防ぐために内部プロセスを変更していると述べているが、コミュニティは3つのハードウェアプラットフォームでサービス運用することの課題をハイライトしている。
-
Uber、CacheFrontの改善で毎秒1億5000万回の読み取りを達成
Uber社のエンジニアは、CacheFrontアーキテクチャを更新し、毎秒1億5000万回以上の読み取りを可能にしつつ、より強力な一貫性を確保した。この更新により、レイテンシーに敏感なサービスでの古いデータの読み取り問題に対応し、新しいライトスルー一貫性プロトコルの導入、Docstoreとの緊密な連携、そしてUber社のFluxストリーミングシステムの改善により、増大する需要に対応する。
-
AWSがマルチリージョン・フェイルオーバーをシンプル化、ARC Region Switchで
AWSはAmazon Application Recovery Controller(ARC) Region Switch、組織がRegion Switchをプラン、実践、オーケストレーションするためのフルマネージドで高可用性の機能を最近導入した。
-
新DNS Armorサービスがサイバー脅威を事前ブロック、Google Cloudワークロードを防御
Google CloudはDNS Armor、Infobloxとのパートナーシップにより開発された新しいクラウドネイティブ・セキュリティサービスを発表した。このサービスはGoogle Cloudのワークロードから発生するDNSベースの脅威を事前検出し、軽減することによる、セキュリティの基盤レイヤーを提供する。これはクリティカルな脆弱性に対処するものであり、Infoblox自身の調査によると、マルウェアの92%がコマンド&コントロール(C2)通信にDomain Name System(DNS)を利用していることが判明している。
-
Cloudflare、Quicksilverをマルチレベルキャッシュに移行し数十億のリクエストを処理
Cloudflare社のエンジニアリングチームは最近、内部のグローバルキーバリューストアであるQuicksilverを階層型キャッシュアーキテクチャに移行した方法を共有した。彼らは、すべてのデータをすべての場所に保存する従来の方法から、分散型キャッシュシステムを採用するまでの段階的な取り組みを説明し、ストレージ効率を向上させながら、一貫性の保証とエッジでの低遅延読み取りを維持することに成功した。
-
AWS CCAPI MCPサーバー: 自然言語インフラ
AWSはCloud Control API(CCAPI)MCP Server、自然言語を使って開発者やAI駆動エージェントがリソース管理できるようにすることにより、インフラ管理をシンプル化するために設計された新しいツールを最近発表した。このサーバーはawslabs/mcpプロジェクトの一部であり、会話型コマンドとAWSインフラのデプロイ・管理をつなぐブリッジとして機能する。
-
1日30万ドルのFigma宛てAWS請求書がクラウド依存リスクをハイライト
Figmaは最近、新規公開株式(IPO)申請書でクラウドコンピューティング費用を公開し、Amazon Web Services(AWS)に1日約30万ドルを費やしていることを明らかにした。その結果、同社は年間約1億ドルをAWSに割り当てており、これは報告された収益8億2100万ドルの約12%に相当する。
-
AWS、European Sovereign Cloudの独立した欧州ガバナンスと運用を発表
AWSは、AWS European Sovereign Cloudの独立した欧州ガバナンスの主要な構成要素を発表した。これには、新しいEU管理の親会社と専用のセキュリティオペレーションセンターが含ま���る。この戦略的な動きにより、AWSは2025年末までにドイツのブランデンブルク州に最初のリージョンを立ち上げることを目指している。これは、欧州政府と企業の厳格なデジタル主権要件を満たすためである。
-
AWS CloudFrontがHTTPS DNSサポートを追加
AWSは最近、Amazon CloudFrontがAmazon Route 53、Service Binding (SVCB) DNSレコード (RFC 9460) の特殊な形式でHTTPS DNSエイリアスレコードをサポートするようになったと発表した。
-
HashiCorp、AI統合に向けてTerraform MCP Serverをリリース
HashiCorpはTerraform MCP Server、大規模言語モデルがインフラストラクチャをコードとして扱う際の相互作用を改善するために設計されたModel Context Protocolのオープンソース実装をリリースした。リアルタイムTerraform Registryデータ-モジュールのメタデータ、プロバイダのスキーマ、リソースの定義など-を構造化された形式で公開することで、AIシステムは現在の検証済みの構成パターンに基づいて提案できるようになる。