InfoQ ホームページ クラウドコンピューティング に関するすべてのコンテンツ
-
AWSがStrands Labsを発表、実験的AIエージェントプロジェクト向け
Amazon Web ServicesはStrands Labs、エージェントベースAI開発に関連する実験的プロジェクトをホストするために作られた新GitHub組織を発表した。本取り組みはStrands Agents SDK、開発者がPythonまたはTypeScriptを使用してAIエージェントを構築できるオープンソースツールキットにリンクしている。
-
AWSが動画エンコーディングサービスに対する特許侵害保護を撤廃
AWSが動画トランスコーディングおよびストリーミングサービスを利用する顧客に対する法的保護を廃止、顧客がコーデック権利保有者から特許侵害で訴えられる可能性が発生している。この変更はファイルベースの動画処理サービス MediaConvertやライブ動画エンコーディングサービス MediaLiveを含む6つのサービスに影響する。
-
AWS、VPCで通信の暗号化を強制する新制御機能を導入
クラウド事業者であるAWS社によると、新機能は、AWS環境全体に一貫した暗号化基準を適用することを組織に促し、包括的な暗号化を求めるHIPAA、PCI DSS、FedRAMPといった規制フレームワークへの準拠を示す上で役立つという。
-
DuckDB社のWebAssemblyクライアント、ブラウザ上でIcebergデータセットへのクエリが可能に
DuckDB社はこのほど、ブラウザのタブ内で直接Iceberg RESTカタログとのエンドツーエンドのインタラクションを実現する新機能を発表した。インフラのセットアップは一切不要である。この新機能はDuckDB-Wasmを活用したものであり、DuckDB-Wasmはブラウザ上で動作するDuckDBのWebAssemblyポートである。これにより、ユーザーはサーバーレス方式でIcebergテーブルへのクエリ、読み取り、および書き込みが可能になった。
-
AWS、S3 Tables向けにインテリジェントティアリングとレプリケーションを追加
データは30日間アクセスがない場合にInfrequent Accessへ移行し、90日後にはArchive Instant Accessへ移行します。アプリケーションの変更を必要とせず、性能への影響もありません。
-
Google Cloudは、130,000ノードのGKEクラスターを用いてKubernetesの大規模スケールを実証
Google Kubernetes Engine(GKE)のチームは、130,000ノードのKubernetesクラスターを成功裏に構築・運用したことを明らかにした。これにより、現在までに公表された中で最大のKubernetesクラスターとなった。このマイルストーンは、クラウドネイティブインフラストラクチャがどれほど進化したか、またAIやデータの時代における大規模で計算集約的なワークロードに対する準備が整っていることを示している。
-
オープンソースのAgent Sandbox、Kubernetes上でAIエージェントの安全な展開を可能に
Agent Sandboxは、安定したアイデンティティと永続ストレージを備えた単一のステートフルPodを管理するための宣言的APIを提供する、オープンソースのKubernetesコントローラーである。信頼できないLLM生成コードを実行するための隔離環境の構築に特に適しており、他のステートフルワークロードの実行にも向いている。
-
AWS、第五世代GravitonプロセッサとM9gインスタンスを発表
AWS社は最近、新しいGraviton5プロセッサと、それを搭載した最初のEC2インスタンスである汎用M9gインスタンスのプレビューを発表した。クラウドプロバイダーによると、この最新チップはGraviton4と比べて最大25%高い性能を提供し、Nitro Isolation Engineを導入し、より大きなL3キャッシュを備えることで、レイテンシ、メモリ帯域幅、ネットワークスループットを改善するという。
-
AWS Transform Customが技術的負債に挑む
AWS社は最近、AWS Transformの一部であるAWS Transform Customを発表した。この機能は、開発者がカスタムコードをモダナイズし、リファクタリング可能にする。
-
OpenAIがHarness Engineeringを発表:Codexエージェントが大規模ソフトウェア開発を牽引
OpenAI社はソフトウェア開発ライフサイクルの主要部分をAIエージェントで推進する新しい社内エンジニアリング手法Harness engineeringを詳細に説明した。この仕組みはCodexというAIエージェント群を用い、エンジニアが定義した宣言的プロンプトに基づいてコード記述、テスト生成、オブザーバビリティ管理などのタスクを実行する。Harnessはワークフローを標準化し、手作りスクリプトや個別ツールへの依存を減��す。
-
AI駆動サイバー脅威と戦うには多層防御がキー、CNCFレポートが明らかに
Cloud Native Computing Foundationがan analysis of modern cybersecurity practicesを出版、人工知能を使用した攻撃が現在、重大な脅威になっていることを明らかにした。このレポートは人工知能が脅威の状況と、企業が利用できる防御手段の両方を変革する中で、組織が多層防御戦略を採用することの重要性を強調している。
-
NVIDIA社のDynamoが、マルチノードLLM推論の課題に対応
大規模な言語モデル(LLM)をスケールで提供することは複雑である。現代のLLMは、単一のGPUや単一のマルチGPUノードのメモリおよび計算能力を超えている。そのため、70B以上や120B以上のパラメータモデル、または大きなコンテキストウィンドウを持つパイプラインの推論ワークロードは、マルチノードの分散GPU展開を必要とする。
-
Amazon S3 VectorsがGAに、「Storage-First」アーキテクチャをRAGに導入
AWSは最近、ベクトルデータの保存およびクエリをネイティブサポートするクラウドオブジェクトストレージサービス、S3 Vectorsの一般提供を発表した。GAリリースにより、同社はインデックスあたりの容量を40倍に拡張、20億ベクトルまで対応するとともに、100ms未満のクエリレイテンシを実現した。
-
Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開
Meta社は、同社プラットフォーム全体で広告推薦を改善するために設計された基盤モデルGenerative Ads Model(GEM)の詳細を公開した。GEMは、クリックやコンバージョンといった有意なシグナルが極めて疎な、1日あたり数十億件規模のユーザーと広告の相互作用を処理することで、推薦システムにおける中核的課題に対処するモデルである。GEMは、広告主の目標、クリエイティブ形式、計測シグナル、複数の配信チャネルにまたがるユーザー行動など、多様な広告データから学習する複雑性に対応する。
-
APIプラットフォーム「Unkey」、パフォーマンス問題を受けサーバーレスを廃止
開発者向けプラットフォームを提供するUnkey社は、API認証サービスを全面的に再構築したことを明らかにした。同社は、サーバーレスアーキテクチャであるCloudflare Workersから、状態を保持するGoサーバーへ移行した。この決定は、サーバーレスアーキテクチャの制約を再評価した結果によるものであるという。同社によれば、この移行によりパフォーマンスが6倍向上し、エンジニアリング作業の大部分を占めていたワークアラウンドが不要になったと述べている。