InfoQ ホームページ ai-architecture に関するすべてのコンテンツ
ニュース
RSSフィード-
「セキュリティの悪夢」:DockerがMCPツールチェーンのリスクを警告
Dockerの新しいブログ投稿は、Model Context Protocol (MCP)を基に構築されたAI駆動開発者ツールが重大なセキュリティ脆弱性―認証情報の漏洩、無許可ファイルアクセス、リモートコード実行の実例を含む―をもたらしていると警告している。
-
HashiCorp、AI統合に向けてTerraform MCP Serverをリリース
HashiCorpはTerraform MCP Server、大規模言語モデルがインフラストラクチャをコードとして扱う際の相互作用を改善するために設計されたModel Context Protocolのオープンソース実装をリリースした。リアルタイムTerraform Registryデータ-モジュールのメタデータ、プロバイダのスキーマ、リソースの定義など-を構造化された形式で公開することで、AIシステムは現在の検証済みの構成パターンに基づいて提案できるようになる。
-
AWSがECS・EKS・サーバーレス向けのオープンソースMCPサーバーを発表
AWS社は、Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS)、およびAWS Serverless向けのオープンソースModel Context Protocol (MCP)サーバーセットをGitHub上で公開した。これらのサーバーは、Amazon Q DeveloperのようなAI開発アシスタントの能力を強化し、これらのAWSサービスに特化したリアルタイムのコンテキスト情報を提供するものだ。
-
OpenAI、Stargateプロジェクトで世界のパートナー国にAIインフラを構築へ
OpenAIは、Stargateプロジェクトの一環として「OpenAI for Countries」という新たなイニシアチブを発表した。この取り組みは、民主主義の原則に基づいた各国でのAIインフラ構築を目指している。この拡大計画は、同社が米国でのAIインフラに5000億ドルを投資する初期計画に続くものだ。
-
DeepSeek社、数学定理証明向けLLM「Prover-V2」をオープンソースで公開
DeepSeek社は、Lean 4における数学定理証明に特化した新しいオープンソースの大規模言語モデルDeepSeek-Prover-V2を公開した。このモデルは、同社の基盤モデルであるDeepSeek-V3を活用した再帰的定理証明パイプラインを基盤として構築されている。Lean 4は、Microsoft Researchが開発した最新バージョンのLean定理証明ツールであり、機械による検証が可能な形式的証明を数学者やコンピュータ科学者が記述できる対話型証明支援システムである。
-
AWSはWell-Architected Generative AI Lensにおいて責任あるAIを推進
AWSは、生成AIワークロード設計と運用のベストプラクティス提供にフォーカスした、新しいWell-Architected Generative AI Lensの提供を発表した。このLensは、生成AIを使って堅牢かつコスト効率の高いソリューションを提供する責任を持つビジネスリーダー、データサイエンティスト、アーキテクト、エンジニアを対象としている。このドキュメントはクラウドに依存しないベストプラクティス、実装ガイダンス、その他のリソースへのリンクを提供している。
-
OpenAIが Microsoft Azure OpenAI Service上に新しいo3-miniモデルを提供
OpenAIは、o3-miniモデルをローンチし、現在Microsoft Azure OpenAI Serviceからアクセス可能となっている。同社によると、このモデルはAI技術の進歩を象徴しており、昨年9月にリリースされたo1-miniと比較してコスト効率が改善され、推論能力が向上している。
-
Amazon Bedrockがオープンソースフレームワーク統合を取り入れたマルチエージェントシステム(MAS)を導入
Amazon Web Servicesは、Amazon Bedrock向けにマルチエージェントコラボレーション機能をリリースし、複数のAIエージェントが複雑なタスクで協力するためのフレームワークを導入した。このシステムは専門化されたエージェントがスーパーバイザーエージェントの調整の下で協力して作業することを可能にし、分散AIシステムにおけるエージェントオーケストレーションに関する開発者の課題に対処するものである。
-
Azure AI Agent Service パブリックプレビュー: 定型業務の自動化
先日開催されたIgniteカンファレンスでMicrosoftはAzure AI Agent Serviceのパブリックプレビューを発表した。このフルマネージドサービスは、開発者が基盤となるコンピューティングリソースやストレージリソースを管理することなく、高品質で拡張可能なAIエージェントをセキュアに構築、デプロイ、スケーリングできるようにする。
-
マイクロソフトが汎用マルチエージェントシステム Magentic-Oneを発表
マイクロソフトはMagentic-One、Webやファイルベースの環境を含むオープンエンドのタスクを処理するように設計された新汎用マルチエージェントシステムのリリースを発表した。このシステムはソフトウェア開発、データ分析、ウェブナビゲーションなど様々な領域にわたる複雑な多段階タスクを支援し、活動の効率性を向上させることを目的としている。
-
Rhymes AIがAriaを発表:開発リソースを備えたオープンソースのマルチモーダルモデル
Rhymes AIは、テキスト、画像、ビデオ、コードを効果的に処理できるオープンソースのマルチモーダルネイティブMoE(Mixture-of-Experts)モデル、Ariaを発表した。ベンチマークテストにおいて、Ariaは他のオープンモデルを凌駕し、GPT-4oやGemini-1.5などの独自モデルに対しても競争力のある性能を示した。さらに、Rhymes AIは、微調整や開発のためのモデルの重み付けやガイダンスを含むコードベースを公開している。
-
RAG(Retrieval-Augmented Generation)を活用したCopilotが、Uberに13,000時間のエンジニアリング時間を節約
Uberは最近、オンコールサポートエンジニアの効率を改善するために設計されたAIを搭載したオンコールコパイロット、Genieを構築した方法を詳述した。GenieはRetrieval-Augmented Generation(RAG)を活用して正確なリアルタイム応答を提供し、インシデント対応のスピードと効果を大幅に向上させる。
-
LLMを精製し、そのパフォーマンスを超える:spaCyの創設者がInfoQ DevSummit Munichで語る
InfoQ Dev Summit Munichの第1回目のプレゼンテーションにおいて、Ines Montani氏は、今年の初めにQCon Londonで行ったプレゼンテーションに加え、実際のアプリケーションで最新の最先端モデルを使用し、その知識をより小型で高速なコンポーネントに抽出し、社内で実行・維持できるようにするための実践的なソリューションを聴衆に提供した。
-
PayPal社、Cosmos.AI MLOpsプラットフォームにLLMを利用した生成AIサポートを追加
PayPal社はMLOpsプラットフォームCosmos.AIを拡張し、大規模言語モデル(LLM)を使用したジェネレーティブAIアプリケーションの開発をサポートする。同社は、ベンダー、オープンソース、自己調整LLMへのサポートを取り入れ、検索拡張生成(RAG)、セマンティックキャッシュ、プロンプト管理、オーケストレーション、AIアプリケーションのホスティングに関する機能をリリースした。