InfoQ ホームページ ai-architecture に関するすべてのコンテンツ

ニュース

RSSフィード

AIと機械学習、データエンジニアリング

Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開

Meta社は、同社プラットフォーム全体で広告推薦を改善するために設計された基盤モデルGenerative Ads Model（GEM）の詳細を公開した。GEMは、クリックやコンバージョンといった有意なシグナルが極めて疎な、1日あたり数十億件規模のユーザーと広告の相互作用を処理することで、推薦システムにおける中核的課題に対処するモデルである。GEMは、広告主の目標、クリエイティブ形式、計測シグナル、複数の配信チャネルにまたがるユーザー行動など、多様な広告データから学習する複雑性に対応する。

Vinod Goje 翻訳者 Takashi Kawase
投稿日 2026年3月5日午前8時30分
設計/アーキテクチャ

「セキュリティの悪夢」：DockerがMCPツールチェーンのリスクを警告

Dockerの新しいブログ投稿は、Model Context Protocol (MCP)を基に構築されたAI駆動開発者ツールが重大なセキュリティ脆弱性―認証情報の漏洩、無許可ファイルアクセス、リモートコード実行の実例を含む―をもたらしていると警告している。

Matt Foster 翻訳者 Hiroaki.Sugimura
投稿日 2025年9月18日午前12時30分
AIと機械学習、データエンジニアリング

HashiCorp、AI統合に向けてTerraform MCP Serverをリリース

HashiCorpはTerraform MCP Server、大規模言語モデルがインフラストラクチャをコードとして扱う際の相互作用を改善するために設計されたModel Context Protocolのオープンソース実装をリリースした。リアルタイムTerraform Registryデータ－モジュールのメタデータ、プロバイダのスキーマ、リソースの定義など－を構造化された形式で公開することで、AIシステムは現在の検証済みの構成パターンに基づいて提案できるようになる。

Matt Foster 翻訳者 Hiroaki.Sugimura
投稿日 2025年8月25日午前12時55分
Cloud

AWSがECS・EKS・サーバーレス向けのオープンソースMCPサーバーを発表

AWS社は、Amazon Elastic Container Service (Amazon ECS)、Amazon Elastic Kubernetes Service (Amazon EKS)、およびAWS Serverless向けのオープンソースModel Context Protocol (MCP)サーバーセットをGitHub上で公開した。これらのサーバーは、Amazon Q DeveloperのようなAI開発アシスタントの能力を強化し、これらのAWSサービスに特化したリアルタイムのコンテキスト情報を提供するものだ。

Steef-Jan Wiggers 翻訳者 Naoko Koshimura
投稿日 2025年8月1日午前2時30分
AIと機械学習、データエンジニアリング

OpenAI、Stargateプロジェクトで世界のパートナー国にAIインフラを構築へ

OpenAIは、Stargateプロジェクトの一環として「OpenAI for Countries」という新たなイニシアチブを発表した。この取り組みは、民主主義の原則に基づいた各国でのAIインフラ構築を目指している。この拡大計画は、同社が米国でのAIインフラに5000億ドルを投資する初期計画に続くものだ。

Vinod Goje 翻訳者 Naoko Koshimura
投稿日 2025年7月17日午前4時30分
AIと機械学習、データエンジニアリング

DeepSeek社、数学定理証明向けLLM「Prover-V2」をオープンソースで公開

DeepSeek社は、Lean 4における数学定理証明に特化した新しいオープンソースの大規模言語モデルDeepSeek-Prover-V2を公開した。このモデルは、同社の基盤モデルであるDeepSeek-V3を活用した再帰的定理証明パイプラインを基盤として構築されている。Lean 4は、Microsoft Researchが開発した最新バージョンのLean定理証明ツールであり、機械による検証が可能な形式的証明を数学者やコンピュータ科学者が記述できる対話型証明支援システムである。

Vinod Goje 翻訳者 Takashi Kawase
投稿日 2025年6月12日午前8時30分
設計/アーキテクチャ

AWSはWell-Architected Generative AI Lensにおいて責任あるAIを推進

AWSは、生成AIワークロード設計と運用のベストプラクティス提供にフォーカスした、新しいWell-Architected Generative AI Lensの提供を発表した。このLensは、生成AIを使って堅牢かつコスト効率の高いソリューションを提供する責任を持つビジネスリーダー、データサイエンティスト、アーキテクト、エンジニアを対象としている。このドキュメントはクラウドに依存しないベストプラクティス、実装ガイダンス、その他のリソースへのリンクを提供している。

Rafal Gancarz 翻訳者 Hiroaki.Sugimura
投稿日 2025年5月23日午前9時30分
Cloud

OpenAIが Microsoft Azure OpenAI Service上に新しいo3-miniモデルを提供

OpenAIは、o3-miniモデルをローンチし、現在Microsoft Azure OpenAI Serviceからアクセス可能となっている。同社によると、このモデルはAI技術の進歩を象徴しており、昨年9月にリリースされたo1-miniと比較してコスト効率が改善され、推論能力が向上している。

Steef-Jan Wiggers 翻訳者 Hiroaki.Sugimura
投稿日 2025年2月18日午前2時30分
AIと機械学習、データエンジニアリング

Amazon Bedrockがオープンソースフレームワーク統合を取り入れたマルチエージェントシステム（MAS）を導入

Amazon Web Servicesは、Amazon Bedrock向けにマルチエージェントコラボレーション機能をリリースし、複数のAIエージェントが複雑なタスクで協力するためのフレームワークを導入した。このシステムは専門化されたエージェントがスーパーバイザーエージェントの調整の下で協力して作業することを可能にし、分散AIシステムにおけるエージェントオーケストレーションに関する開発者の課題に対処するものである。

Vinod Goje 翻訳者 Hiroaki.Sugimura
投稿日 2025年2月13日午前5時30分
Cloud

Azure AI Agent Service パブリックプレビュー: 定型業務の自動化

先日開催されたIgniteカンファレンスでMicrosoftはAzure AI Agent Serviceのパブリックプレビューを発表した。このフルマネージドサービスは、開発者が基盤となるコンピューティングリソースやストレージリソースを管理することなく、高品質で拡張可能なAIエージェントをセキュアに構築、デプロイ、スケーリングできるようにする。

Steef-Jan Wiggers 翻訳者 Hiroaki.Sugimura
投稿日 2025年1月29日午前8時30分
AIと機械学習、データエンジニアリング

マイクロソフトが汎用マルチエージェントシステム Magentic-Oneを発表

マイクロソフトはMagentic-One、Webやファイルベースの環境を含むオープンエンドのタスクを処理するように設計された新汎用マルチエージェントシステムのリリースを発表した。このシステムはソフトウェア開発、データ分析、ウェブナビゲーションなど様々な領域にわたる複雑な多段階タスクを支援し、活動の効率性を向上させることを目的としている。

Daniel Dominguez 翻訳者 Hiroaki.Sugimura
投稿日 2024年12月24日午前5時31分
AIと機械学習、データエンジニアリング

Rhymes AIがAriaを発表：開発リソースを備えたオープンソースのマルチモーダルモデル

Rhymes AIは、テキスト、画像、ビデオ、コードを効果的に処理できるオープンソースのマルチモーダルネイティブMoE（Mixture-of-Experts）モデル、Ariaを発表した。ベンチマークテストにおいて、Ariaは他のオープンモデルを凌駕し、GPT-4oやGemini-1.5などの独自モデルに対しても競争力のある性能を示した。さらに、Rhymes AIは、微調整や開発のためのモデルの重み付けやガイダンスを含むコードベースを公開している。

Robert Krzaczyński 翻訳者 Naoko Koshimura
投稿日 2024年12月10日午前10時30分
設計/アーキテクチャ

RAG（Retrieval-Augmented Generation）を活用したCopilotが、Uberに13,000時間のエンジニアリング時間を節約

Uberは最近、オンコールサポートエンジニアの効率を改善するために設計されたAIを搭載したオンコールコパイロット、Genieを構築した方法を詳述した。GenieはRetrieval-Augmented Generation（RAG）を活用して正確なリアルタイム応答を提供し、インシデント対応のスピードと効果を大幅に向上させる。

Eran Stiller 翻訳者 Naoko Koshimura
投稿日 2024年11月28日午前5時30分
AIと機械学習、データエンジニアリング

LLMを精製し、そのパフォーマンスを超える：spaCyの創設者がInfoQ DevSummit Munichで語る

InfoQ Dev Summit Munichの第1回目のプレゼンテーションにおいて、Ines Montani氏は、今年の初めにQCon Londonで行ったプレゼンテーションに加え、実際のアプリケーションで最新の最先端モデルを使用し、その知識をより小型で高速なコンポーネントに抽出し、社内で実行・維持できるようにするための実践的なソリューションを聴衆に提供した。

Olimpiu Pop 翻訳者 Naoko Koshimura
投稿日 2024年11月26日午前1時30分
設計/アーキテクチャ

PayPal社、Cosmos.AI MLOpsプラットフォームにLLMを利用した生成AIサポートを追加

PayPal社はMLOpsプラットフォームCosmos.AIを拡張し、大規模言語モデル（LLM）を使用したジェネレーティブAIアプリケーションの開発をサポートする。同社は、ベンダー、オープンソース、自己調整LLMへのサポートを取り入れ、検索拡張生成（RAG）、セマンティックキャッシュ、プロンプト管理、オーケストレーション、AIアプリケーションのホスティングに関する機能をリリースした。

Rafal Gancarz 翻訳者 kazuki
投稿日 2024年11月14日午前8時30分