InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
AI大陸行動計画:欧州委員会がAI開発におけるスケーリング戦略概要を発表
欧州委員会は、EUにおけるAIの開発とデプロイ推進に向けた新戦略「AI大陸行動計画」を発表した。同計画は、AIインフラストラクチャーへの協調投資、高品質データへのアクセス拡大、EUの戦略的セクターにおけるAI導入推進、AI規則順守への支援に関する戦略概要である。
-
CloudflareがModel Context Protocol(MCP)サーバーのリモートホスティングを可能に
Cloudflareは、同社のプラットフォーム上でModel Context Protocol (MCP)サーバーをリモート構築およびデプロイする機能を発表した。これにより、AIアプリケーションと外部サービス間の標準化されたインタラクションを目的としたプロトコルの範囲と使いやすさが拡大する。これまではローカルでの実行に限定されることが多かったMCPサーバーが、Cloudflareのグローバルネットワークを活用可能になった。
-
OpenAI社、GPT-4oの画像生成機能改善を発表
OpenAI社が、ネイティブ画像生成機能を搭載したGPT-4oの新バージョンをリリースした。。今回のモデルでは、アップロード画像の修正やプロンプト指示による画像生成が可能になったほか、一貫性を保った複数バージョンの画像生成機能や画像内テキスト生成機能が改善されている。
-
SREと生成AIを利用したeBayのダウンタイム削減方法:KubeCon EUでのアーキテクトによる洞察
KubeCon EUの基調講演で、eBay社のプリンシパルMTSアーキテクトであるVijay Samuel氏は、機械学習やLLMのビルディングブロックを組み込み、自社SREチームのインシデント対応強化を行った際の実体験を披露した。同氏は今回の体験を通し、LLMは万能ではないものの、複数機能を組み合わせることで複雑なシナリオに取り組むエンジニアに役立つことが分かったと語っている。
-
Mistral AIがマルチモーダル文書のLLMベースOCR用APIを発表
Mistral AI社のla Plateforme SaaSで利用可能になったMistral OCRは、テキストと画像、表、数式、高度なレイアウトが混在する複雑な文書をデジタル化するためのOCRソリューションを提供することを目的としている。そのため、科学研究、歴史的文書や工芸品、ユーザーマニュアルなどのデジタル化に特に適していると同社は述べている。
-
OpenAIが文字起こしと音声合成用の新音声モデルを発表
OpenAIはAPIにおいて、文字起こしの精度向上とAI生成音声の制御性向上にフォーカスした新しい音声認識と音声合成モデルを導入した。これらのアップデートは自動音声アプリケーションを強化し、さまざまな環境やユースケースにさらに適応できるようにすることを目的としている。
-
OpenAIがカスタムエージェント開発用の新しいAPI、SDK、ツールを発表
OpenAIが新しいResponses API、Agent SDK、可観測性ツールを発表した。これらは本番対応エージェントを作成する際に直面する課題、例えばカスタムオーケストレーションの構築や、複雑な多段階タスクにおけるプロンプトの反復処理に対応するためのものだ。
-
instructlab.aiは、合成データを使用して大規模言語モデル(LLMs)の微調整の複雑さを軽減する
InstructLab.aiは、この論文で説明されているチャットボットのための大規模アラインメント(LAB)コンセプトをオープンソースで実装したものである。論文の要旨によると、LABは大規模言語モデル(LLM)の命令チューニングフェーズにおけるスケーラビリティの課題を克服することを目的としている。このアプローチは、LLMのための合成データベースのアライメントチューニングメソッドを活用する。このアプローチでは、作成された分類法によって、学習データの合成シードを提供できる。
-
Dapr Agents:LLM、Kubernetes、マルチエージェント協調によるスケーラブルなAIワークフロー
Daprは最近、大規模言語モデル(LLM)を使用してスケーラブルでレジリエントなAIエージェントを構築するためのフレームワークDapr Agentsを発表した。Dapr Agentsは、Daprのセキュリティ、オブザーバビリティ、クラウドニュートラルなアーキテクチャを活用し、構造化されたワークフロー、マルチエージェント連携、イベント駆動型の実行が可能だ。企業向けに設計されており、数千のエージェントをサポートし、データベースと統合し、堅牢なオーケストレーションとメッセージングによって信頼性を確保する。
-
自動テスト結果の分析における人工知能の活用
自動テスト結果の分析は、テスト活動において非常に重要かつ困難な部分である。任意の時点で、自動テストの結果に従って製品の状態を伝えることができなければならない、とMaroš Kutschy氏はQA Challenge Acceptedで述べた。彼は、人工知能が分析に費やす時間を節約し、人的ミスを減らし、新たな障害に集中するのに役立っていることを紹介した。
-
Google DeepMindが Gemini Roboticsを発表
Google DeepMindは、視覚、言語、行動を統合することでロボット工学を強化するために設計された先進的なAIモデル、Gemini Roboticsを発表した。Gemini 2.0フレームワークに基づくこのイノベーションは、特に現実世界のセッティングにおいて、ロボットをよりスマートで能力の高いものにすることを目指している。
-
VS Code Copilot用GPT-4oコード補完モデルがパブリックプレビューで利用可能に
最近、Visual Studio Code(VS Code)ユーザー向けにGPT-4o Copilotが発表された。このAIモデルはGPT-4o mini基盤の上に構築されており、30以上の広く使用されているプログラミング言語にわたる、275,000以上の高品質なパブリックリポジトリからの広範なトレーニングを含んでいる。強化トレーニングにより、より正確でコンテキストに即したコード提案を提供し、パフォーマンスの向上、開発者の生産性向上、コーディングプロセスを支援することが期待されている。
-
エンジニアリングチームがAI、プラットフォームエンジニアリング、DevExにどう取り組んでいるか:InfoQ Dev Summit Boston 2025
InfoQとQConの開発チームによるこのイベントは、理論的な議論のみ行うカンファレンスとは異なり、Netflix、The New York Times、Shopify、CarGurus、Vanguardなどから得られる実践的な洞察に基づいた現実世界での実装にフォーカスしている。講演者は参加者がすぐに適用できる戦略を共有し、チームがコストのかかる試行錯誤を避けられるよう支援する。
-
Google CloudのAI Protection:AIアセットを保護するためのソリューション
Google Cloudは最近、生成AIに関連するリスクや脅威から保護する包括的なソリューション、AI Protectionを発表した。
-
IBM社、Granite 3.2で新たな視覚言語モデル、思考連鎖推論、時系列モデル強化を実装
IBM社は、マルチモーダルと推論機能を搭載したGranite 3.2の最新モデルを発表した。。Granite 3.2の特徴は試験的に導入された思考連鎖推論機能であり、従来モデルを大きく上回る性能を発揮している。新たな大規模視覚言語モデル(VLM)は、いくつかのベンチマークスコアでより大型のモデルを凌駕しているほか、小型モデルより効率的なデプロイを実現している。