InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Google DeepMind社がAGI(汎用型人工知能)の安全性とセキュリティに対するアプローチを発表
Google DeepMind社は、新たな論文の中でAGI開発における安全性とセキュリティに対する自社アプローチを概説した。AGIとは、AIシステムの中でも大方の認知タスク処理において人間と同等の能力を持つものを指す名称である。 同社の見解では、AGIによる推論、計画、タスクの自律的な実行が可能となる日も近く、AGIとエージェント機能を統合した場合は、実現がいっそう早まるとしている。
-
Radical AI、次世代原子論的シミュレーションのためのPyTorchネイティブエンジン「TorchSim」をリリース
Radical AI社は、PyTorchネイティブで構築され、MLIP(機械学習による原子間ポテンシャル)時代のために設計された次世代原子論的シミュレーションエンジンTorchSimのリリースを発表した。材料科学における大きな技術的転換と位置づけられるTorchSimは、ASE(原子シミュレーション環境)やDFT(密度汎関数理論)といった従来のフレームワークと比較して、分子シミュレーションを桁違いに高速化することを約束する。
-
アマゾンがNova Act SDKを発表、高度なAIモデルへのアクセスを拡大
アマゾンは、開発者が基盤モデルに容易にアクセスできるように設計されたプラットフォームnova.amazon.comの導入による生成AI機能の拡張を発表した。これには、新たに発表された「Amazon Nova Act」が含まれており、これはウェブブラウザ内でアクションを実行するために特別に訓練されたAIモデルです。
-
Meta AIがLlama 4をリリース:初期の印象とコミュニティからのフィードバック
Meta社は、新しいLlama 4ファミリーの最初のモデルであるScoutとMaverickを正式にリリースした。これは、同社のオープンウェイト大規模言語モデルエコシステムにおける大きな前進となる。ネイティブのマルチモーダルアーキテクチャとMixture of Experts(MoE)フレームワークで設計されたこれらのモデルは、画像理解からロングコンテキストの推論まで、より幅広いアプリケーションをサポートすることを目的としている。
-
Docker Desktop 4.40がModel Runnerを導入、LLMをローカル実行しAI機能を拡張
2025年3月31日にリリースされたDocker Desktop 4.40は、AI開発ワークフロー拡張とエンタープライズ向けコンプライアンス機能の強化を目的とした一連の新機能を導入している。
-
.NET AIチャットWebアプリテンプレート プレビュー2がQdrantおよび.NET Aspire対応でリリース
.NET AI Chat Web Appテンプレートの第2プレビューがリリースされ、いくつかの機能強化が導入された。今回のアップデートでは.NET AspireのサポートとQdrantベクトルデータベースとの統合が含まれており、このテンプレートを用いてクラウドネイティブアプリケーションを作成できるようになった。
-
AIワークロードの最適化に向けて:Google Cloud活用のヒントとコツ
Google Cloud社は、企業の社内クラウドインフラストラクチャにおけるでAIワークロードのコスト削減や効率性向上に特化した一連の新しいツール機能を発表した。今回の発表は、企業側からのAIイニシアチブコストの最適化とパフォーマンス・スケーラビリティの維持の両立を求める声の高まりを受けての対応である。
-
AI大陸行動計画:欧州委員会がAI開発におけるスケーリング戦略概要を発表
欧州委員会は、EUにおけるAIの開発とデプロイ推進に向けた新戦略「AI大陸行動計画」を発表した。同計画は、AIインフラストラクチャーへの協調投資、高品質データへのアクセス拡大、EUの戦略的セクターにおけるAI導入推進、AI規則順守への支援に関する戦略概要である。
-
OpenAI社、GPT-4oの画像生成機能改善を発表
OpenAI社が、ネイティブ画像生成機能を搭載したGPT-4oの新バージョンをリリースした。。今回のモデルでは、アップロード画像の修正やプロンプト指示による画像生成が可能になったほか、一貫性を保った複数バージョンの画像生成機能や画像内テキスト生成機能が改善されている。
-
Mistral AIがマルチモーダル文書のLLMベースOCR用APIを発表
Mistral AI社のla Plateforme SaaSで利用可能になったMistral OCRは、テキストと画像、表、数式、高度なレイアウトが混在する複雑な文書をデジタル化するためのOCRソリューションを提供することを目的としている。そのため、科学研究、歴史的文書や工芸品、ユーザーマニュアルなどのデジタル化に特に適していると同社は述べている。
-
Cloudflare Security Week 2025 総括:量子暗号からAI Labyrinthまで
先日開催されたCloudflare Security Week 2025 において、クラウドプロバイダーはサイバーセキュリティサービスの様々な改善とセキュリティ脅威の傾向と課題を分析した複数のレポートを発表した。さらに不正なクローラーに対抗するハニーポットの新バージョン AI Labyrinthと、安全なAI技術の採用を支援することを目的としたツール群 Cloudflare for AIも発表した。
-
OpenAIが文字起こしと音声合成用の新音声モデルを発表
OpenAIはAPIにおいて、文字起こしの精度向上とAI生成音声の制御性向上にフォーカスした新しい音声認識と音声合成モデルを導入した。これらのアップデートは自動音声アプリケーションを強化し、さまざまな環境やユースケースにさらに適応できるようにすることを目的としている。
-
OpenAIがカスタムエージェント開発用の新しいAPI、SDK、ツールを発表
OpenAIが新しいResponses API、Agent SDK、可観測性ツールを発表した。これらは本番対応エージェントを作成する際に直面する課題、例えばカスタムオーケストレーションの構築や、複雑な多段階タスクにおけるプロンプトの反復処理に対応するためのものだ。
-
instructlab.aiは、合成データを使用して大規模言語モデル(LLMs)の微調整の複雑さを軽減する
InstructLab.aiは、この論文で説明されているチャットボットのための大規模アラインメント(LAB)コンセプトをオープンソースで実装したものである。論文の要旨によると、LABは大規模言語モデル(LLM)の命令チューニングフェーズにおけるスケーラビリティの課題を克服することを目的としている。このアプローチは、LLMのための合成データベースのアライメントチューニングメソッドを活用する。このアプローチでは、作成された分類法によって、学習データの合成シードを提供できる。
-
Dapr Agents:LLM、Kubernetes、マルチエージェント協調によるスケーラブルなAIワークフロー
Daprは最近、大規模言語モデル(LLM)を使用してスケーラブルでレジリエントなAIエージェントを構築するためのフレームワークDapr Agentsを発表した。Dapr Agentsは、Daprのセキュリティ、オブザーバビリティ、クラウドニュートラルなアーキテクチャを活用し、構造化されたワークフロー、マルチエージェント連携、イベント駆動型の実行が可能だ。企業向けに設計されており、数千のエージェントをサポートし、データベースと統合し、堅牢なオーケストレーションとメッセージングによって信頼性を確保する。