InfoQ ホームページ ニュース
-
Cloudflare社の年次総括:AIボットの過剰クロールと耐量子暗号50%到達、Goが倍増
Cloudflare社は最近、Radar Year in Reviewの第6版を公開した。結果は、世界のインターネットトラフィックが前年比19%成長したこと、Googlebotの支配的地位、クロール対リファラ比率の上昇、耐量子暗号の広範な採用を明らかにしている。自動化されたAPIリクエストの20%超はGoベースのクライアントによるもので、前年からほぼ倍増した。
-
Meta社、LLM規模学習とハイブリッド並列化を採用した広告生成モデルGEMを公開
Meta社は、同社プラットフォーム全体で広告推薦を改善するために設計された基盤モデルGenerative Ads Model(GEM)の詳細を公開した。GEMは、クリックやコンバージョンといった有意なシグナルが極めて疎な、1日あたり数十億件規模のユーザーと広告の相互作用を処理することで、推薦システムにおける中核的課題に対処するモデルである。GEMは、広告主の目標、クリエイティブ形式、計測シグナル、複数の配信チャネルにまたがるユーザー行動など、多様な広告データから学習する複雑性に対応する。
-
APIプラットフォーム「Unkey」、パフォーマンス問題を受けサーバーレスを廃止
開発者向けプラットフォームを提供するUnkey社は、API認証サービスを全面的に再構築したことを明らかにした。同社は、サーバーレスアーキテクチャであるCloudflare Workersから、状態を保持するGoサーバーへ移行した。この決定は、サーバーレスアーキテクチャの制約を再評価した結果によるものであるという。同社によれば、この移行によりパフォーマンスが6倍向上し、エンジニアリング作業の大部分を占めていたワークアラウンドが不要になったと述べている。
-
Nuxt、ネイティブなリクエストキャンセルと非同期ハンドラー抽出を導入し性能向上
Vue.jsを基盤とするフルスタックWebアプリケーション構築向けフレームワークのNuxtは、バージョン4.0から4.2を最近リリースし、開発者体験の向上、実験的なTypeScriptプラグイン対応、性能面の改善をもたらした。
-
AWS、管理型エグレスセキュリティ簡素化へ 「Network Firewall proxy」をプレビュー公開
AWS社はこのほど、プロキシの管理と展開を担うマネージドサービス「AWS Network Firewall proxy」のプレビュー版を開始した。AWS社によると、このサービスは、顧客が自社のVPCからのアウトバウンドアクセスを統制するセキュリティポリシーに、より注力できるようにするものだ。
-
Microsoft Foundry Agent Service、長期メモリのプレビュー版で状態管理をシンプル化
Microsoftは年次カンファレンスIgniteにてFoundry Agent Serviceのメモリ機能、Agent serviceにネイティブ統合されたフルマネージド長期メモリストア、のパブリックプレビュー版を発表した。
-
AWS Lambda Managed Instances:サーバーレスの柔軟性とEC2のコストモデルが融合
AWS Lambda Managed Instancesは、AWS Lambda関数をAmazon Elastic Compute Cloud(Amazon EC2)インスタンス上で実行できる新機能だ。
-
GrafanaとGitLabがサーバーレスCI/CDの可観測性統合を導入
開発ワークフローを効率化する取り組みとして、Grafana LabsのDaniel Fitzgerald氏が、GitLabのCI/CDイベントをサーバーレスアーキテクチャ経由でGrafanaのオブザーバビリティスタックに連携する新しいオープンソース・ソリューションを公開した。この統合によりプッシュ、マージリクエスト、パイプライン完了といったGitLabのWebhookイベントを、デプロイイベントとパフォーマンスメトリクスの関連をリアルタイムで可視化し、相関分析するためにGrafana Cloud Logs (Grafana Loki上に構築された)へ直接送信できるようになった。
-
PyTorch FoundationがRayを歓迎し、簡素化された分散AIのためのMonarchを発表
2025年のPyTorchカンファレンスにおいて、PyTorch FoundationはオープンでスケーラブルなAIインフラの推進を目指したいくつかの取り組みを発表した。財団は、分散コンピューティングフレームワークであるRayをホストプロジェクトとして歓迎し、複数のマシンにわたる分散AIワークロードを簡素化する新しいフレームワーク「PyTorch Monarch」を紹介した。また、イベントではスタンフォード大学のMarinやAI2のOlmo-Thinkingなどの新しいオープンリサーチプロジェクトも取り上げられ、基盤モデルの開発における透明性と再現性の重要性が高まっていることが強調された。
-
Uberのクエリアーキテクチャ:レイヤーの簡素化とオブザーバビリティの向上
Uber社は、Apache Pinotのクエリアーキテクチャを再設計し、実行の簡素化、より豊かなSQLのサポート、内部分析ワークロードの予測可能性の向上を図った。従来のNeutrinoシステムは、PrestoとPinotを重ねたものであったが、軽量なプロキシ「Cellar」に置き換えられ、Pinotのマルチステージエンジンライトモードを使用することになった。この再設計は、複雑さを軽減し、実行制限を強化し、複数のテナントに対するより強固な隔離を提供することを目的としている。
-
Memori、AIエージェント向けのSQLとMongoDBを活用したフルスケールのメモリレイヤーへ拡張
Memoriは、AIエージェントに長期的で構造化されたクエリ可能なメモリを提供するために設計された、フル機能を備えたオープンソースのメモリシステムへと成熟した。これにより、従来のプロプライエタリなベクトルストアではなく、標準的なデータベースを使用できる。Memoriは、アドホックなプロンプトや一時的なセッション状態に依存する代わりに、インタラクションからエンティティ、事実、関係、コンテキストを継続的に抽出し、それらをSQLやMongoDBのバックエンドに保存する。それにより、エージェントは手動でのオーケストレーションを行うことなく、セッションをまたいで情報を記憶し再利用が可能だ。
-
Discord、単一GPUワークフローから共有RayクラスターへのMLプラットフォーム拡張
Discord社は、単一GPUトレーニングの限界に直面した後、機械学習プラットフォームを再構築した方法を詳述した。RayとKubernetesを標準化し、ワンクリックでクラスターを作成できるCLIを導入し、DagsterとKubeRayを通じてワークフローを自動化することで、分散トレーニングを日常的な運用に変更できた。これらの変更により、大規模モデルの毎日の再トレーニングが可能となり、広告ランキングの主要指標で200%の向上を達成した。
-
Android GenAIプロンプトAPI、Gemini Nanoで自然言語リクエストを実現
ML Kit GenAI Prompt APIIがアルファ版で利用可能となり、Android開発者はデバイス上で動作するGemini Nanoに自然言語およびマルチモーダルリクエストを送信できるようになった。このAPIは、初期のGenAIリリースで導入されたテキスト要約や画像説明の機能を拡張するものである。
-
Helm、6年ぶりの大型リリースでKubernetesパッケージ管理を改善
Helmは、Kubernetesアプリケーションパッケージマネージャーとして公式にバージョン4.0.0に到達した。Helm 4は6年ぶりの大規模アップグレードであり、Cloud Native Computing Foundation(CNCF)の指導のもとでHelmの10周年を迎える節目でもある。このアップデートは、スケーラビリティ、セキュリティ、開発者のワークフローに関するいくつかの課題に対応することを目的としている。
-
Transformers v5、よりモジュール化され相互運用性の高いコアを導入
Hugging Face社は、Transformers v5の最初のリリース候補を発表した。このリリースは、5年前のv4リリース以来大きく進化してきたTransformersライブラリにとって重要な一歩である。Transformersは、専門的なモデルツールキットからAI開発の主要なリソースへと移行し、現在では1日あたり300万以上のインストール数を記録し、累計で12億以上のインストール数を達成している。