InfoQ ホームページ Artificial Intelligence に関するすべてのコンテンツ
-
Google DeepMindがGemini 2.0を発表:AIパフォーマンスとマルチモーダル統合における飛躍
Google DeepMindは、前モデルのGemini 1.5 Proの2倍の処理速度を実現するAIモデルGemini 2.0を発表した。このモデルはテキスト、画像、その他の入力を組み合わせて高度な推論を行う複雑なマルチモーダルタスクをサポートしている。JAX/XLAフレームワーク上に構築されたGemini 2.0は大規模に最適化され、複雑なトピックを探索するためのDeep Researchなどの新機能を含んでいる。現在、開発者と信頼できるテスターに提供されており、近くGeminiやSearchのようなGoogle製品に統合される予定である。
-
Cloudflare 2024年を振り返る:GitHub Copilotの力強い成長とGoがNode.jsを上回る
Cloudflareはこのほど、グローバルハイパースケーラネットワークのデータを分析したレポート「Radar Year in Review」の第5版を発表した。その結果、世界のインターネットトラフィックは17.2%増加し、モバイルとIPv6リクエストの顕著な伸びが明らかになった。さらに、自動化されたAPIリクエストでもっとも人気のある言語としてGoがNode.jsを抜き、GitHub Copilotが大きな伸びを示した。
-
Qwen開発チーム、QwQ-32B-Previewを発表:AIによる推論と分析が進化
LLM(大規模言語モデル)であるQwenの開発チームは、AIの推論と分析能力を向上させるために設計された実験的研究モデル、QwQ-32B-Previewを発表した。32,768トークンのコンテキストと最先端の変換アーキテクチャを特徴とするこのモデルは、GPQAやMATH-500のような数学、プログラミング、科学ベンチマークに優れている。Hugging Faceで利用可能で、その機能を探求し、開発に貢献をしてくれる研究者たちを募っている。
-
ソフトウェアテスト自動化におけるAIの役割を探索する
Victor Ionascu氏によると、ソフトウェアテストの複雑さの増大に対応するため、QAプロフェッショナルがAIを活用する傾向が高まっている。AI駆動型自動化はテストカバレッジの向上、テストサイクルタイムの短縮、結果精度の向上を可能とし、より高品質なソフトウェアをより速くリリースできるようにする。
-
Amazonが Amazon Nova、基盤モデルのシリーズを発表
Amazonは生成AIタスク向けに設計された基盤モデルのファミリーAmazon Novaを発表した。AWS re:Inventの中に行われたこの発表は、ドキュメントやビデオの分析、チャートの理解、ビデオコンテンツの生成、AIエージェントの開発といったタスクにおけるモデルの能力をハイライトしている。
-
QCon San Francisco 2024のAIとMLトラック - 生成AIと実用的アプリケーションを深掘り
InfoQによる国際的なソフトウェア開発会議であるQCon San Francisco 2024では、AIとMLの急速な進歩に特化した2つのトラックが設けられており、これらの技術が現代のソフトウェア開発の中心となっていることを反映している。
-
Meta社、強化学習を用いてデータセンターの持続可能性を最適化
最近のブログ記事で、自社のエンジニアが強化学習(RL)を使って 自社のデータセンターの環境制御を最適化し、エネルギー消費と水の使用量を削減しながら、気候変動などのより 広範な課題に取り組む方法を紹介している。強化学習は、機械学習と最適制御の一分野であり、知的エージェントが報酬信号を最大化するために、変化する環境の中でどのように意思決定を行うかに焦点を当てている。
-
Pythonの台頭、生成AI、グローバルな開発者コミュニティ:GitHub Octoverse 2024からの洞察
最近発表されたGitHub Octoverse 2024レポートによると、主にデータサイエンス、機械学習、科学計算のような分野での優位性により、PythonはJavaScriptを抜いてGitHubで最も人気のある言語になったことが明らかになった。生成AIはソフトウェア開発において引き続き重要な存在感を示しており、GitHub上の生成AIプロジェクトへの貢献が大幅に増加している。
-
マイクロソフトが汎用マルチエージェントシステム Magentic-Oneを発表
マイクロソフトはMagentic-One、Webやファイルベースの環境を含むオープンエンドのタスクを処理するように設計された新汎用マルチエージェントシステムのリリースを発表した。このシステムはソフトウェア開発、データ分析、ウェブナビゲーションなど様々な領域にわたる複雑な多段階タスクを支援し、活動の効率性を向上させることを目的としている。
-
Meta Spirit LM、音声とテキストを統合した新しいマルチモーダルGenAIモデルを発表
最近の論文で発表されたSpirit LMは、話し言葉と書き言葉を混在させたパイプラインを作成し、音声とテキストを同じマルチモーダルモデルに統合することを可能にする。Meta社によれば、テキストと音声トークンのインターリーブに基づく新しいアプローチにより、音声とテキストに別々のパイプラインを使用する従来のソリューションの本質的な制限を回避することが可能になるという。
-
Amazon SageMaker JumpStartがBria AIのテキスト画像変換モデルでポートフォリオを拡大
Amazon Web Servicesは、Bria AIの最新のテキストから画像への基礎モデルをAmazon SageMaker JumpStartに統合し、エンタープライズグレードの生成AI機能を大幅に拡張した。今回の追加には、Bria 2.3、Bria 2.2 HD、Bria 2.3 Fastの3つのバリエーションが含まれ、それぞれがビジュアルコンテンツ生成における特定の企業ニーズに対応するように設計されている。
-
xAIがGrokモデルの新APIサービスを発表
Elon Musk氏のxAIは、開発者がアプリケーションにxAIの大規模言語モデル(LLM)を統合できるようになる、APIサービスのパブリックベータ版をローンチした。
-
DecartとEtchedがゲーム世界を変える新しいAIモデル、Oasisをリリース
Decart.aiとEtched.aiは最近Oasis、Minecraftにイ���スパイアされた完全インタラクティブ、リアルタイムオープンワールド体験を生成するAI駆動モデルを発表した。
-
AWSがAIエージェント管理のためのMulti-Agent Orchestratorフレームワークを公開
AWSはMulti-Agent Orchestrator、複数のAIエージェントを管理し、複雑な会話シナリオを処理するために設計されたフレームワークを発表した。このシステムはクエリを最適なエージェントにルーティングし、インタラクション間でコンテキストを維持し、AWS Lambda、ローカルセットアップ、その他クラウドプラットフォームなどさまざまなデプロイ環境とシームレスに統合する。
-
AISuiteは統一クロスLLM APIを提供する新オープンソースPythonライブラリ
最近Andrew Ng氏によって発表された、現在利用可能なもっとも一般的な大規模言語モデル(LLM)に対してOpenAIライクなAPIを提供することを目的としたaisuiteは、開発者がコードを変更することなく簡単にLLMを試して結果を比較したり、あるLLMから別のLLMに切り替えることを可能にする。