InfoQ ホームページ AIと機械学習、データエンジニアリング に関するすべてのコンテンツ
-
Apple社の研究者、異なるLLMを組み合わせて最先端の性能を実現する手法を詳説
この程、多くの大規模言語モデル(LLM)がクローズドソースとオープンソースの両方で利用可能になり、更にマルチモーダルLLM(MLLM)として知られる複合モデルの作成につながっている。しかし、最先端のマルチモーダルLLMを設計するための原則と教訓を抽出した、Apple社の研究者は、そのようなLLMを作るためにどのようなデザインの選択がなされたかを明らかにするものはほとんどない、あるいは皆無だと述べる。
-
Meta社、24000基以上のGPUから成るAIインフラ設計を発表
Meta社はこの程、2つの新しいAIコンピューティング・クラスターの設計を発表し、それぞれ24,576基のGPUを搭載している。これらのクラスタはMeta社のGrand Tetonハードウェア・プラットフォームに基づいており、1つのクラスタは現在Meta社の次世代モデルである、"Llama 3"のトレーニングに使用されている。
-
Databricks、オープンソースの汎用LLM "DBRX" を発表
Databricks社は、オープンモデルの標準を再定義し、業界ベンチマークで有名な競合他社を凌駕することを目的とした、新しいオープンソースの大規模言語モデル(LLM)である、"DBRX"を発表した。
-
CNCF、Kubernetes上のKafkaを簡素化するStrimziをインキュベートする
Cloud-Native Computing Foundation(CNCF)は、Kubernetes上でのApache Kafkaのデプロイを効率化するインキュベート・プロジェクトとしてStrimziを承認した。Strimziは、Kubernetes上でのKafkaの設定、デプロイ、運用を容易にするKubernetes APIを拡張する一連のオペレータを通じて、Kafkaと対話するKubernetesネイティブな方法を提供する。
-
研究者らが、LLMジェイルブレイク攻撃の防御アルゴリズム"SafeDecoding"のオープンソース化を発表
ワシントン大学、ペンシルバニア州立大学、アレンAI研究所の研究者が、大規模言語モデル(LLM)をジェイルブレイク攻撃から守る技術である、"SafeDecoding"のオープンソース化を発表した。SafeDecodingは、大きな計算オーバーヘッドを発生させることなく、ベースラインのジェイルブレイク防御を上回る性能を発揮する。
-
Microsoft、.NETスマートコンポーネントを発表:AIを搭載したUIコントロール
Microsoftはこのほど、 .NETアプリケーション内の開発生産性を高めるAI機能を提供するUIコントロール、.NET Smart Componentsを発表した。Microsoftによると、これらのコンポーネントは、既存の.NETアプリケーションへのAI機能の統合を簡素化するように設計されており、前述の通り、開発者の労力は最小限に抑えられるという。
-
OpenAI、"Transformer Debugger"ツールをリリース
OpenAIは、"Transformer Debugger"(TDB)と呼ばれる新しいツールを発表した。このツールはOpenAIのSuperalignmentチームによって開発され、自動解釈可能性技術とスパースオートエンコーダを組み合わせたものである。
-
Azure OpenAIの「On Your Data」機能が一般利用可能に
Microsoft社は、Azure OpenAI Serviceで"On Your Data"機能の一般提供を正式に開始した。この機能により、ユーザーはGPT-4を含むOpenAIモデルのフルパワーを活用し、RAG(Retrieval Augmented Generation)モデルの高度な機能をデータとシームレスに統合可能となった。同社によると、これらはすべてAzure上のエンタープライズ・グレードのセキュリティ(プライベート・エンドポイントとVPN経由)に支えられており、安全で保護されたユーザー・データ環境を保証しているという。
-
RWKVプロジェクト、LLM "Eagle 7B"をオープンソース化
RWKVプロジェクトはこの程、75.2億パラメータの大規模言語モデル(LLM)である、Eagle 7Bをオープンソース化した。Eagle 7Bは、100以上の言語の1.1兆トークンのテキストで学習され、多言語ベンチマークにおいて他の同サイズのモデルを凌駕している。
-
Data Solutions Framework:AWS上でデータソリューションを構築するためのオープンソースプロジェクト
AWSはこの程、Data Solutions Framework (DSF)をリリースした。これは、AWS��でデータソリューションの作成を加速するために設計された、オープンソースのフレームワークである。AWS CDKを使用して構築されたこのフレームワークは、データソリューションを構築するためのビルディングブロックとして抽象化とパターンを公開しており、TypeScript(npm)とPython(PyPi)で利用できる。
-
Google、開発者向けの新しいオープンソースAIモデル「Gemma」を発表
Googleは、新しいオープンソースのAIモデルであるGemmaを発表した。GoogleのAIモデル「Gemini」を支える技術を用いて開発されたGemmaは、AIアプリケーションを良心的に作成するための高度なツールを開発者に提供することを目的としている。
-
"Google BigQuery"、ベクトル検索を導入
Googleはこの程、BigQueryがベクトル検索をサポートするようになったと発表した。この新機能は、セマンティック検索、類似性検出、大規模言語モデル(LLM)による検索拡張生成(RAG)といったデータやAIのユースケースで必要とされるベクトル類似性検索を可能にする。
-
Anthropicが生成AIモデル"Claude 3"を発表、"Opus"モデルとその人間に近い能力へ注目集まる
Anthropicは、GPT-4などの他の業界モデルを上回る、Claude 3ファミリーを発表した。Claude 3ファミリーは3つの異なるモデルで構成されている。能力の高い順に、"Opus"、"Sonnet"、"Haiku"の3つのモデルが存在し、それぞれ知能、スピード、コストの面で多様なユーザーニーズに応えるように設計されている。
-
LLM戦略、プラットフォームエンジニアリング、オブザーバビリティなど:InfoQ Dev Summit Boston 2024
ソフトウェア開発の状況は急速に進化しており、一歩先を行くには、戦略的な意思決定を行い、新しいテクノロジーを適切に実装し、チームが効果的にコラボレーションできるようにするための継続的な学習が必要である。6月24~25日に開催されるInfoQ Dev Summit Bostonに参加し、同業者とのネットワークを広げ、生成AI、セキュリティ、モダンWebアプリケーションなどのトピックを含む厳選されたアジェンダを体験しよう。これらの技術の実装に成功し、関連する課題を克服した人々から学び、あなたのプロジェクトの成功に役立てよう。
-
Google、2億パラメータのAI予測モデル"TimesFM"を発表
GoogleResearchは、時系列予測を目的とした200MパラメータのTransformerベースの基礎モデルである、TimesFMを発表した。TimesFMは約100Bのデータポイントで学習され、教師あり学習モデルと同等以上のゼロショット予測性能を持つ。