InfoQ ホームページ AIと機械学習、データエンジニアリングに関するすべてのコンテンツ

ニュース

RSSフィード

最新前の記事

AIと機械学習、データエンジニアリング

Apple社の研究者、異なるLLMを組み合わせて最先端の性能を実現する手法を詳説

この程、多くの大規模言語モデル(LLM)がクローズドソースとオープンソースの両方で利用可能になり、更にマルチモーダルLLM(MLLM)として知られる複合モデルの作成につながっている。しかし、最先端のマルチモーダルLLMを設計するための原則と教訓を抽出した、Apple社の研究者は、そのようなLLMを作るためにどのようなデザインの選択がなされたかを明らかにするものはほとんどない、あるいは皆無だと述べる。

Sergio De Simone 翻訳者 Takamasa Sugawara
投稿日 2024年4月18日午前5時30分
AIと機械学習、データエンジニアリング

Meta社、24000基以上のGPUから成るAIインフラ設計を発表

Meta社はこの程、2つの新しいAIコンピューティング・クラスターの設計を発表し、それぞれ24,576基のGPUを搭載している。これらのクラスタはMeta社のGrand Tetonハードウェア・プラットフォームに基づいており、1つのクラスタは現在Meta社の次世代モデルである、"Llama 3"のトレーニングに使用されている。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年4月18日午前2時30分
AIと機械学習、データエンジニアリング

Databricks、オープンソースの汎用LLM "DBRX" を発表

Databricks社は、オープンモデルの標準を再定義し、業界ベンチマークで有名な競合他社を凌駕することを目的とした、新しいオープンソースの大規模言語モデル（LLM）である、"DBRX"を発表した。

Daniel Dominguez 翻訳者 Takamasa Sugawara
投稿日 2024年4月17日午前1時30分
DevOps

CNCF、Kubernetes上のKafkaを簡素化するStrimziをインキュベートする

Cloud-Native Computing Foundation（CNCF）は、Kubernetes上でのApache Kafkaのデプロイを効率化するインキュベート・プロジェクトとしてStrimziを承認した。Strimziは、Kubernetes上でのKafkaの設定、デプロイ、運用を容易にするKubernetes APIを拡張する一連のオペレータを通じて、Kafkaと対話するKubernetesネイティブな方法を提供する。

Mostafa Radwan 翻訳者 Naoko Koshimura
投稿日 2024年4月10日午前9時30分
AIと機械学習、データエンジニアリング

研究者らが、LLMジェイルブレイク攻撃の防御アルゴリズム"SafeDecoding"のオープンソース化を発表

ワシントン大学、ペンシルバニア州立大学、アレンAI研究所の研究者が、大規模言語モデル（LLM）をジェイルブレイク攻撃から守る技術である、"SafeDecoding"のオープンソース化を発表した。SafeDecodingは、大きな計算オーバーヘッドを発生させることなく、ベースラインのジェイルブレイク防御を上回る性能を発揮する。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年4月10日午前8時30分
.NET

Microsoft、.NETスマートコンポーネントを発表：AIを搭載したUIコントロール

Microsoftはこのほど、 .NETアプリケーション内の開発生産性を高めるAI機能を提供するUIコントロール、.NET Smart Componentsを発表した。Microsoftによると、これらのコンポーネントは、既存の.NETアプリケーションへのAI機能の統合を簡素化するように設計されており、前述の通り、開発者の労力は最小限に抑えられるという。

Almir Vuk 翻訳者 Naoko Koshimura
投稿日 2024年3月29日午前9時30分
AIと機械学習、データエンジニアリング

OpenAI、"Transformer Debugger"ツールをリリース

OpenAIは、"Transformer Debugger"(TDB)と呼ばれる新しいツールを発表した。このツールはOpenAIのSuperalignmentチームによって開発され、自動解釈可能性技術とスパースオートエンコーダを組み合わせたものである。

Andrew Hoblitzell 翻訳者 Takamasa Sugawara
投稿日 2024年3月26日午前1時31分
Cloud

Azure OpenAIの「On Your Data」機能が一般利用可能に

Microsoft社は、Azure OpenAI Serviceで"On Your Data"機能の一般提供を正式に開始した。この機能により、ユーザーはGPT-4を含むOpenAIモデルのフルパワーを活用し、RAG（Retrieval Augmented Generation）モデルの高度な機能をデータとシームレスに統合可能となった。同社によると、これらはすべてAzure上のエンタープライズ・グレードのセキュリティ（プライベート・エンドポイントとVPN経由）に支えられており、安全で保護されたユーザー・データ環境を保証しているという。

Steef-Jan Wiggers 翻訳者 Takamasa Sugawara
投稿日 2024年3月19日午前4時31分
AIと機械学習、データエンジニアリング

RWKVプロジェクト、LLM "Eagle 7B"をオープンソース化

RWKVプロジェクトはこの程、75.2億パラメータの大規模言語モデル（LLM）である、Eagle 7Bをオープンソース化した。Eagle 7Bは、100以上の言語の1.1兆トークンのテキストで学習され、多言語ベンチマークにおいて他の同サイズのモデルを凌駕している。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年3月18日午前7時30分
Cloud

Data Solutions Framework：AWS上でデータソリューションを構築するためのオープンソースプロジェクト

AWSはこの程、Data Solutions Framework (DSF)をリリースした。これは、AWS��でデータソリューションの作成を加速するために設計された、オープンソースのフレームワークである。AWS CDKを使用して構築されたこのフレームワークは、データソリューションを構築するためのビルディングブロックとして抽象化とパターンを公開しており、TypeScript（npm）とPython（PyPi）で利用できる。

Renato Losio 翻訳者 Takamasa Sugawara
投稿日 2024年3月15日午前10時30分
AIと機械学習、データエンジニアリング

Google、開発者向けの新しいオープンソースAIモデル「Gemma」を発表

Googleは、新しいオープンソースのAIモデルであるGemmaを発表した。GoogleのAIモデル「Gemini」を支える技術を用いて開発されたGemmaは、AIアプリケーションを良心的に作成するための高度なツールを開発者に提供することを目的としている。

Daniel Dominguez 翻訳者 Naoko Koshimura
投稿日 2024年3月13日午前12時30分
Cloud

"Google BigQuery"、ベクトル検索を導入

Googleはこの程、BigQueryがベクトル検索をサポートするようになったと発表した。この新機能は、セマンティック検索、類似性検出、大規模言語モデル（LLM）による検索拡張生成（RAG）といったデータやAIのユースケースで必要とされるベクトル類似性検索を可能にする。

Renato Losio 翻訳者 Takamasa Sugawara
投稿日 2024年3月12日午前6時31分
AIと機械学習、データエンジニアリング

Anthropicが生成AIモデル"Claude 3"を発表、"Opus"モデルとその人間に近い能力へ注目集まる

Anthropicは、GPT-4などの他の業界モデルを上回る、Claude 3ファミリーを発表した。Claude 3ファミリーは3つの異なるモデルで構成されている。能力の高い順に、"Opus"、"Sonnet"、"Haiku"の3つのモデルが存在し、それぞれ知能、スピード、コストの面で多様なユーザーニーズに応えるように設計されている。

Daniel Dominguez 翻訳者 Takamasa Sugawara
投稿日 2024年3月12日午前5時31分
デベロップメント

LLM戦略、プラットフォームエンジニアリング、オブザーバビリティなど：InfoQ Dev Summit Boston 2024

ソフトウェア開発の状況は急速に進化しており、一歩先を行くには、戦略的な意思決定を行い、新しいテクノロジーを適切に実装し、チームが効果的にコラボレーションできるようにするための継続的な学習が必要である。6月24～25日に開催されるInfoQ Dev Summit Bostonに参加し、同業者とのネットワークを広げ、生成AI、セキュリティ、モダンWebアプリケーションなどのトピックを含む厳選されたアジェンダを体験しよう。これらの技術の実装に成功し、関連する課題を克服した人々から学び、あなたのプロジェクトの成功に役立てよう。

Artenisa Chatziou 翻訳者 Takamasa Sugawara
投稿日 2024年3月8日午前12時30分
AIと機械学習、データエンジニアリング

Google、2億パラメータのAI予測モデル"TimesFM"を発表

GoogleResearchは、時系列予測を目的とした200MパラメータのTransformerベースの基礎モデルである、TimesFMを発表した。TimesFMは約100Bのデータポイントで学習され、教師あり学習モデルと同等以上のゼロショット予測性能を持つ。

Anthony Alford 翻訳者 Takamasa Sugawara
投稿日 2024年3月7日午前3時30分