InfoQ ホームページ MachineLearning に関するすべてのコンテンツ
-
Meta社のChameleon AIモデルは、画像・テキスト混合タスクでGPT-4を上回るパフォーマンスを発揮する
Meta社のAI基盤研究(FAIR)チームはこのほど、テキストと画像が混在したコンテンツを理解・生成できる混合モーダルAIモデル「Chameleon」を発表した。人間の審査員によって評価された実験では、Chameleonの生成出力はGPT-4よりも51.6%、Gemini Proよりも60.4%で好まれた。
-
AIとソフトウェア開発:InfoQイベントでのセッションプレビュー
AIはソフトウェア開発の形を変えつつある。InfoQが今後開催するイベントでは、シニア・ソフトウェア開発者が、この変革的テクノロジーに関する実践的なアプリケーションと倫理的な考察を共有する。以下はそのプレビューである。
-
OpenAI、動作のファインチューニングのためのGPTモデル仕様を公開
OpenAIは最近、GPTモデルの動作に関するルールと目的を記述した文書、Model Specを公開した。この仕様書は、データ・ラベラーやAI研究者がモデルをファインチューニングするためのデータを作成する際に使用することを目的としている。
-
ワシントン大学のAIを搭載したヘッドフォンで、群衆の中の一人の声を聞き取ることが容易に
"ターゲット・スピーチ・ヒアリング "は、ワシントン大学で開発された新しいディープラーニング・アルゴリズムで、ユーザーが話者を"登録"し、その声を取り巻く環境ノイズをすべてキャンセルする。
-
Stability AIが3Dモデル生成AI "Stable Video 3D"をリリース
Stability AIはこのほど、1枚の2D画像から3Dメッシュオブジェクトモデルを生成できるAIモデル、"Stable Video 3D"(SV3D)をリリースした。SV3DはStable Video Diffusionモデルに基づいており、3Dオブジェクト生成ベンチマークで最先端の結果を出している。
-
Amazon Q BusinessとAmazon Q Developerが一般提供開始
AWSはこのほど、企業や開発者向けにカスタマイズされた生成AI搭載のアシスタントAmazon Qの一般提供を発表した。Amazon Q Developerは、リアルタイムでコードの提案や推奨を提供し、Amazon Q Businessは、企業が構造化および非構造化データから洞察を得ることを可能にする。
-
Hugging Face社、ロボット工学のためのオープンソース機械学習モデル「LeRobot」を発表
Hugging Face社は、実世界のロボット工学アプリケーション用に学習された新しい機械学習���デル、LeRobotを発表した。LeRobotはプラットフォームとして機能し、データ共有、視覚化、高度なモデルのトレーニングのための多用途ライブラリを提供する。
-
ベースラインOpenAIエンドツーエンドチャットリファレンスアーキテクチャ
Microsoftは、ベースラインOpenAIエンドツーエンドチャットリファレンスアーキテクチャを公開した。このベースラインには、コンポーネント、フロー、セキュリティに関する情報が含まれている。また、パフォーマンス、モニタリング、デプロイメントガイダンスに関する詳細もある。さらに、Microsoftはソリューションをデプロイして実行するためのリファレンス実装を用意した。
-
"Mistral Large"基盤モデル、Amazon Bedrockにて利用可能に
AWSは、先日のAWS Paris Summitにおいて、Mistral Large基盤モデルがAmazon Bedrock上で利用可能になったことを発表した。この発表は、Amazon Bedrock上でのMistral AIモデルのリリースの数日後に行われた。
-
OpenAIが新たなファインチューニングAPI機能をリリース
OpenAIは、ファインチューニングAPIの新機能リリースを発表した。この機能により、モデル開発者はファインチューニングプロセスをよりコントロールできるだけでなく、モデルのパフォーマンスをより深く理解しやすくなるだろう。
-
GoogleがAgent Builder、拡張Gemini 1.5、オープンソース追加を発表
Googleは、Google Cloud Next 2024イベントにおいて、Vertex AI Agent Builderの開始、Googleのもっとも先進的な生成AIモデルであるGemini 1.5 Proのパブリックプレビュー、Vertex AIプラットフォームへのオープンソース言語モデルの追加を発表した。
-
Airbnb、ML機能プラットフォームChrononをオープンソース化
生データをML対応フィーチャーに変換するために必要なインフラを構築するためのAirbnbのプラットフォームChrononがオープンソース化した。AirbnbのMLインフラエンジニアであるVarant Zanoyan氏が説明するように、Chrononは様々なデータソースをサポートし、低レイテンシーのストリーミングを提供することを目指している。
-
Google、ユーザーインターフェースとインフォグラフィックスを理解するAIモデル「ScreenAI」を育成
Google Researchは先日、インフォグラフィックスとユーザーインターフェースを理解するためのマルチモーダルAIモデル「ScreenAI」を開発した。ScreenAIはPaLIアーキテクチャをベースにしており、いくつもの課題において最先端の性能を記録している。
-
Meta社、24000基以上のGPUから成るAIインフラ設計を発表
Meta社はこの程、2つの新しいAIコンピューティング・クラスターの設計を発表し、それぞれ24,576基のGPUを搭載している。これらのクラスタはMeta社のGrand Tetonハードウェア・プラットフォームに基づいており、1つのクラスタは現在Meta社の次世代モデルである、"Llama 3"のトレーニングに使用されている。
-
研究者らが、LLMジェイルブレイク攻撃の防御アルゴリズム"SafeDecoding"のオープンソース化を発表
ワシントン大学、ペンシルバニア州立大学、アレンAI研究所の研究者が、大規模言語モデル(LLM)をジェイルブレイク攻撃から守る技術である、"SafeDecoding"のオープンソース化を発表した。SafeDecodingは、大きな計算オーバーヘッドを発生させることなく、ベースラインのジェイルブレイク防御を上回る性能を発揮する。