InfoQ ホームページ MachineLearning に関するすべてのコンテンツ
-
Metaが手がけるオープンソースなComputer Vision基盤モデルDINOv2
Meta AI ResearchはComputer Vision(CV)タスクの基盤モデルであるDINOv2をオープンソース化した。DINOv2は142Mの画像からなるキュレーションデータセットで事前学習されており、画像分類(Image Classification)、ビデオアクション認識(Video Action Recognition)、セマンティックセグメンテーション(Semantic Segmentation)、深度推定(Depth Estimation)などのタスクのバックボーンとして使用できる。
-
半構造化データ変換のためのLLMの効率的な適用について
半構造化(Semi-Structured)データから構造化データを生成するための手段としてLLMは有効だが相応のコストを要する。スタンフォード大学とコーネル大学の研究チームは推論品質を向上させながら、推論コストを110分の1に削減する技術を発見したとしている。
-
Twitterがレコメンデーションアルゴリズムをオープンソース化
Twitterは最近、ユーザーのTwitterタイムラインにツイートをレコメンドするシステムのいくつかのコンポーネントをオープンソース化した。このリリースには、アルゴリズムを実行するいくつかのサービスやジョブのコード、ツイートを埋め込んでランキングする機械学習モデルをトレーニングするコードが含まれている。
-
ML.NETモデルビルダーに文章類似度トレーニングのシナリオを追加
マイクロソフトはモデルビルダーに「Sentence Similarity」シナリオを追加する情報を公開した。このシナリオは文章の類似度モデルのトレーニングを可能にするものだ。このシナリオがモデルビルダーに追加されたことと合わせて、モデルビルダー GPU extensionをインストールする必要がなくなった。さらにマイクロソフトはdeep learning、LightGBM algorithm、AutoMLの分野での開発について、今後数ヶ月の作業について通知している。
-
Stability AIが70億パラメータのオープンソースな言語モデル「StableLM」を公開
Stability AIは、大規模言語モデル(LLM)スイートであるStableLMのための訓練済み重みづけモデルを2セット公開した。これらのモデルは、1.5兆個のテキストトークンで学習済で、CC BY-SA-4.0の下で商用利用が許可されている。
-
責任あるAI ~ 原則から実践へ
QCon Londonカンファレンスにおいて、マイクロソフトのプリンシパルプロダクトマネージャーであるMehrnoosh Sameki氏が"責任あるAI ~ 原則から実践へ"と題して講演した。彼女は責任あるAIの6つの主要な原則と、これらの原則を実践するために不可欠な4つの要素について説明し、Fairlearn、InterpretML、責任あるAI Dashboardなどの有用なツールを紹介した。
-
Google、より効率的なAI学習アルゴリズムを発見するためにAutoMLを使用
Googleの研究者は、自動機械学習(AutoML)進化アルゴリズムによって発見された、ニューラルネットワークを訓練するための最適化アルゴリズムEvoLved sIgn mOmeNtum(Lion)をオープンソース化した。Lionで学習したモデルは他のオプティマイザで学習したモデルよりも、いくつかのベンチマークで高い精度を達成でき、しかも収束に要する計算サイクルは少なくて済む。
-
レスリー・マイリー氏『AI革命は始まったばかりだ、CO2に対して今すぐ行動を!』
QCon Londonカンファレンスの基調講演で、マイクロソフトのCTOであるLeslie Miley氏はAI バイアスと持続可能性と題した講演で大規模なAIや暗号のような変革的な技術は展開に伴ってCO2排出量の増加を伴うと主張した。
-
AWS re:Invent 2022を振り返って
2020年はバーチャルのみ、2021年は規模を縮小して開催されたre:Inventは、ラスベガスで5万人以上の参加者を集め、第11回目を迎えた。AWS最大のカンファレンスで行われた複数のセッションと基調講演で、クラウドプロバイダは新しいサービスや機能を発表したが、その焦点は新しいビルディングブロックよりもビジネスソリューションやデータオプションに当てられていた。
-
AI/MLニュースラウンドアップ OpenAIのGPT-4、MicrosoftのSemantic Kernel、Meta SAMとBloombergGPT
今週 ※1 のラウンドアップは、データサイエンス、機械学習、人工知能の分野から最新のニュースや情報をお届けしたい。本記事ではOpenAI、Microsoft、Meta、Bloombergなど、新たなブレークスルーやイノベーションが注目される市場の主要���競合他社を紹介する。
-
MLOps を拡張および進化させるための戦略と原則 - QCon Londonから
QCon Londonにて、DoorDashのMachine Learning PlatformのシニアエンジニアリングマネージャーHien Luu氏は「Strategies and Principles to Scale and Evolve MLOps at DoorDash」と題した講演で、MLOpsのスケーリングと進化に関する洞察を発表した。Luu氏は,MLシステムが製品に価値を提供しないという,企業が直面しがちな課題を克服するための3つの原則を挙げ、DoorDashにおいてはこれらが有効であったことを説明した。
-
ブルームバーグ、GPTファイナンスに特化したAIモデルを公開
ブルームバーグは、金融セクターの様々な自然言語処理(NLP)活動を支援する、膨大な量の金融データで学習させた新しい大規模言語モデル(LLM)、「BloombergGPT」を発表した。このBlooombergGPTは金融データを迅速に評価し、リスク評価、マーケット・センチメント、さらには会計や監査を自動化できる可能性を秘めている。
-
Google AI、ユニバーサルスピーチモデルをアップデートし、自動音声認識の規模を100言語以上に拡大
Google AIは先日、1,000 Languages Initiativeをサポートするユニバーサルスピーチモデルのアップデートを発表した。このモデルは自動音声認識のすべてのセグメントにおいてOpenAI Whisperよりも優れた性能を発揮する。
-
PyTorch 2.0コンパイラによるモデル学習速度の向上
PyTorch Foundationは100%後方互換のアップデートであるPyTorch version 2.0をリリースした。今回のリリースの目玉、ディープラーニングモデルのコンパイル機能ではトレーニングのスピードアップを実現しており、163個のオープンソースAIプロジェクトにおけるベンチマークではトレーニング中のモデルの動作が平均43%高速化されたことが示された。
-
Doordashが店舗状況の把握に機械学習を導入
DoorDashはユーザー体験を向上して数千件もの注文キャンセルを削減するために、店舗の稼働状況を予測する機械学習モデルを導入している。店舗の稼働状況や注文の受付・処理能力を把握することは、DoorDashのプラットフォームにとって非常に重要だ。DoorDashの各マーケットプレイスは独立して稼働しているので、注文が届かないことを顧客に知らせたり、閉店したマーケットプレイスに他の注文が入るのを避けるためにも営業時間の情報は重要なのである。