継続的な深層学習の評価：画像分類のための新しいベンチマーク

原文(投稿日：2022/02/01)へのリンク

「CLEARベンチマーク：実世界の画像に関する継続的な学習」と呼ばれる新しいデータセットは、継続的な学習における将来の研究のための一貫した画像分類ベンチマークを確立することを目的としている。

機械学習エンジニアリングでは、新しいデータやタスク（新しいラベルなど）を採用するためにディープネットワークを再トレーニングすることがプラクティスとして重要である。課題は、さまざまな領域において明確に現れるであろう。たとえば、時系列予測では、データドリフトが観測されるため、ネットワークトレーニングを定期的に実行する必要がある。そのため、新しいトレーニングがスケジュールされている中で、以前のトレーニングの反復がテスト時のパフォーマンスに長期的なプラスの効果をもたらすことを望む場合がある。コンピュータビジョンでは、分類器に新しいラベルを追加する必要がある。あるいは、分類器をオブジェクト、形状、色、コンテキストの自然な進化と一致させる必要がある。

CLEARベンチマークでは、タイムスタンプ付きのYahoo Flickr Creative Commons 100 Million（別名YFCC100m）データセット画像を使っている。フレームワークとしては、事前ラベル付けにCLIPを使用し、クラウドソーシングによる検証にMTurkを使用する。主な目標は、11のクラスについて、10年以内（2004年から2014年）にオブジェクトの自然な時間変化を含むデータセットを作成することである。これにより新しいアイデアのより現実的な比較が可能になる。以前のベンチマークでは既存のデータセット（Permuted MNIST、Split-MNIST、Split-CIFAR、CORe50など）を変更したものを使っていた。

理論的には、勾配ベースの学習はパラメーター空間でローカルであり、壊滅的忘却として知られているものになりがちである。つまり、機械学習モデルが更新されたときに以前のタスク/データに関してテスト時のパフォーマンスの低下が観察されるのである。実際には、機械学習エンジニアリングの一般的なヒューリスティックは、新しいトレーニング反復内で以前のデータを再生することである。しかし、トレーニング時間の大幅な増加につながるため、あまり効率的ではない（つまり、累積されたデータポイント数と線形に相関する）。そのため、継続的な学習は非常に活発な研究分野になっている。最近、研究グループ間で知識を共有できるようにするために、新しい研究組織も設立された（つまり、グループはモデルとデータ用にAvalancheという名前の共通リポジトリを維持している）。

ベンチマークの詳細については、公式Webページを参照してください。継続的な機械学習の研究について詳しく知るには、次のレビュー記事がすばらしい情報源となる。

作者について

Sabri Bolkar

もっと見るより少なく

InfoQのすべての体験をアンロックして、そのメリットを最大限に活用しましょう

アカウントをお持ちでない方

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

アーキテクチュラル・インテリジェンス – 次のAI

AIトレンドがソフトウェアチームに変革をもたらす

創造的活動：スタッフ・プラスは、「科学」というよりもむしろ「芸術」である

プラットフォーム・エンジニアリングによる開発者エクスペリエンス向上

役に立つリンク集

地域を選ぶ

作者について

Sabri Bolkar

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

VS Code 1.123、サプライチェーン攻撃を抑制するため、拡張機能の更新を2時間遅らせる機能を追加

Anthropicリード：エージェント型ループへの人間の関与維持にはMarkdownよりHTMLが有効に

GitHub社、2026年に向けたよりグローバルでAI課題に直面するオープンソースエコシステムを提示

CloudflareがMCPアーキテクチャを概説、企業がセキュリティとガバナンスリスクに立ち向かう中で

AIがソフトウェアライフサイクルの上流へ：コードレビューからPRDガバナンスへ

CloudflareがProject Thinkを発表：AIエージェント向け永続ランタイム

プラットフォームエンジニアリングのインパクトをドライブし、測定する

エージェンティックAIパターンがエンジニアリング規律を強化

人工知能によって顧客とのつながりはどう変わるか

GoogleのAletheiaが完全自律型AIエージェンティック数学研究の最先端を突き進む

Anthropic解説、Claudeが自身の実行ハーネスを構築する仕組み

DuckDB、HTTPベースのクライアント／サーバープロトコル「Quack」を発表　マルチユーザー分析に対応

AWSが新Amazon EKS Capabilitiesを発表、ワークロードオーケストレーションをシンプル化

Dropbox社、過疎ストレージボリュームから容量を回収する新コンパクション設計を導入

Grafana社は、Kafkaを用いてLokiを再設計し、コーディングエージェントにオブザーバビリティをもたらすCLIをリリース

Online InfoQ Architect Certification

Online InfoQ Engineering Leadership Certification

Online InfoQ AI Security & Privacy Engineering Program

QCon San Francisco

QCon AI New York

QCon London 2027

継続的な深層学習の評価：画像分類のための新しいベンチマーク

作者について

Sabri Bolkar

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連スポンサーコンテンツ

特集コンテンツ一覧

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。