継続的な深層学習の評価：画像分類のための新しいベンチマーク

原文(投稿日：2022/02/01)へのリンク

「CLEARベンチマーク：実世界の画像に関する継続的な学習」と呼ばれる新しいデータセットは、継続的な学習における将来の研究のための一貫した画像分類ベンチマークを確立することを目的としている。

機械学習エンジニアリングでは、新しいデータやタスク（新しいラベルなど）を採用するためにディープネットワークを再トレーニングすることがプラクティスとして重要である。課題は、さまざまな領域において明確に現れるであろう。たとえば、時系列予測では、データドリフトが観測されるため、ネットワークトレーニングを定期的に実行する必要がある。そのため、新しいトレーニングがスケジュールされている中で、以前のトレーニングの反復がテスト時のパフォーマンスに長期的なプラスの効果をもたらすことを望む場合がある。コンピュータビジョンでは、分類器に新しいラベルを追加する必要がある。あるいは、分類器をオブジェクト、形状、色、コンテキストの自然な進化と一致させる必要がある。

CLEARベンチマークでは、タイムスタンプ付きのYahoo Flickr Creative Commons 100 Million（別名YFCC100m）データセット画像を使っている。フレームワークとしては、事前ラベル付けにCLIPを使用し、クラウドソーシングによる検証にMTurkを使用する。主な目標は、11のクラスについて、10年以内（2004年から2014年）にオブジェクトの自然な時間変化を含むデータセットを作成することである。これにより新しいアイデアのより現実的な比較が可能になる。以前のベンチマークでは既存のデータセット（Permuted MNIST、Split-MNIST、Split-CIFAR、CORe50など）を変更したものを使っていた。

理論的には、勾配ベースの学習はパラメーター空間でローカルであり、壊滅的忘却として知られているものになりがちである。つまり、機械学習モデルが更新されたときに以前のタスク/データに関してテスト時のパフォーマンスの低下が観察されるのである。実際には、機械学習エンジニアリングの一般的なヒューリスティックは、新しいトレーニング反復内で以前のデータを再生することである。しかし、トレーニング時間の大幅な増加につながるため、あまり効率的ではない（つまり、累積されたデータポイント数と線形に相関する）。そのため、継続的な学習は非常に活発な研究分野になっている。最近、研究グループ間で知識を共有できるようにするために、新しい研究組織も設立された（つまり、グループはモデルとデータ用にAvalancheという名前の共通リポジトリを維持している）。

ベンチマークの詳細については、公式Webページを参照してください。継続的な機械学習の研究について詳しく知るには、次のレビュー記事がすばらしい情報源となる。

作者について

Sabri Bolkar

もっと見るより少なく

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

12のソフトウェア・アーキテクチャの落とし穴とその避け方

AI、ML、データエンジニアリングのInfoQトレンドレポート - 2023年9月

エンジニアリングマネージャーへのアドバイス: 開発者が(より)クリエイティブになれるようにすること

Low Code/No Codeを採用する：確認するべき6つの適性

役に立つリンク集

地域を選ぶ

作者について

Sabri Bolkar

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

開発環境マネージャー Daytonaがオープンソースに

Spring BootによるAPIバックエンド構築実践ガイド第2版

Erlangランタイムの静的型付け関数型言語Gleamがバージョン1.0に到達

QCon London: Trainline社における、マイクロサービスアーキテクチャと技術組織のスケーリング

Decathlon社、Backend for Frontend (BFF)パターンを採用し、フロントエンドチームを強化

HashnodeがStep Functions、EventBridge、RedisでAWS上にスケーラブルなフィードアーキテクチャを構築

ソフトウェアチームにおけるテストの影響

エンジニアリングマネージャーへのアドバイス: 開発者が(より)クリエイティブになれるようにすること

ソフトウェア開発における"実験文化"の育成

Apple社の研究者、異なるLLMを組み合わせて最先端の性能を実現する手法を詳説

Meta社、24000基以上のGPUから成るAIインフラ設計を発表

Databricks、オープンソースの汎用LLM "DBRX" を発表

CNCF、Kubernetes上のKafkaを簡素化するStrimziをインキュベートする

オラクル、ARMとKubernetes 1.28をサポートするOracle Cloud Native 1.8を発表

SUSE、Kubernetesとエッジ管理製品のアップグレードを発表

QCon London

InfoQ Live Roundtable

InfoQ Dev Summit Boston

InfoQ Dev Summit Munich

QCon San Francisco

Login with:

アカウントをお持ちでない方

継続的な深層学習の評価：画像分類のための新しいベンチマーク

作者について

Sabri Bolkar

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連スポンサーコンテンツ

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。