Wayveの自動運転車向けEnd-to-Endディープラーニングモデル

ディープラーニングAI技術に注力するWayveは、CARLAのシミュレーションデータを基に世界モデルと車両の運転方針を学習し、HDマップのない車への自律性を実現する最先端のエンドツーエンドモデルを発表した。

私たちの世界との関わり方は、観察と相互作用によって、知識を蓄積し、予測できない状況に対処できる。私たちは、このような世界の仕組みに対する認識を「常識」と呼び、それによって自分の道を切り開くことができるのだ。また、他人を観察することで、私たちはルールを学び、それに従うことができるようになる。機械学習における同様の概念は、模倣学習と呼ばれる方法で、与えられたタスクに関する人間の行動を模倣するようモデルを学習させることができる。

Wayveの新しいモデルベース模倣学習（MILE）は、機械学習モデル、より具体的には強化学習アーキテクチャで、オフライントレーニング中に世界モデルと運転ポリシーを学習する。

MILEは、多様でもっともらしい未来を想像し、可視化することで、将来の行動を計画できる。

自律運転の動的なエージェントと静的な環境は3次元の幾何学で推論されるため、MILEは、各画像特徴の深度確率分布と、深度ビン、カメラ内部・外部の定義済みグリッドを用いて、車の撮影画像を3次元に変換する。これらの3次元特徴ボクセルは、あらかじめ定義されたグリッドを用いて、サムプールと呼ばれる演算により鳥瞰図に変換される。最終的には1次元ベクトルにマッピングし、ワールドモデルに関する情報を圧縮する。これはエンコーダを定義する処理の一部である。

次の観測では、エンコーダーの出力、鳥瞰図、画像潜像ベクトルといった異なる解像度のアップサンプリング手法を用いたデコーダが作られる。このデコーダのアーキテクチャはStyleGANに非常によく似ている。そしてデコーダは車両制御も出力する。

時間のモデル化には、MILEは潜在状態のダイナミクスをモデル化するリカレントニューラルネットワークを使用し、前の潜在状態に基づいて次の潜在状態を予測する。

このモデルは、過去の文脈から将来の潜在状態を想像し、それを用いて学習した運転方針を用いて行動を計画・予測できる。また、デコーダによって未来の状態を可視化し、解釈できる。

出典：都市部におけるモデルベース模倣学習

MILEプロジェクトのトレーニングデータセットのソースは、CARLAシミュレーターの天候や日の異なる条件下での290万フレーム、32時間の運転データである。

Wayveは、CARLA上での走行性能の測定に、ルートコンプリート、違反ペナルティ、ドライビングスコアの3つの指標を用いた。ルート完走率とは、あるシナリオにおいて、運転エージェントがルートを完走した割合のことである。違反ペナルティは、エージェントが犯した様々な違反行為（歩行者・車両・静止物との衝突、赤信号無視など）による乗算ペナルティである。ドライビングスコアは、エージェントが与えられたルートでどれだけ走ったか、またどれだけうまく走ったかを測定する。

出典：都市部におけるモデルベース模倣学習

MILEは、LAV、Roach、Transfuserなどの他のフレームワークと比較して、高い汎化率と優れたドライビングスコアを達成している。

出典：都市部におけるモデルベース模倣学習

MILEのもっともらしい未来を想像し、それに従って行動を計画する能力は、モデルが想像の中で車両を制御することを可能にする。これは、世界の最新の観測にアクセスしなくても、モデルが車両をうまく制御できることを意味する。

モデルの重みのダウンロードとPytorchの実装の確認はこちら。

フレームワークの制限の1つは、エキスパートドライバーのデータから推論されるのではなく、手動で報酬を与える機能だ。これにより、エージェントは世界モデルの中でナビゲートできるようになるのだ。2つ目の重要な潜在的問題は、将来の状態を予測するために鳥瞰図画像のセグメンテーションに大きく依存していることだ。3つ目の潜在的な改善点は、異なるシナリオに対するモデルの汎化である。

Twitterでは、Wayve feat.の話題で持ちきりだ。

作者について

Bruno Santos

もっと見るより少なく

Topics

Spring BootによるAPIバックエンド構築実践ガイド第2版

Netflixで2億3800万人の会員を管理するということ

Pinterestの広告ランキングの仕組みを解き明かす

エンジニアリングマネージャーへのアドバイス: 開発者が(より)クリエイティブになれるようにすること

Low Code/No Codeを採用する：確認するべき6つの適性

役に立つリンク集

地域を選ぶ

作者について

Bruno Santos

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。

関連記事:

関連記事

関連スポンサーコンテンツ

開発環境マネージャー Daytonaがオープンソースに

Spring BootによるAPIバックエンド構築実践ガイド第2版

Erlangランタイムの静的型付け関数型言語Gleamがバージョン1.0に到達

Reddit、"AWS S3"やその他のシステムからメディアメタデータを"AWS Aurora Postgres"に移行

Netflixで2億3800万人の会員を管理するということ

QCon London: Trainline社における、マイクロサービスアーキテクチャと技術組織のスケーリング

ソフトウェアチームにおけるテストの影響

エンジニアリングマネージャーへのアドバイス: 開発者が(より)クリエイティブになれるようにすること

ソフトウェア開発における"実験文化"の育成

コードのための大規模言語モデル：QCon Londonにて、Loubna Ben Allal氏語る

Pinterestの広告ランキングの仕組みを解き明かす

Apple社の研究者、異なるLLMを組み合わせて最先端の性能を実現する手法を詳説

CloudFormation IaC Generator"で、既存のAWSリソースをスキャンしてインポート可能に

Elastic社、OpenTelemetryをプロファイリング・エージェントで強化、システムの健全性に関する洞察をコミュニティと共有する

Netflix、eBPFのパフォーマンス効率向上を目指すbpftopを発表

QCon London

InfoQ Dev Summit Boston

InfoQ Dev Summit Munich

QCon San Francisco

Login with:

アカウントをお持ちでない方

Wayveの自動運転車向けEnd-to-Endディープラーニングモデル

作者について

Bruno Santos

この記事に星をつける

このコンテンツのトピックは AIと機械学習、データエンジニアリング です。

関連記事:

関連記事

関連スポンサーコンテンツ

InfoQ ニュースレター

このコンテンツのトピックは AIと機械学習、データエンジニアリングです。