BT

最新技術を追い求めるデベロッパのための情報コミュニティ

寄稿

Topics

地域を選ぶ

InfoQ ホームページ ニュース Wayveの自動運転車向けEnd-to-Endディープラーニングモデル

Wayveの自動運転車向けEnd-to-Endディープラーニングモデル

 

ディープラーニングAI技術に注力するWayveは、CARLAのシミュレーションデータを基に世界モデルと車両の運転方針を学習し、HDマップのない車への自律性を実現する最先端のエンドツーエンドモデルを発表した。

私たちの世界との関わり方は、観察と相互作用によって、知識を蓄積し、予測できない状況に対処できる。私たちは、このような世界の仕組みに対する認識を「常識」と呼び、それによって自分の道を切り開くことができるのだ。また、他人を観察することで、私たちはルールを学び、それに従うことができるようになる。機械学習における同様の概念は、模倣学習と呼ばれる方法で、与えられたタスクに関する人間の行動を模倣するようモデルを学習させることができる。

Wayveの新しいモデルベース模倣学習(MILE)は、機械学習モデル、より具体的には強化学習アーキテクチャで、オフライントレーニング中に世界モデルと運転ポリシーを学習する。

MILEは、多様でもっともらしい未来を想像し、可視化することで、将来の行動を計画できる。

自律運転の動的なエージェントと静的な環境は3次元の幾何学で推論されるため、MILEは、各画像特徴の深度確率分布と、深度ビン、カメラ内部・外部の定義済みグリッドを用いて、車の撮影画像を3次元に変換する。これらの3次元特徴ボクセルは、あらかじめ定義されたグリッドを用いて、サムプールと呼ばれる演算により鳥瞰図に変換される。最終的には1次元ベクトルにマッピングし、ワールドモデルに関する情報を圧縮する。これはエンコーダを定義する処理の一部である。

次の観測では、エンコーダーの出力、鳥瞰図、画像潜像ベクトルといった異なる解像度のアップサンプリング手法を用いたデコーダが作られる。このデコーダのアーキテクチャはStyleGANに非常によく似ている。そしてデコーダは車両制御も出力する。

時間のモデル化には、MILEは潜在状態のダイナミクスをモデル化するリカレントニューラルネットワークを使用し、前の潜在状態に基づいて次の潜在状態を予測する。

このモデルは、過去の文脈から将来の潜在状態を想像し、それを用いて学習した運転方針を用いて行動を計画・予測できる。また、デコーダによって未来の状態を可視化し、解釈できる。

1

出典:都市部におけるモデルベース模倣学習

MILEプロジェクトのトレーニングデータセットのソースは、CARLAシミュレーターの天候や日の異なる条件下での290万フレーム、32時間の運転データである。

Wayveは、CARLA上での走行性能の測定に、ルートコンプリート、違反ペナルティ、ドライビングスコアの3つの指標を用いた。ルート完走率とは、あるシナリオにおいて、運転エージェントがルートを完走した割合のことである。違反ペナルティは、エージェントが犯した様々な違反行為(歩行者・車両・静止物との衝突、赤信号無視など)による乗算ペナルティである。ドライビングスコアは、エージェントが与えられたルートでどれだけ走ったか、またどれだけうまく走ったかを測定する。

2

出典:都市部におけるモデルベース模倣学習

MILEは、LAVRoachTransfuserなどの他のフレームワークと比較して、高い汎化率と優れたドライビングスコアを達成している。

3

出典:都市部におけるモデルベース模倣学習

MILEのもっともらしい未来を想像し、それに従って行動を計画する能力は、モデルが想像の中で車両を制御することを可能にする。これは、世界の最新の観測にアクセスしなくても、モデルが車両をうまく制御できることを意味する。

モデルの重みのダウンロードとPytorchの実装の確認はこちら

フレームワークの制限の1つは、エキスパートドライバーのデータから推論されるのではなく、手動で報酬を与える機能だ。これにより、エージェントは世界モデルの中でナビゲートできるようになるのだ。2つ目の重要な潜在的問題は、将来の状態を予測するために鳥瞰図画像のセグメンテーションに大きく依存していることだ。3つ目の潜在的な改善点は、異なるシナリオに対するモデルの汎化である。

Twitterでは、Wayve feat.の話題で持ちきりだ。

4

5

作者について

この記事に星をつける

おすすめ度
スタイル

BT