GRI:通用強化模仿學習,用于視覺自動駕駛
瀏覽:2745 收藏:1
arXiv在2021年11月16日上傳論文“GRI: General Reinforced Imitation and its Application to Vision-Based Autonomous Driving“,作者來自法國Valeo公司和MINES ParisTech大學。
-
LBC(“Learning by cheating“. CoRL, 2019) -
IAs(即 前面提到的implicit affordances方法) -
Transfuser+(“Multimodal fusion transformer for end-to-end autonomous driving“. CVPR 2021) -
World on Rails(“Learning to drive from a world on rails“. ICCV 2021)
如果演示數據不是持續最優的,例如,由于給定任務某些方面的專家性能較低,則會出現方法的第一個限制,在獎勵函數中引入噪聲。
方法的第二個限制是在一些困難的環境中出現預熱階段。這種預熱階段可以看作是分布轉移的結果。
-
方法的第三個限制是演示和探索智體收集的一些常見動作獎勵不一致。這會導致來自離線演示智體的數據與來自在線RL探索智體的經驗之間存在某種差異。
技術鄰APP
工程師必備
工程師必備
- 項目客服
- 培訓客服
- 平臺客服
TOP
1




















