有條件的模仿學(xué)習(xí)是學(xué)習(xí)端到端駕駛策略的一種有效方法,這種方法可以部署在模擬和現(xiàn)實(shí)城市駕駛場景中。盡管如此,從高維視覺觀察和專家軌跡中學(xué)習(xí)端到端策略仍然是相對非常困難的。已有一些算法試圖通過超越純粹的模仿學(xué)習(xí)來克服這些困難。比如提出迭代數(shù)據(jù)集聚合,其方法是在部署期間可能經(jīng)歷的軌跡收集相應(yīng)的數(shù)據(jù)。其次,還可以使用 BeV 語義分割來監(jiān)督模型,讓學(xué)習(xí)者接觸專家數(shù)據(jù)的綜合擾動,以產(chǎn)生更穩(wěn)健的駕駛策略。