自動駕駛中的機器學習

駕駛哥

2021年9月28日 09:32

瀏覽：2350 收藏：1

作者 | Denis Chikurtev

譯者 | 馬超（責編:晉兆雨）

來源 | CSDN（ID：CSDNnews）

以下為譯文：

近年來，自動駕駛技術技術的發展速度非常快。預計達到完全自動駕駛L5的程度是指日可待的。自動駕駛的核心技術主要是人工智能中的機器學習與深度學習兩個方向。在本文中，我們的關注點在于機器學習算法在自動駕駛技術中的應用。

為了讓讀者更好地理解自動駕駛中的機器學習算法，本文會首先介紹有關該設備和自動駕駛技術的運行原理，然后介紹機器學習方法及其在自動駕駛任務中的應用。最后展示一些流行的自動駕駛技術模擬器。

關于自動駕駛技術

自動駕駛技術的目的在于解除汽車對駕駛員的需求，部署了自動駕駛技術的汽車能夠完全獨立自主的地把汽車從一個地點駕駛到另一個地點。為了能夠完成這項復雜的任務，這些汽車需要配備額外的硬件和軟件系統，幫助AI系統了解環境、做出決策并采取行動。自動駕駛技術需要回答以下個問題。

1.自動駕駛技術如何看到？

自動駕駛技術主要使用攝像頭、普通雷達和激光雷達三種傳感器，它們就像人眼和大腦一樣協同工作。它們共同為汽車提供了清晰的環境視圖。幫助汽車識別附近物體的位置、速度和 3維形態。此外，目前依靠的自動駕駛技術現在正在建設慣性測量單元，可以監測和控制汽車的加速度和位置。

2.自動駕駛技術如何做出決策？

在通過傳感器識別到周邊物體之后，自動駕駛的決策系統一般通過聚類算法將周邊物體進行聚類，并根據物體位置做出決策。

接下來我們來展示一下自動駕駛控制系統的工作原理，控制系統主要進行場景理解和決策規劃兩方面工作，系統主要的工作步驟如下：

傳感器： 從環境中收集傳感器數據；

感知和定位： 識別和定位物體和標記；

場景表示： 了解環境參數和特征；

規劃決策： 路徑和運動規劃，根據駕駛策略尋找最優軌跡；

控制： 設置必要的車輛加速、減速、轉向和制動參數。

AVs 控制系統的主要組件

自動駕駛中的強化學習與監督學習

機器學習是指計算機程序通過已知經驗數據中進行訓練，通過迭代訓練以提高其在指定任務上預測準確性的過程。機器學習算法通常分為三大類流派，分別是監督學習、無監督學習和強化學習 (RL)。監督學習算法基于歸納推理，通常需要使用有標記的數據進行訓練，以執行分類或回歸，而無監督學習一般應用于未標記數據的密度估計或聚類等技術。相比之下強化學習比較自成一派，其通過與環境交互來提高其在指定任務上的性能，與監督和非監督學習使用損失函數進行迭代訓練的方式不同，強化學習一般使用獎勵函數進行訓練，比如OpenAI與王者榮耀的絕悟AI都屬于強化學習的范疇，一般在電競、機器人等方向上應用較多。

根據各類機器學習算法的特點，可以看出在“場景理解”的相關任務中，使用監督學習算法比較合適，而在“決策與規劃”任務中，又非強化學習算法莫屬。

在實際工作中，監督學習為強化學習提供了必要的環境信息，監督學習算法一般將“場景理解”的結果，輸入到強化學習模型當中，在監督學習的加持下，強化學習可以完成方向盤操作優化、路徑規劃和軌跡優化、動態路徑規劃、基于場景的高速公路及交叉路口的合并與拆分等等高難度自動駕駛任務，通過來自專家系統的逆向強化學習，增加對于行人、車輛等交通參與者的意圖預測，并確保安全操作的執行優先級。

用于自動駕駛的流行算法

SIFT

SIFT算法一般用于特征提取，該算法檢測對象并解釋圖像。例如，對于三角形標志，以標志的三個頂點作為特征輸入，自動駕駛系統可以通過這些點來識別標志。

梯度提升

不同于在神經網絡中使用的梯度下降算法，梯度提升是一種用于回歸、分類和其他任務的技術，它一般以決策樹等弱預測模型基礎生成新的預測模型，其分類性能通常優于隨機森林。梯度提升與下文即將出場的AdaBoost算法工作原理類似。

AdaBoost

該算法收集數據并對其進行分類，以提高自動駕駛系統的性能。它將各種低性能分類器進行分組，根據當前迭代中的實際性能自動調整其參數，以獲得高性能分類器。在實踐中，AdaBoost技術與簡單的分類樹或樹樁作為基學習器一般合并使用，與其他單個基學習器的分類相比，這樣的方式提高了性能。

TextonBoost

TextonBoost 算法的工作原理與 AdaBoost 類似，只是它接收來形狀、上下文和外觀的數據。

HOG

HOG 是一種特征描述符，常用于從圖像數據中的特征提取。HOG 一般用于分析對象的位置，以了解對象如何變化或移動。實際操作中HOG方法主要用于人臉和圖像檢測來對圖像進行分類，還能用于識別并分類車輛類型。

YOLO

YOLO算法對于對象分類，如將圖像中的行人、樹木和車輛進行分類。YOLO使用卷積神經網絡，這使其非常適合理解空間信息，并能夠提取邊緣、線條和紋理等特征。YOLO有 24 個卷積層。當激光雷達與 YOLO配合使用時，可以在擁擠的交通環境下進行導航。

用于算法測試和訓練的模擬器和數據集

模擬器是用于試驗自動駕駛系統的利器，特別是對于強化學習其意義更為明顯。主流的模擬器如下：

CARLA – 城市模擬器，包含攝像頭和激光雷達的信息流，有語義分割、位置信息。

TORCS – 賽車模擬器，包括攝像頭、代理位置、車輛測試控制策略。

AIRSIM – 具有深度和語義的攝像頭的數據流，并且支持無人機的自動駕駛測試。

GAZEBO (ROS) – 多機器人物理模擬器，用于復雜的二維和三維地圖中進行路徑規劃和車輛控制的測試。

SUMO – 城市交通的宏觀尺度建模，用于運動規劃測試使用。

DeepDrive – 一個基于虛幻平臺搭建的自動駕駛模擬器，提供多攝像頭數據。NVIDIA DRIVE Sim? –一種是開放、可擴展、模塊化的模擬器，支持從頭開始構建以運行大規模、物理精確的多傳感器仿真。

WEBOTS – 一個完整的開發環境，可以用來建模、編程和模擬測試。

寫在最后

機器學習在自動駕駛領域發揮著重要作用。在這篇文章中，我們介紹了自動駕駛技術的一些基本知識，以及機器學習算法在自動駕駛系統中的應用，還簡要說明了一些在實踐中比較流行的算法以及一些用于自動駕駛測試的模擬器。最后我們可以得出結論，自動駕駛具有實現完全自主L5級別的潛力。這可能會減少道路交通事故，讓那些無法開車的人獨立，從而改善交通物流。

原文鏈接：

https://pereliksoft.com/index.php/2021/07/08/machine-learning-in-autonomous-vehicles/

自動駕駛中的機器學習的圖2