車道線檢測方法的一些近期論文

駕駛哥

2021年4月12日 14:22

本文選取了最近發表的車道線檢測論文，都是基于深度學習方法，但考慮的角度有所不同：檢測、分割和后處理等。

1. “Ultra Fast Structure-aware Deep Lane Detection，arXiv 2004.11757，4，2020

車道線檢測任務看成是基于全局圖像特征的行選擇（row selection）分類問題。其中提出一個structural loss 明確建模結構信息，速度很快，300+ FPS。

代碼上線：github.com/cfzd/Ultra-F.

如圖顯示如何選擇行的問題：在每個row anchor水平選擇。

設X是全局圖像特征，f是分類器選擇一行的車道線位置，即車道線預測定義為：

車道線檢測方法的一些近期論文的圖2

設T是位置的one-hot編碼，則分類器的優化形式是：LCE是cross entropy loss

車道線檢測方法的一些近期論文的圖3

下圖顯示分割和行選擇的區別：這種方法依賴的是整個圖像的感受野，遠遠大于分割網絡的有限感受野。

除了分類損失項，還有對location的建模。文中如此定義lane structural loss：它包括相似性和形狀（直線）的兩個loss函數項

車道線檢測方法的一些近期論文的圖5

其中

車道線檢測方法的一些近期論文的圖6

車道線檢測方法的一些近期論文的圖7

關于lane location

車道線檢測方法的一些近期論文的圖8

不過argmax操作是不能微分的，故此計算改成計算概率

車道線檢測方法的一些近期論文的圖9

這樣lane location變成可微分的操作

車道線檢測方法的一些近期論文的圖10

最終的損失函數為：

車道線檢測方法的一些近期論文的圖11

整個模型架構如圖所示：包括feature extractor，classification-based prediction和auxiliary segmentation task（只在訓練時，聚合局部特征和全局上下文信息）等，group classification在row anchor執行。

實驗結果如下：直觀例子

2 “PolyLaneNet: Lane Estimation via Deep Polynomial Regression“，arXiv 2004.10924，4，2020

PolyLaneNet，采用deep polynomial regression，速度達到115FPS。

代碼上線：?github.com/lucastabelin

如圖是其架構概覽：

實驗結果比較如下：

該方法的直觀結果：

3 “End-to-End Lane Marker Detection via Row-wise Classification“，arXiv 2005.08630，5，2020

傳統方法采取pixel prediction加post processing，而該方法是一種端到端的方式做direct lane marker vertex prediction，無需后處理。作者設計一種新的NN層，逐漸壓縮水平組件，叫horizontal reduction modules (HRMs)。它實現端到端檢測，其中位置基于argmax得到。這個模型叫E2E-LMD，直接預測lane marker vertex。如圖是其框架顯示：

E2E-LMD的架構圖如下：

其加入連續horizontal reduction modules擴展普通的encoder-decoder architectures。第一步：構建編碼器-解碼器；第二步：逐漸壓縮HRM的水平維度，無需改變垂直維度。最后一步：兩個分支row-wise vertex location branch和vertex wise confidence branch，分類和置信度回歸。

為提高檢測性能，采用了Squeeze and Excitation (SE) block，實現注意機制。如圖是加入SE前后的檢測變化：

實驗結果比較如下：

這是基于ERFNet主干網的定性檢測結果：

4. “CurveLane-NAS: Unifying Lane-Sensitive Architecture Search and Adaptive Point Blending“， arXiv 2007.12147，7，2020

華為論文，curve lanes檢測很難，缺乏建模的長時上下文信息和帶細節的彎曲軌跡。提出一個lane-sensitive architecture search framework，CurveLane-NAS，自動獲取長時和短時曲線信息。包括三個部分：a) feature fusion search module，對multi-level hierarchy features找到較好的local and global context 融合 ; b) 彈性的backbone search module，開發帶語義和潛力的 feature extractor; c) adaptive point blending module，搜一個multi-level post processing renfiement strategy，以此組合multi-scale head prediction。

華為的開源車道線數據集CurveLanes：大約150K images，90% 是彎曲車道線 (大概 135K images)，相比來說CULane Dataset (大約2.6K images) 和TuSimple Dataset ( 大約3.9K images)，如圖是一些比較例子。

車道線檢測方法的一些近期論文的圖23

之前的PointLaneNet 和Line-CNN這兩個方法，還是按照 proposal-based diagram 產生多個point anchor 或者 line proposals。CurveLane-NAS提出一個包括multi-level prediction heads 和 a multi-level feature fusion的搜索空間，包含了long-ranged coherent lane 信息和short-range curve 信息。

如圖檢測算法比較：(a) dense prediction based (SCNN), (b) proposal based (Line-CNN), (c) CurveLane-NAS。

車道線檢測方法的一些近期論文的圖24

NAS是網絡結構參數的自動調優。先定義搜索空間，然后通過搜索策略找出網絡結構，并進行評估，再以此反饋進行下一個迭代的搜索。搜索策略有基于強化學習的方法、基于進化算法的方法和基于梯度的方法等。基于進化算法，CurveLane-NAS設計了一個搜索空間和一個基于樣本的多目標搜索算法，來檢測曲線車道。

下圖是NAS做車道線檢測的流水線架構：前面提到的三個模塊

如圖示意Point Blending Search模塊（取代NMS）：對每個預測頭，預測每格的offsets和相應的scores。每個lane prediction 可以被offset和point anchors位置來恢復。

Adaptive score masking 允許在 multi-level prediction存在多個ROI。point blending 技術可以用準確的局部點取代一些高置信度anchor的預測點。而遠端更細的curve shape則用local points修復。

實驗結果比較如下：

直觀比較圖：

5. “Heatmap-based Vanishing Point boosts Lane Detection“，arXiv 2007.15602，7，2020

利用幾何結構信息，vanishing point，提出一個多任務融合框架，基于ERFNet，圖像分割模型，heatmap regression預測車道線的消失點VP。其示意圖如下所示：

實驗結果比較如下：

6. “LDNet: End-to-End Lane Detection Approach using a Dynamic Vision Sensor”，arXiv 2009.08020，9， 2020

車道線檢測的挑戰：光照變化、太陽強光、運動模糊等等。這里采用事件攝像頭（event camera）的動態視覺傳感器，提出Lane Detection using dynamic vision sensor (LDNet)。

如圖看普通攝像頭和事件攝像頭的區別：

下圖是LDNet的架構：

其中采用的空洞SPP：

車道線檢測方法的一些近期論文的圖37

還有Attention模塊結構：

車道線檢測方法的一些近期論文的圖38

下表給出實驗結果比較：

7. “RONELD: Robust Neural Network Output Enhancement for Active Lane Detection“，arXiv 2010.09548， 11， 2020

主動車道（active lane）劃定單個道路的空間。檢測的挑戰來自外界的光照和車道自身單調表觀。本文提出的方法實際上是一種增強方法，即real-time robust neural network output enhancement for active lane detection (RONELD)。其利用深度學習模型得到的概率圖，包括以下模塊：自適應車道點檢測、彎曲車道檢測、車道重建和跟蹤等，如圖所示。注：這里采用了兩個模型SCNN和ENet-SAD做實驗。

這里是一些增強結果的比較：兩個數據集測試

車道線檢測方法的一些近期論文的圖41

8. “Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection“，arXiv 2010.12035，11，2020

LaneATT，和Line-CNN一樣的，基于錨點的車道線檢測方法，類似YOLO3和SSD。除了局部信息，也強調全局信息，比如遮擋、缺失或者弱顯示等情況下的處理。該方法實時性強（速度250FPS），在三個基準數據集測試過：TuSimple, CULane 和 LLAMAS。

其架構如圖：除了錨點的特征池化（類似Fast R-CNN），還有attention機制的采用。

如下是結果比較：

9. “End-to-end Lane Shape Prediction with Transformers“，arXiv 2011.04233， 11，2020

無所不在的Transformers，很善于學習全局上下文，針對車道線這種細長結構，直接估計車道線形狀模型，即lane shape model。

代碼上線：liuruijin17/LSTR

用cubic curve定義平坦路面的車道線

車道線檢測方法的一些近期論文的圖48

那么曲線投影到圖像平面變成：（假設光軸和路面平行）

車道線檢測方法的一些近期論文的圖49

如果攝像頭斜著不與路面平行，則：

修正的曲線方程變成：

車道線檢測方法的一些近期論文的圖51

Hungarian fitting loss 在預測參數和真值車道線做bipartite matching，找到positives和negatives，很有效。

如圖所示是主干架構：包括一個reduced transformer network, 幾個feed-forward networks (FFNs) 做parameter predictions, 和Hungarian Loss。

車道線檢測方法的一些近期論文的圖52

給定輸入圖像I, 主干提取low-resolution feature，并扁平成序列S；S和positional embedding Ep 輸入編碼器，輸出表示序列Se；然后解碼器產生輸出序列Sd，其中輸入查詢序列 Sq 和一個學習的positional embedding ELL，然后計算其與Se、Ep的交互，得到特征；最后多個FFNs 直接預測輸出參數。

如圖是編碼器和解碼器結構：

實驗結果比較如下表：

下圖是TuSimple數據集的比較：

下面是在FVL數據集的transfer結果：沒有額外訓練

10. “End-to-End Deep Learning of Lane Detection and Path Prediction for Real-Time Autonomous Driving”，arXiv 2102.04738，2，2021

提出three-task convolutional neural network (3TCNN)，包括一個bounding box的regression分支、一個Hu moments的regression分支和一個classification分支。其中Hu moments回歸能做車道線定位和道路引導。另外，本文特別點是一個lateral offset-path prediction （PP）模塊，能夠預測駕駛道路，包括車道中心線動態估計和道路曲率估計。

如圖是其實現在TORCS的結構：

3TCNN的模型架構如下：

車道線檢測方法的一些近期論文的圖58

實驗結果比較3TCNN和2TCNN（沒有Hu moments分支）如下：

車道線檢測方法的一些近期論文的圖59

而3TCNN-PP集成的結果在TORCS的模擬環境測試性能如下：

車道線檢測方法的一些近期論文的圖60

11 “Robust Lane Detection via Expanded Self Attention“，arXiv 2102.07037，2，2021

本文是采用self attention機制，可用于編碼器-解碼器結構的NN模型，主要就是提取全局信息，在三個基準數據測試TuSimple、CULane和BDD100K。其利用車道線的簡單結構，預測車道線在圖像沿著水平和垂直方向的可信度，分為HESA (Horizontal Expanded Self Attention) 和 (Vertical Expanded Self Attention)。該方法類似SAD，但提出了基于confidence的遮擋解決方法。

ESA結構如下：編碼器和HESA/VESA