車道線檢測方法的一些近期論文


本文選取了最近發表的車道線檢測論文,都是基于深度學習方法,但考慮的角度有所不同:檢測、分割和后處理等。

1. “Ultra Fast Structure-aware Deep Lane Detection,arXiv 2004.11757,4,2020

車道線檢測任務看成是基于全局圖像特征的行選擇(row selection)分類問題。其中提出一個structural loss 明確建模結構信息,速度很快,300+ FPS。

代碼上線:github.com/cfzd/Ultra-F.

如圖顯示如何選擇行的問題:在每個row anchor水平選擇。

車道線檢測方法的一些近期論文的圖1

設X是全局圖像特征,f是分類器選擇一行的車道線位置,即車道線預測定義為:

車道線檢測方法的一些近期論文的圖2

設T是位置的one-hot編碼,則分類器的優化形式是:LCE是cross entropy loss

車道線檢測方法的一些近期論文的圖3

下圖顯示分割和行選擇的區別:這種方法依賴的是整個圖像的感受野,遠遠大于分割網絡的有限感受野。

車道線檢測方法的一些近期論文的圖4

除了分類損失項,還有對location的建模。文中如此定義lane structural loss:它包括相似性和形狀(直線)的兩個loss函數項

車道線檢測方法的一些近期論文的圖5

其中

車道線檢測方法的一些近期論文的圖6

車道線檢測方法的一些近期論文的圖7

關于lane location

車道線檢測方法的一些近期論文的圖8

不過argmax操作是不能微分的,故此計算改成計算概率

車道線檢測方法的一些近期論文的圖9

這樣lane location變成可微分的操作

車道線檢測方法的一些近期論文的圖10

最終的損失函數為:

車道線檢測方法的一些近期論文的圖11

整個模型架構如圖所示:包括feature extractor,classification-based prediction和auxiliary segmentation task(只在訓練時,聚合局部特征和全局上下文信息)等,group classification在row anchor執行。

車道線檢測方法的一些近期論文的圖12

驗結果如下:直觀例子

車道線檢測方法的一些近期論文的圖13


2 “PolyLaneNet: Lane Estimation via Deep Polynomial Regression“,arXiv 2004.10924,4,2020

PolyLaneNet,采用deep polynomial regression,速度達到115FPS。

代碼上線:?github.com/lucastabelin

如圖是其架構概覽:

車道線檢測方法的一些近期論文的圖14

實驗結果比較如下:

車道線檢測方法的一些近期論文的圖15

該方法的直觀結果:

車道線檢測方法的一些近期論文的圖16


3 “End-to-End Lane Marker Detection via Row-wise Classification“,arXiv 2005.08630,5,2020

傳統方法采取pixel prediction加post processing,而該方法是一種端到端的方式做direct lane marker vertex prediction,無需后處理。作者設計一種新的NN層,逐漸壓縮水平組件,叫horizontal reduction modules (HRMs)。它實現端到端檢測,其中位置基于argmax得到。這個模型叫E2E-LMD,直接預測lane marker vertex。如圖是其框架顯示:

車道線檢測方法的一些近期論文的圖17

E2E-LMD的架構圖如下:

車道線檢測方法的一些近期論文的圖18

其加入連續horizontal reduction modules擴展普通的encoder-decoder architectures。第一步:構建編碼器-解碼器;第二步:逐漸壓縮HRM的水平維度,無需改變垂直維度。最后一步:兩個分支row-wise vertex location branch和vertex wise confidence branch,分類和置信度回歸。

為提高檢測性能,采用了Squeeze and Excitation (SE) block,實現注意機制。如圖是加入SE前后的檢測變化:

車道線檢測方法的一些近期論文的圖19

實驗結果比較如下:

車道線檢測方法的一些近期論文的圖20

這是基于ERFNet主干網的定性檢測結果:

車道線檢測方法的一些近期論文的圖21
車道線檢測方法的一些近期論文的圖22


4. “CurveLane-NAS: Unifying Lane-Sensitive Architecture Search and Adaptive Point Blending“, arXiv 2007.12147,7,2020

華為論文,curve lanes檢測很難,缺乏建模的長時上下文信息和帶細節的彎曲軌跡。提出一個lane-sensitive architecture search framework,CurveLane-NAS,自動獲取長時和短時曲線信息。包括三個部分:a) feature fusion search module,對multi-level hierarchy features找到較好的local and global context 融合 ; b) 彈性的backbone search module,開發帶語義和潛力的 feature extractor; c) adaptive point blending module,搜一個multi-level post processing renfiement strategy,以此組合multi-scale head prediction。

華為的開源車道線數據集CurveLanes:大約150K images,90% 是彎曲車道線 (大概 135K images),相比來說CULane Dataset (大約2.6K images) 和TuSimple Dataset ( 大約3.9K images),如圖是一些比較例子。

車道線檢測方法的一些近期論文的圖23

之前的PointLaneNet 和Line-CNN這兩個方法,還是按照 proposal-based diagram 產生多個point anchor 或者 line proposals。CurveLane-NAS提出一個包括multi-level prediction heads 和 a multi-level feature fusion的搜索空間,包含了long-ranged coherent lane 信息和short-range curve 信息。

如圖檢測算法比較:(a) dense prediction based (SCNN), (b) proposal based (Line-CNN), (c) CurveLane-NAS。

車道線檢測方法的一些近期論文的圖24

NAS是網絡結構參數的自動調優。先定義搜索空間,然后通過搜索策略找出網絡結構,并進行評估,再以此反饋進行下一個迭代的搜索。搜索策略有基于強化學習的方法、基于進化算法的方法和基于梯度的方法等。基于進化算法,CurveLane-NAS設計了一個搜索空間和一個基于樣本的多目標搜索算法,來檢測曲線車道。

下圖是NAS做車道線檢測的流水線架構:前面提到的三個模塊

車道線檢測方法的一些近期論文的圖25

如圖示意Point Blending Search模塊(取代NMS):對每個預測頭,預測每格的offsets和相應的scores。每個lane prediction 可以被offset和point anchors位置來恢復。

車道線檢測方法的一些近期論文的圖26

Adaptive score masking 允許在 multi-level prediction存在多個ROI。point blending 技術可以用準確的局部點取代一些高置信度anchor的預測點。而遠端更細的curve shape則用local points修復。

實驗結果比較如下:

車道線檢測方法的一些近期論文的圖27
車道線檢測方法的一些近期論文的圖28
車道線檢測方法的一些近期論文的圖29

直觀比較圖:

車道線檢測方法的一些近期論文的圖30


5. “Heatmap-based Vanishing Point boosts Lane Detection“,arXiv 2007.15602,7,2020

利用幾何結構信息,vanishing point,提出一個多任務融合框架,基于ERFNet,圖像分割模型,heatmap regression預測車道線的消失點VP。其示意圖如下所示:

車道線檢測方法的一些近期論文的圖31

實驗結果比較如下:

車道線檢測方法的一些近期論文的圖32
車道線檢測方法的一些近期論文的圖33
車道線檢測方法的一些近期論文的圖34


6. “LDNet: End-to-End Lane Detection Approach using a Dynamic Vision Sensor”,arXiv 2009.08020,9, 2020

車道線檢測的挑戰:光照變化、太陽強光、運動模糊等等。這里采用事件攝像頭(event camera)的動態視覺傳感器,提出Lane Detection using dynamic vision sensor (LDNet)。

如圖看普通攝像頭和事件攝像頭的區別:

車道線檢測方法的一些近期論文的圖35

下圖是LDNet的架構:

車道線檢測方法的一些近期論文的圖36

其中采用的空洞SPP:

車道線檢測方法的一些近期論文的圖37

還有Attention模塊結構:

車道線檢測方法的一些近期論文的圖38

下表給出實驗結果比較:

車道線檢測方法的一些近期論文的圖39


7. “RONELD: Robust Neural Network Output Enhancement for Active Lane Detection“,arXiv 2010.09548, 11, 2020

主動車道(active lane)劃定單個道路的空間。檢測的挑戰來自外界的光照和車道自身單調表觀。本文提出的方法實際上是一種增強方法,即real-time robust neural network output enhancement for active lane detection (RONELD)。其利用深度學習模型得到的概率圖,包括以下模塊:自適應車道點檢測、彎曲車道檢測、車道重建和跟蹤等,如圖所示。注:這里采用了兩個模型SCNN和ENet-SAD做實驗。

車道線檢測方法的一些近期論文的圖40

這里是一些增強結果的比較:兩個數據集測試

車道線檢測方法的一些近期論文的圖41

車道線檢測方法的一些近期論文的圖42
車道線檢測方法的一些近期論文的圖43


8. “Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection“,arXiv 2010.12035,11,2020

LaneATT,和Line-CNN一樣的,基于錨點的車道線檢測方法,類似YOLO3和SSD。除了局部信息,也強調全局信息,比如遮擋、缺失或者弱顯示等情況下的處理。該方法實時性強 (速度250FPS),在三個基準數據集測試過:TuSimple, CULane 和 LLAMAS。

其架構如圖:除了錨點的特征池化(類似Fast R-CNN),還有attention機制的采用。

車道線檢測方法的一些近期論文的圖44

如下是結果比較:

車道線檢測方法的一些近期論文的圖45
車道線檢測方法的一些近期論文的圖46
車道線檢測方法的一些近期論文的圖47


9. “End-to-end Lane Shape Prediction with Transformers“,arXiv 2011.04233, 11,2020

無所不在的Transformers,很善于學習全局上下文,針對車道線這種細長結構,直接估計車道線形狀模型,即lane shape model。

代碼上線:liuruijin17/LSTR

用cubic curve定義平坦路面的車道線

車道線檢測方法的一些近期論文的圖48

那么曲線投影到圖像平面變成:(假設光軸和路面平行)

車道線檢測方法的一些近期論文的圖49

如果攝像頭斜著不與路面平行,則:

車道線檢測方法的一些近期論文的圖50

修正的曲線方程變成:

車道線檢測方法的一些近期論文的圖51

Hungarian fitting loss 在預測參數和真值車道線做bipartite matching,找到positives和negatives,很有效。

如圖所示是主干架構:包括一個reduced transformer network, 幾個feed-forward networks (FFNs) 做parameter predictions, 和Hungarian Loss。

車道線檢測方法的一些近期論文的圖52

給定輸入圖像I, 主干提取low-resolution feature,并扁平成 序列S;S和positional embedding Ep 輸入編碼器,輸出表示序列Se;然后解碼器產生輸出序列Sd,其中輸入查詢序列 Sq 和一個學習的positional embedding ELL,然后計算其與Se、Ep的交互,得到特征;最后多個FFNs 直接預測輸出參數。

如圖是編碼器和解碼器結構:

車道線檢測方法的一些近期論文的圖53

實驗結果比較如下表:

車道線檢測方法的一些近期論文的圖54

下圖是TuSimple數據集的比較:

車道線檢測方法的一些近期論文的圖55

下面是在FVL數據集的transfer結果:沒有額外訓練

車道線檢測方法的一些近期論文的圖56


10. “End-to-End Deep Learning of Lane Detection and Path Prediction for Real-Time Autonomous Driving”,arXiv 2102.04738,2,2021

提出three-task convolutional neural network (3TCNN),包括一個bounding box的regression分支、一個Hu moments的regression分支和一個classification分支。其中Hu moments回歸能做車道線定位和道路引導。另外,本文特別點是一個lateral offset-path prediction (PP)模塊,能夠預測駕駛道路,包括車道中心線動態估計和道路曲率估計。

如圖是其實現在TORCS的結構:

車道線檢測方法的一些近期論文的圖57

3TCNN的模型架構如下:

車道線檢測方法的一些近期論文的圖58

實驗結果比較3TCNN和2TCNN(沒有Hu moments分支)如下:

車道線檢測方法的一些近期論文的圖59

而3TCNN-PP集成的結果在TORCS的模擬環境測試性能如下:

車道線檢測方法的一些近期論文的圖60


11 “Robust Lane Detection via Expanded Self Attention“,arXiv 2102.07037,2,2021

本文是采用self attention機制,可用于編碼器-解碼器結構的NN模型,主要就是提取全局信息,在三個基準數據測試TuSimple、CULane和BDD100K。其利用車道線的簡單結構,預測車道線在圖像沿著水平和垂直方向的可信度,分為HESA (Horizontal Expanded Self Attention) 和 (Vertical Expanded Self Attention)。該方法類似SAD,但提出了基于confidence的遮擋解決方法。

ESA結構如下:編碼器和HESA/VESA

車道線檢測方法的一些近期論文的圖61

ESA編碼器-解碼器的NN模型結構如下:

車道線檢測方法的一些近期論文的圖62

一些實驗結果比較如下:三個測試數據集

車道線檢測方法的一些近期論文的圖63
車道線檢測方法的一些近期論文的圖64
車道線檢測方法的一些近期論文的圖65
車道線檢測方法的一些近期論文的圖66

車道線檢測方法的一些近期論文的圖67

登錄后免費查看全文
立即登錄
App下載
技術鄰APP
工程師必備
  • 項目客服
  • 培訓客服
  • 平臺客服

TOP