CMRNet++:在激光雷達地圖中與地圖和相機無關的單目視覺定位
定位是自主機器人的一個關鍵要素.雖然深度學習在許多計算機視覺任務中取得了較大進步,但它仍然沒有較大改進提高度量視覺定位.主要障礙之一是現有的基于卷積神經網絡的姿態回歸方法不能推廣到以前看不到的地方,我們最近推出的CMRNet通過在激光雷達地圖中啟用地圖獨立單目定位有效地解決了這一限制.在本文中,我們現在通過引入CMRNet++.
CMRNet++是一個顯著更魯棒的模型,它不僅有效地推廣到新的地方,而且獨立于相機參數.我們通過將深度學習與幾何技術相結合,并將度量推理移出學習過程來實現這一能力.這樣網絡的權重就不會綁定到特定的攝像頭.在三個具有挑戰性的自主駕駛數據集(即KITTI、Argoverse和Lyft5)上對CMRNet++進行的廣泛評估表明,CMRNet++的性能遠遠優于CMRNet以及其他系統.更重要的是,我們首次展示了深度學習方法的能力,無需在全新的環境中進行任何再訓練或微調,就能準確定位,并且不受攝像機參數的影響.
我們通過訓練CMRNet++的三個實例,采用了第二節中介紹的迭代精化方法。為了模擬初始姿態Hinit,我們向地面真實姿態HGT的所有分量添加均勻隨機噪聲,對于每個樣本都是獨立的。對于平移和旋轉,我們在第一次迭代中添加的噪聲范圍分別為[±2m]和[ ±10 °]。第二次和第三次迭代的最大范圍分別為[± 1m,±2°]和[±0.6 m,±1°]
為了提高我們方法的泛化能力,我們采用了一種數據擴充方案。首先,我們通過隨機改變對比度、飽和度和亮度來對圖像應用顏色抖動。隨后,我們隨機水平鏡像圖像,并相應地修改相機校準。然后我們在[-5°,5° ]范圍內隨機旋轉圖像。最后,在生成激光雷達圖像之前,我們轉換激光雷達點云以反映這些變化。
總而言之,我們訓練CMRNet++的每個實例如下
工程師必備
- 項目客服
- 培訓客服
- 平臺客服
TOP




















