
發(fā)布
注冊(cè)
/
登錄視覺(jué)輔助定位
關(guān)注創(chuàng)建者:匿名 創(chuàng)建時(shí)間:2026-01-05

視覺(jué)輔助定位的實(shí)例教程
隨著機(jī)器視覺(jué)的應(yīng)用,我們不難發(fā)現(xiàn),機(jī)器視覺(jué)的應(yīng)用大大的提高了產(chǎn)品的質(zhì)量、降低了人口紅利并能在一定程度上降低生產(chǎn)成本,帶動(dòng)生產(chǎn)加工業(yè)走向自動(dòng)化、智能化的道路。在機(jī)器視覺(jué)的應(yīng)用中,物體特征的提取和尺寸的精確定位及測(cè)量是生產(chǎn)線(xiàn)上不可替代的環(huán)節(jié)。
end
本文是該系列文章中的第二篇,旨在介紹深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域四大基本任務(wù)中的應(yīng)用,包括分類(lèi)(圖a)、定位、檢測(cè)(圖b)、語(yǔ)義分割(圖c)、和實(shí)例分割(圖d)。后續(xù)文章將關(guān)注深度學(xué)習(xí)在計(jì)算機(jī)視覺(jué)領(lǐng)域的其他任務(wù)的應(yīng)用,以及自然語(yǔ)言處理和語(yǔ)音識(shí)別。
計(jì)算機(jī)視覺(jué)(computer vision)簡(jiǎn)介
計(jì)算機(jī)視覺(jué)旨在識(shí)別和理解圖像/視頻中的內(nèi)容。其誕生于1966年MIT AI Group的"the summer vision project"。當(dāng)時(shí),人工智能其他分支的研究已經(jīng)有一些初步成果。由于人類(lèi)可以很輕易地進(jìn)行視覺(jué)認(rèn)知,MIT的教授們希望通過(guò)一個(gè)暑期項(xiàng)目解決計(jì)算機(jī)視覺(jué)問(wèn)題。當(dāng)然,計(jì)算機(jī)視覺(jué)沒(méi)有被一個(gè)暑期內(nèi)解決,但計(jì)算機(jī)視覺(jué)經(jīng)過(guò)50余年發(fā)展已成為一個(gè)十分活躍的研究領(lǐng)域。如今,互聯(lián)網(wǎng)上超過(guò)70%的數(shù)據(jù)是圖像/視頻,全世界的監(jiān)控?cái)z像頭數(shù)目已超過(guò)人口數(shù),每天有超過(guò)八億小時(shí)的監(jiān)控視頻數(shù)據(jù)生成。如此大的數(shù)據(jù)量亟待自動(dòng)化的視覺(jué)理解與分析技術(shù)。
計(jì)算機(jī)視覺(jué)的難點(diǎn)在于語(yǔ)義鴻溝。這個(gè)現(xiàn)象不僅出現(xiàn)在計(jì)算機(jī)視覺(jué)領(lǐng)域,Moravec悖論發(fā)現(xiàn),高級(jí)的推理只需要非常少的計(jì)算資源,而低級(jí)的對(duì)外界的感知卻需要極大的計(jì)算資源。要讓計(jì)算機(jī)如成人般地下棋是相對(duì)容易的,但是要讓電腦有如一歲小孩般的感知和行動(dòng)能力卻是相當(dāng)困難甚至是不可能的。
語(yǔ)義鴻溝(semantic gap) 人類(lèi)可以輕松地從圖像中識(shí)別出目標(biāo),而計(jì)算機(jī)看到的圖像只是一組0到255之間的整數(shù)。
計(jì)算機(jī)視覺(jué)任務(wù)的其他困難 拍攝視角變化、目標(biāo)占據(jù)圖像的比例變化、光照變化、背景融合、目標(biāo)形變、遮擋等。
計(jì)算機(jī)視覺(jué)的頂級(jí)會(huì)議和期刊 頂級(jí)會(huì)議有CVPR、ICCV、和ECCV,此外ICLR也有不少計(jì)算機(jī)視覺(jué)論文。頂級(jí)期刊有IJCV和TPAMI。
展開(kāi) Localization Accuracy
對(duì)于自主駕駛?cè)蝿?wù),我們重點(diǎn)關(guān)注X、Y方向和偏航(航向)角度的定位精度。與激光雷達(dá)比較的詳細(xì)結(jié)果如下。可以看出,所提出的基于視覺(jué)的定位比基于激光雷達(dá)的解決方案更好。
Conclusion & Future work
在本文中,我們提出了一個(gè)新穎的語(yǔ)義定位系統(tǒng),它充分利用了傳感器豐富的車(chē)輛(如機(jī)器人出租車(chē)),使低成本的生產(chǎn)汽車(chē)受益。整個(gè)框架由車(chē)上建圖、云上更新和用戶(hù)端定位程序組成。我們強(qiáng)調(diào),這是一個(gè)可靠而實(shí)用的自主駕駛定位解決方案。
建議的系統(tǒng)利用了路面上的標(biāo)記。事實(shí)上,三維空間中更多的交通元素可用于定位,如交通燈、交通標(biāo)志和電線(xiàn)桿。在未來(lái),我們將把更多的三維語(yǔ)義特征擴(kuò)展到地圖中。
展開(kāi) 摘要
定位是自主機(jī)器人的一個(gè)關(guān)鍵要素.雖然深度學(xué)習(xí)在許多計(jì)算機(jī)視覺(jué)任務(wù)中取得了較大進(jìn)步,但它仍然沒(méi)有較大改進(jìn)提高度量視覺(jué)定位.主要障礙之一是現(xiàn)有的基于卷積神經(jīng)網(wǎng)絡(luò)的姿態(tài)回歸方法不能推廣到以前看不到的地方,我們最近推出的CMRNet通過(guò)在激光雷達(dá)地圖中啟用地圖獨(dú)立單目定位有效地解決了這一限制.在本文中,我們現(xiàn)在通過(guò)引入CMRNet++.
CMRNet++是一個(gè)顯著更魯棒的模型,它不僅有效地推廣到新的地方,而且獨(dú)立于相機(jī)參數(shù).我們通過(guò)將深度學(xué)習(xí)與幾何技術(shù)相結(jié)合,并將度量推理移出學(xué)習(xí)過(guò)程來(lái)實(shí)現(xiàn)這一能力.這樣網(wǎng)絡(luò)的權(quán)重就不會(huì)綁定到特定的攝像頭.在三個(gè)具有挑戰(zhàn)性的自主駕駛數(shù)據(jù)集(即KITTI、Argoverse和Lyft5)上對(duì)CMRNet++進(jìn)行的廣泛評(píng)估表明,CMRNet++的性能遠(yuǎn)遠(yuǎn)優(yōu)于CMRNet以及其他系統(tǒng).更重要的是,我們首次展示了深度學(xué)習(xí)方法的能力,無(wú)需在全新的環(huán)境中進(jìn)行任何再訓(xùn)練或微調(diào),就能準(zhǔn)確定位,并且不受攝像機(jī)參數(shù)的影響.
介紹
自動(dòng)移動(dòng)機(jī)器人,如自動(dòng)駕駛汽車(chē),需要精確定位才能安全導(dǎo)航。雖然全球?qū)Ш叫l(wèi)星系統(tǒng)提供全球定位,但其精度和可靠性不足以用于機(jī)器人導(dǎo)航。
展開(kāi) 來(lái)源 |
衛(wèi)星導(dǎo)航國(guó)際期刊

視覺(jué)輔助定位的相關(guān)專(zhuān)題、標(biāo)簽、搜索
視覺(jué)輔助定位的最新內(nèi)容
手柄內(nèi)部具有陀螺儀傳感器,輔助視覺(jué)定位方案。
▲Pico Neo3手柄拆解俯視、右側(cè)、左側(cè)、正面視圖
后置電池方案顯著提高佩戴舒適度,實(shí)際佩戴時(shí),Quest2所采用的前置電池的方案導(dǎo)致主機(jī)有明顯的下墜,產(chǎn)生視覺(jué)效果不清晰,眼部、額頭承受壓力的不良體驗(yàn)。同時(shí)減少一體機(jī)的減重要求,為更大的電池容量提供設(shè)計(jì)上的基礎(chǔ)。
未來(lái),“手勢(shì)識(shí)別”或迎來(lái)“無(wú)手柄”方案。
機(jī)器人認(rèn)知技術(shù)引領(lǐng)者
在新興市場(chǎng)經(jīng)濟(jì)和新型技術(shù)不斷崛起的背景下,生產(chǎn)出高品質(zhì)且價(jià)格低廉的產(chǎn)品是企業(yè)發(fā)展的急切需求,然而近些年來(lái)在國(guó)內(nèi)現(xiàn)有生產(chǎn)條件下生產(chǎn)出的產(chǎn)品存在著很大的問(wèn)題。傳統(tǒng)意義上的生產(chǎn)需要設(shè)備處于時(shí)常工作狀態(tài)以便于隨時(shí)檢測(cè),然而這樣的工作方式導(dǎo)致了設(shè)備在一定的時(shí)間內(nèi)出現(xiàn)設(shè)備閑置的現(xiàn)象
為此開(kāi)發(fā)了泊車(chē)軌跡動(dòng)態(tài)規(guī)劃技術(shù),可實(shí)現(xiàn)泊車(chē)過(guò)程中的軌跡實(shí)時(shí)修正甚至軌跡重規(guī)劃,如圖15所示:
圖15
▲室內(nèi)定位技術(shù)
如圖16所示,通過(guò)采用視覺(jué)SLAM+標(biāo)簽輔助定位方式,解決地下停車(chē)場(chǎng)無(wú)GPS的問(wèn)題,同時(shí)通過(guò)多源信息融合,
作者 | 晃晃悠悠縱馬江湖@知乎
來(lái)源 | https://zhuanlan.zhihu.com/p/418903322
在傳感器融合的基礎(chǔ)上加入了滅點(diǎn)。
《Vanishing Point Aided LiDAR-Visual-Inertial Estimator》(ICRA2021)
Motivation
這篇文章的動(dòng)機(jī)主要從VIO出發(fā),VIO
來(lái)源 |
3D視覺(jué)工坊
RoadMap: A Light-Weight Semantic Map for Visual Localization towards Autonomous Driving
Qin T, Zheng Y, Chen T, et al. RoadMap: A Light-Weight Semantic Map for
來(lái)源 |
Smarter
作者 | 張浩 https://zhuanlan.zhihu.com/p/31727402
引言
深度學(xué)習(xí)目前已成為發(fā)展最快、最令人興奮的機(jī)器學(xué)習(xí)領(lǐng)域之一,許多卓有建樹(shù)的論文已經(jīng)發(fā)表,而且已有很多高質(zhì)量的開(kāi)源深度學(xué)習(xí)框架可供使用。然而,論文通常非常簡(jiǎn)明扼要并假設(shè)讀者已對(duì)深度學(xué)習(xí)有相當(dāng)?shù)睦斫猓@使得初學(xué)者經(jīng)常卡在一些概念的理解上
來(lái)源 |
衛(wèi)星導(dǎo)航國(guó)際期刊
為此開(kāi)發(fā)了泊車(chē)軌跡動(dòng)態(tài)規(guī)劃技術(shù),可實(shí)現(xiàn)泊車(chē)過(guò)程中的軌跡實(shí)時(shí)修正甚至軌跡重規(guī)劃,如圖15所示:
圖15
室內(nèi)定位技術(shù)如圖16所示,通過(guò)采用視覺(jué)SLAM+標(biāo)簽輔助定位方式,解決地下停車(chē)場(chǎng)無(wú)GPS的問(wèn)題,同時(shí)通過(guò)多源信息融合,提升定位精度。
巡檢數(shù)據(jù)智能處理是當(dāng)前電力無(wú)人機(jī)巡檢工作中較為急迫的需求,也是無(wú)人機(jī)全自主巡檢的關(guān)鍵技術(shù),如機(jī)器視覺(jué)輔助定位的巡檢圖像采集、融合機(jī)器視覺(jué)或激光雷達(dá)的多傳感無(wú)人機(jī)定位導(dǎo)航等.得益于近年來(lái)人工智能技術(shù)的崛起,機(jī)器視覺(jué),特別是圖像處理領(lǐng)域發(fā)展迅速,電力無(wú)人機(jī)巡檢圖像數(shù)據(jù)處理領(lǐng)域取得了一定的研究成果,數(shù)次技術(shù)驗(yàn)證工作展示了其廣闊的應(yīng)用前景.但一些基礎(chǔ)建設(shè)工作,如巡檢數(shù)據(jù)庫(kù)建設(shè)、相關(guān)規(guī)范與標(biāo)準(zhǔn)制定等尚未完成,
摘要
定位是自主機(jī)器人的一個(gè)關(guān)鍵要素.雖然深度學(xué)習(xí)在許多計(jì)算機(jī)視覺(jué)任務(wù)中取得了較大進(jìn)步,但它仍然沒(méi)有較大改進(jìn)提高度量視覺(jué)定位.主要障礙之一是現(xiàn)有的基于卷積神經(jīng)網(wǎng)絡(luò)的姿態(tài)回歸方法不能推廣到以前看不到的地方