
發(fā)布
注冊(cè)
/
登錄視覺(jué)技術(shù)的案例
空間視覺(jué)技術(shù)接替算法視覺(jué)推動(dòng)實(shí)現(xiàn)完全自動(dòng)駕駛
基于現(xiàn)有成像設(shè)備,機(jī)器視覺(jué)之算法視覺(jué)實(shí)現(xiàn)完全自動(dòng)駕駛,是一件不可能的事,邏輯:空間景物投影在圖像傳感器上生成平面顏色點(diǎn)陣,是失真不可靠的數(shù)據(jù),算法再完美,數(shù)據(jù)不可靠,結(jié)果自然不可靠。空間視覺(jué)技術(shù)重塑了成像設(shè)備結(jié)構(gòu)和控制方法,使其獲得完整 一 一對(duì)標(biāo)的數(shù)據(jù)鏈,生成3維坐標(biāo)顏色點(diǎn)陣,連續(xù)坐標(biāo)點(diǎn)陣即景物輪廓,空間視覺(jué)技術(shù)重新定義的相機(jī),使其完成從生成相片到生成場(chǎng)景的進(jìn)化,場(chǎng)景實(shí)現(xiàn)數(shù)字孿生到平行空間飛越,實(shí)現(xiàn)方法從計(jì)算模擬變成實(shí)時(shí)映射。
機(jī)器視覺(jué)技術(shù)在工業(yè)智能化生產(chǎn)中的應(yīng)用
7 結(jié)語(yǔ)
由此可見(jiàn),機(jī)器視覺(jué)技術(shù)在工業(yè)制造有著廣泛的需求,在工業(yè)領(lǐng)域有著較大的發(fā)展空間。機(jī)器視覺(jué)技術(shù)的利用可有效的降低生產(chǎn)成本,節(jié)約勞動(dòng)力,提高生產(chǎn)效率,降低產(chǎn)品次品率;另外,還可以實(shí)現(xiàn)非接觸測(cè)量。機(jī)器視覺(jué)技術(shù)的優(yōu)點(diǎn)如此之多,因此,對(duì)制造業(yè)領(lǐng)域智能化的發(fā)展也具有較大的影響。但是,現(xiàn)在的機(jī)器視覺(jué)技術(shù)還有待提高,許多技術(shù)難題還亟待解決,當(dāng)下任務(wù)應(yīng)著力解決機(jī)器視覺(jué)技術(shù)在工業(yè)
生產(chǎn)上的智能化、自動(dòng)化應(yīng)用,以便以后全面投入工業(yè)領(lǐng)域生產(chǎn),進(jìn)而為我國(guó)的現(xiàn)代化強(qiáng)國(guó)建設(shè)做出貢獻(xiàn)。
慧眼識(shí)珠:機(jī)器視覺(jué)技術(shù)的工業(yè)應(yīng)用與廠商巡禮
PCB視覺(jué)分揀系統(tǒng)構(gòu)成
更多視覺(jué)系統(tǒng)關(guān)鍵技術(shù)內(nèi)容請(qǐng)見(jiàn)報(bào)告全文《慧眼識(shí)珠:機(jī)器視覺(jué)技術(shù)的工業(yè)應(yīng)用與廠商巡禮》
長(zhǎng)按二維碼獲取報(bào)告全文
0
3
機(jī)器視覺(jué)技術(shù)在工業(yè)的主要應(yīng)用
機(jī)器視覺(jué)技術(shù)在工業(yè)中的應(yīng)用正在持續(xù)升溫。
例如在電子制造行業(yè)的SMT(電路板表面貼裝)加工中,AOI、SPI視覺(jué)檢測(cè)已經(jīng)取代人工目檢成為標(biāo)配。
傳統(tǒng)AOI/SPI檢測(cè)以2D視覺(jué)為主,隨著行業(yè)技術(shù)進(jìn)步,3D AOI/SPI技術(shù)已成為視覺(jué)檢測(cè)的重要組成部分。
3D視覺(jué)的應(yīng)用并不僅限于質(zhì)量檢測(cè),在機(jī)器人導(dǎo)航、零件三維量測(cè)等領(lǐng)域均有落地場(chǎng)景。
例如3D視覺(jué)中的雙目立體視覺(jué)技術(shù),其與機(jī)械手配合,能夠?qū)o(wú)序堆疊的散裝零件進(jìn)行準(zhǔn)確識(shí)別及抓取。
展開(kāi) 基于計(jì)算機(jī)視覺(jué)技術(shù)的無(wú)土栽培蔬菜種植系統(tǒng)的研究與設(shè)計(jì)
關(guān)鍵詞:計(jì)算機(jī)視覺(jué),無(wú)土栽培,物聯(lián)網(wǎng),STM32,OpenCV
作者:祝朝坤、谷會(huì)斌,鄭州工商學(xué)院
1 緒論
1.1 研究背景
近10年來(lái),計(jì)算機(jī)視覺(jué)技術(shù)獲得了里程碑式的進(jìn)步,由于識(shí)別錯(cuò)誤率的大幅降低,計(jì)算機(jī)視覺(jué)技術(shù)被愈來(lái)愈廣泛應(yīng)用在人們?nèi)粘I钪械母鱾€(gè)領(lǐng)域
[1]
。而由于傳統(tǒng)的農(nóng)作物種植受限于耕地面積、天氣、蟲(chóng)害等多種因素,無(wú)土栽培也逐漸成為目前的研究熱點(diǎn),此外,目前成熟的無(wú)土栽培還擁有許多傳統(tǒng)種植不可復(fù)制的優(yōu)越性,如面積小、收獲多、成熟快、品質(zhì)優(yōu)良等。本課題的設(shè)計(jì)初衷就是更方便快捷地為人們和社會(huì)提供符合食品安全的健康綠色蔬菜。
1.2 研究意義
本課題的無(wú)土栽培蔬菜種植架結(jié)合計(jì)算機(jī)視覺(jué)技術(shù)進(jìn)行統(tǒng)籌設(shè)計(jì),具有一定的創(chuàng)新和實(shí)用性,體現(xiàn)在:
①在實(shí)現(xiàn)無(wú)土栽培自動(dòng)化管理的過(guò)程中,計(jì)算機(jī)視覺(jué)技術(shù)可以通過(guò)云端進(jìn)行遠(yuǎn)程監(jiān)測(cè),觀察作物的生長(zhǎng)狀態(tài)以及生長(zhǎng)環(huán)境參數(shù),無(wú)需過(guò)多人為干涉,從而解放了勞動(dòng)力,使用戶享受到科技為現(xiàn)代生活帶來(lái)的美好。
②該無(wú)土栽培蔬菜種植架的開(kāi)發(fā)能夠自動(dòng)管理無(wú)土栽培過(guò)程中蔬菜生長(zhǎng)所必需的變量,始終將數(shù)值控制在合理范圍內(nèi),令蔬菜無(wú)季節(jié)性限制、天氣影響、蟲(chóng)害影響,同時(shí)也提高了作物的安全系數(shù),為蔬菜安全生產(chǎn)提供技術(shù)支持。
展開(kāi) 
武漢機(jī)器視覺(jué)技術(shù)及工業(yè)應(yīng)用研討會(huì)圓滿舉辦
8月26日,由機(jī)器視覺(jué)產(chǎn)業(yè)聯(lián)盟(CMVU)主辦的“武漢機(jī)器視覺(jué)技術(shù)及工業(yè)應(yīng)用研討會(huì)”成功舉辦。出席本次會(huì)議的參會(huì)代表350人,共同探討了機(jī)器視覺(jué)技術(shù)在半導(dǎo)體行業(yè)檢測(cè)的解決方案。
本次會(huì)議由機(jī)器視覺(jué)產(chǎn)業(yè)聯(lián)盟(CMVU)秘書(shū)長(zhǎng)于曉娟主持,華南區(qū)副秘書(shū)長(zhǎng)謝家振出席了會(huì)議,理事長(zhǎng)潘津先生代表聯(lián)盟向各位來(lái)賓表示歡迎,潘津表示:“2022上半年,聯(lián)盟原計(jì)劃舉辦的多場(chǎng)線下活動(dòng)因疫情被迫暫停或取消,在條件允許的情況下,我們第一時(shí)間舉辦了本次武漢研討會(huì),為大家提供線下面對(duì)面溝通交流的平臺(tái)。我們相信,在大家的共同努力下,本次線下研討會(huì)將為參會(huì)代表及參會(huì)企業(yè)架起合作交流的平臺(tái),共同促進(jìn)機(jī)器視覺(jué)行業(yè)的繁榮發(fā)展!”
精彩演講
本次會(huì)議以專題論壇+產(chǎn)品方案展示的形式開(kāi)展,來(lái)自Basler China、Allied Vision、數(shù)之聯(lián)、大恒圖像、思謀科技、金品計(jì)算機(jī)、阿里巴巴達(dá)摩院、LMI Technologies、堡盟、沃德普、研華科技、長(zhǎng)芯盛的12位專家圍繞“AI+機(jī)器視覺(jué)在半導(dǎo)體檢測(cè)方面的應(yīng)用”這一主題帶來(lái)精彩演講,介紹了AI與機(jī)器視覺(jué)在PCB、晶圓檢測(cè)、新能源等領(lǐng)域的需求及應(yīng)用,深度解析人工智能下機(jī)器視覺(jué)技術(shù)領(lǐng)域的發(fā)展趨勢(shì)及技術(shù)創(chuàng)新,并向參會(huì)代表分享了當(dāng)前企業(yè)自研的最新產(chǎn)品與技術(shù)。與會(huì)人員積極提問(wèn),演講嘉賓就當(dāng)下行業(yè)狀況,結(jié)合自身相關(guān)優(yōu)勢(shì)及經(jīng)驗(yàn)?zāi)托慕獯穑顒?dòng)現(xiàn)場(chǎng)討論氣氛濃烈,前來(lái)參會(huì)人員收獲良多。
展開(kāi) 機(jī)器也能看見(jiàn)你 機(jī)器視覺(jué)技術(shù)漸行漸近
機(jī)器視覺(jué)技術(shù)是一門涉及人工智能、神經(jīng)生物學(xué)、心理物理學(xué)、計(jì)算機(jī)科學(xué)、圖像處理、模式識(shí)別等諸多領(lǐng)域的交叉學(xué)科。機(jī)器視覺(jué)主要用計(jì)算機(jī)來(lái)模擬人的視覺(jué)功能,從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終用于實(shí)際檢測(cè)、測(cè)量和控制,技術(shù)最大的特點(diǎn)是速度快、信息量大、功能多。
機(jī)器視覺(jué)主要用計(jì)算機(jī)來(lái)模擬人的視覺(jué)功能,但并不僅僅是人眼的簡(jiǎn)單延伸,更重要的是具有人腦的一部分功能一一從客觀事物的圖像中提取信息,進(jìn)行處理并加以理解,最終用于實(shí)際檢測(cè)、測(cè)量和控制。
一個(gè)典型的工業(yè)機(jī)器視覺(jué)應(yīng)用系統(tǒng),包括數(shù)字圖像處理技術(shù)、機(jī)械工程技術(shù)、控制技術(shù)、光源照明技術(shù)、光學(xué)成像技術(shù)、傳感器技術(shù)、模擬與數(shù)字視頻技術(shù)、計(jì)算機(jī)軟硬件技術(shù)、人機(jī)接口技術(shù)等。
發(fā)展歷史簡(jiǎn)介
機(jī)器視覺(jué)的研究是從20世紀(jì)60年代中期美國(guó)學(xué)者L.R.羅伯茲關(guān)于理解多面體組成的積木世界研究開(kāi)始的。當(dāng)時(shí)運(yùn)用的預(yù)處理、邊緣檢測(cè)、輪廓線構(gòu)成、對(duì)象建模、匹配等技術(shù),后來(lái)一直在機(jī)器視覺(jué)中應(yīng)用。
羅伯茲在圖像分析過(guò)程中,采用了自底向上的方法。用邊緣檢測(cè)技術(shù)來(lái)確定輪廓線,用區(qū)域分析技術(shù)將圖像劃分為由灰度相近的像素組成的區(qū)域,這些技術(shù)統(tǒng)稱為圖像分割。其目的在于用輪廓線和區(qū)域?qū)λ治龅膱D像進(jìn)行描述,以便同機(jī)內(nèi)存儲(chǔ)的模型進(jìn)行比較匹配。
實(shí)踐表明,只用自底向上的分析太困難,必須同時(shí)采用自頂向下,即把目標(biāo)分為若干子目標(biāo)的分析方法,運(yùn)用啟發(fā)式知識(shí)對(duì)對(duì)象進(jìn)行預(yù)測(cè)。這同言語(yǔ)理解中采用的自底向上和自頂向下相結(jié)合的方法是一致的。在圖像理解研究中,A.古茲曼提出運(yùn)用啟發(fā)式知識(shí),表明用符號(hào)過(guò)程來(lái)解釋輪廓畫(huà)的方法不必求助于諸如最小二乘法匹配之類的數(shù)值計(jì)算程序。
展開(kāi) 雙目立體視覺(jué)技術(shù)涉及到的基本概念
雙目立體視覺(jué)測(cè)量方法具有效率高、精度合適、系統(tǒng)結(jié)構(gòu)簡(jiǎn)單、成本低等優(yōu)點(diǎn),非常適合于制造現(xiàn)場(chǎng)的在線、非接觸產(chǎn)品檢測(cè)和質(zhì)量控制。對(duì)運(yùn)動(dòng)物體(包括動(dòng)物和人體形體)測(cè)量中,由于圖像獲取是在瞬間完成的,因此立體視覺(jué)方法是一種更有效的測(cè)量方法。
雙目立體視覺(jué)系統(tǒng)是計(jì)算機(jī)視覺(jué)的關(guān)鍵技術(shù)之一,獲取空間三維場(chǎng)景的距離信息也是計(jì)算機(jī)視覺(jué)研究中最基礎(chǔ)的內(nèi)容。
雙目立體視覺(jué)的開(kāi)創(chuàng)性工作始于上世紀(jì)的60年代中期。美國(guó)MIT的Roberts通過(guò)從數(shù)字圖像中提取立方體、楔形體和棱柱體等簡(jiǎn)單規(guī)則多面體的三維結(jié)構(gòu),并對(duì)物體的形狀和空間關(guān)系進(jìn)行描述,把過(guò)去的簡(jiǎn)單二維圖像分析推廣到了復(fù)雜的三維場(chǎng)景,標(biāo)志著立體視覺(jué)技術(shù)的誕生。隨著研究的深入,研究的范圍從邊緣、角點(diǎn)等特征的提取,線條、平面、曲面等幾何要素的分析,直到對(duì)圖像明暗、紋理、運(yùn)動(dòng)和成像幾何等進(jìn)行分析,并建立起各種數(shù)據(jù)結(jié)構(gòu)和推理規(guī)則。特別是上世紀(jì)80年代初,Marr首次將圖像處理、心理物理學(xué)、神經(jīng)生理學(xué)和臨床精神病學(xué)的研究成果從信息處理的角度進(jìn)行概括,創(chuàng)立了視覺(jué)計(jì)算理論框架。這一基本理論對(duì)立體視覺(jué)技術(shù)的發(fā)展產(chǎn)生了極大的推動(dòng)作用,在這一領(lǐng)域已形成了從圖像的獲取到最終的三維場(chǎng)景可視表面重構(gòu)的完整體系,使得立體視覺(jué)已成為計(jì)算機(jī)視覺(jué)中一個(gè)非常重要的分支。
經(jīng)過(guò)幾十年來(lái)的發(fā)展,立體視覺(jué)在機(jī)器人視覺(jué)、航空測(cè)繪、反求工程、軍事運(yùn)用、醫(yī)學(xué)成像和工業(yè)檢測(cè)等領(lǐng)域中的運(yùn)用越來(lái)越廣。
3. 雙目立體視覺(jué)系統(tǒng)
立體視覺(jué)系統(tǒng)由左右兩部攝像機(jī)組成。如圖二所示,圖中分別以下標(biāo)l和r標(biāo)注左、右攝像機(jī)的相應(yīng)參數(shù)。世界空間中一點(diǎn)A(X,Y,Z)在左右攝像機(jī)的成像面Cl和Cr上的像點(diǎn)分別為al(ul,vl)和ar(ur,vr)。這兩個(gè)像點(diǎn)是世界空間中同一個(gè)對(duì)象點(diǎn)A的像,稱為“共軛點(diǎn)”。
展開(kāi) Blickfeld為自動(dòng)駕駛提供低價(jià)緊湊型視覺(jué)技術(shù)
(原標(biāo)題:Blickfeld為自動(dòng)駕駛車輛提供低價(jià)、緊湊型視覺(jué)技術(shù))
核心提示:據(jù)外媒報(bào)道,德國(guó)慕尼黑初創(chuàng)公司Blickfeld希望在加速自動(dòng)駕駛車輛的大規(guī)模推廣方面發(fā)揮重要作用,因此,其計(jì)劃為自動(dòng)駕駛車輛的提供視覺(jué)系統(tǒng),使用更便宜的零部件,同時(shí)采用微機(jī)械技術(shù)減少視覺(jué)系統(tǒng)的尺寸和重量。
蓋世汽車訊 據(jù)外媒報(bào)道,德國(guó)慕尼黑初創(chuàng)公司Blickfeld希望在加速自動(dòng)駕駛車輛的大規(guī)模推廣方面發(fā)揮重要作用,因此,其計(jì)劃為自動(dòng)駕駛車輛的提供視覺(jué)系統(tǒng),使用更便宜的零部件,同時(shí)采用微機(jī)械技術(shù)減少視覺(jué)系統(tǒng)的尺寸和重量。
一旦5級(jí)自動(dòng)駕駛車輛正式投入使用,完全自動(dòng)駕駛汽車將需要360度探測(cè)周圍環(huán)境,以迅速避免各種危險(xiǎn)。現(xiàn)在,激光雷達(dá)等一系列超快旋轉(zhuǎn)激光掃描儀的此功能最佳。但是,激光雷達(dá)非常昂貴,很多公司一直在努力推出更具成本效益的替代方案。該家初創(chuàng)公司Blickfeld正在研發(fā)一種更便宜的技術(shù),以掃描汽車周圍環(huán)境。該技術(shù)由激光和該公司自己編寫的識(shí)別軟件組成。
Blickfeld聯(lián)合創(chuàng)始人之一Florian Petit主要負(fù)責(zé)產(chǎn)品和業(yè)務(wù)開(kāi)發(fā),他表示:“我們的技術(shù)顯然比目前市場(chǎng)上的解決方案更便宜、更緊湊。雖然價(jià)格更低,但是該技術(shù)可以為自動(dòng)駕駛車輛提供所需信息,讓它們可以做出明智安全的決策。”Blickfeld是汽車技術(shù)的新興企業(yè),成立于2016年,主要致力于加速完全自動(dòng)駕駛車輛的發(fā)展。Petit表示,公司系統(tǒng)價(jià)格“低于三位數(shù)”,比現(xiàn)在動(dòng)輒幾千歐元的激光雷達(dá)系統(tǒng)價(jià)格更低。
展開(kāi) 【產(chǎn)品技術(shù)】嘉銘科技 | 3D視覺(jué)引導(dǎo)瓦蓋自動(dòng)裝配系統(tǒng)
本系統(tǒng)實(shí)現(xiàn)汽車發(fā)動(dòng)機(jī)缸體瓦蓋的自動(dòng)化檢測(cè)、識(shí)別、精準(zhǔn)定位抓取及安裝,通過(guò)3D視覺(jué)識(shí)別和引導(dǎo)技術(shù)以及專業(yè)機(jī)器人實(shí)現(xiàn)對(duì)不規(guī)則工件的整條加工生產(chǎn)線的自動(dòng)化升級(jí)改造,大幅度的提高了發(fā)動(dòng)機(jī)瓦蓋的裝配效率,較少人工成本,為企業(yè)帶來(lái)更多的效益。
《機(jī)器視覺(jué)》雜志征文通知
《機(jī)器視覺(jué)》雜志是一本報(bào)道中國(guó)機(jī)器視覺(jué)技術(shù)最新發(fā)展?fàn)顩r的科技刊物,配合三地VisionChina展覽會(huì)的召開(kāi)而出版的會(huì)員內(nèi)部交流刊物。
《機(jī)器視覺(jué)》是一本面向圖像領(lǐng)域的工程技術(shù)人員、產(chǎn)業(yè)管理人員、專家學(xué)者以及在校大學(xué)生的專業(yè)刊物。該刊主要致力于報(bào)道機(jī)器視覺(jué)及圖像處理領(lǐng)域的新產(chǎn)品、新技術(shù)、新應(yīng)用以及市場(chǎng)等諸多方面的最新發(fā)展?fàn)顩r。將在VisionChina展會(huì)期間向業(yè)內(nèi)觀眾免費(fèi)發(fā)放。
【主要欄目】
行業(yè)新聞、專題報(bào)道、特別策劃、趨勢(shì)觀點(diǎn)、企業(yè)訪談、產(chǎn)品技術(shù)、應(yīng)用案例、公司技術(shù)專欄等。
歡迎投稿!
展開(kāi) 計(jì)算機(jī)視覺(jué):你必須了解的圖像數(shù)據(jù)底層技術(shù)
引言
計(jì)算機(jī)視覺(jué)(Computer Vision)自興起以來(lái)就非常迅速且廣泛應(yīng)用于各個(gè)領(lǐng)域,比如我們熟悉的且每天都會(huì)使用的基于手機(jī)攝像頭的人臉識(shí)別,除此之外,它還可以在自動(dòng)駕駛領(lǐng)域輔助汽車識(shí)別交通信號(hào)、標(biāo)志和行人;在制造業(yè)輔助工業(yè)機(jī)器人監(jiān)督和指導(dǎo)人工操作。
計(jì)算機(jī)視覺(jué)的主要目的是讓計(jì)算機(jī)能像人類一樣甚至比人類更好地看見(jiàn)和識(shí)別世界。計(jì)算機(jī)視覺(jué)通常使用C++、Python和MATLAB等編程語(yǔ)言,是增強(qiáng)現(xiàn)實(shí)(AR)的一項(xiàng)重要技術(shù)。目前主流的計(jì)算機(jī)視覺(jué)工具有OpenCV、Tensorflow、Gpu、YOLO、Keras等。計(jì)算機(jī)視覺(jué)其實(shí)是一個(gè)復(fù)雜多元的交叉領(lǐng)域,包含了很多來(lái)自數(shù)字信號(hào)處理、神經(jīng)科學(xué)、圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)(ML)、機(jī)器人、人工智能(AI)等領(lǐng)域的概念。
本文將具體介紹一下計(jì)算機(jī)視覺(jué)的工作流程。
什么是計(jì)算機(jī)視覺(jué)(Computer Vision)
一言蔽之,計(jì)算機(jī)視覺(jué)是讓計(jì)算機(jī)理解并標(biāo)記圖像內(nèi)容的技術(shù)領(lǐng)域。
舉個(gè)例子,請(qǐng)看下圖:
對(duì)于人類來(lái)說(shuō),你很難向從沒(méi)穿過(guò)衣服的原始人解釋什么是連衣裙或者什么是鞋。計(jì)算機(jī)視覺(jué)也是如此,如果它并沒(méi)有相關(guān)輸入,就不會(huì)理解上圖的東西都是什么。
所以,我們需要收集并標(biāo)記大量關(guān)于衣服、鞋、包包的圖片,輸入進(jìn)計(jì)算機(jī)“告訴”它這些圖片里的東西是什么,在經(jīng)過(guò)不斷的學(xué)習(xí)和訓(xùn)練后,計(jì)算機(jī)將會(huì)識(shí)別出哪個(gè)是連衣裙,哪個(gè)是鞋、哪個(gè)是包包。
展開(kāi) 一文了解目前所有的視覺(jué)三維重建技術(shù)
基于視覺(jué)的三維重建關(guān)鍵技術(shù)研究綜述. 自動(dòng)化學(xué)報(bào), 2020, 46(4): 631-652. doi: 10.16383/j.aas.2017.c170502
三維重建經(jīng)過(guò)數(shù)十年的發(fā)展, 已經(jīng)取得巨大的成功。基于視覺(jué)的三維重建在計(jì)算機(jī)領(lǐng)域是一個(gè)重要的研究?jī)?nèi)容, 主要通過(guò)使用相關(guān)儀器來(lái)獲取物體的二維圖像數(shù)據(jù)信息, 然后, 再對(duì)獲取的數(shù)據(jù)信息進(jìn)行分析處理, 最后, 利用三維重建的相關(guān)理論重建出真實(shí)環(huán)境中物體表面的輪廓信息。基于視覺(jué)的三維重建具有速度快、實(shí)時(shí)性好等優(yōu)點(diǎn), 能夠廣泛應(yīng)用于人工智能、機(jī)器人、無(wú)人駕駛、SLAM (Simultaneous localization and mapping)、虛擬現(xiàn)實(shí)和3D打印等領(lǐng)域。三維重建技術(shù)的分類方法如下圖所示:
三維重建技術(shù)的分類
三維重建技術(shù)優(yōu)缺點(diǎn)對(duì)比一覽
基于主動(dòng)視覺(jué)的三維重建技術(shù)
基于主動(dòng)視覺(jué)的三維重建技術(shù)主要包括激光掃描法、結(jié)構(gòu)光法、陰影法和TOF技術(shù)、雷達(dá)技術(shù)、Kinect技術(shù)等。
1、激光掃描法
激光掃描法其實(shí)就是利用激光測(cè)距儀來(lái)進(jìn)行真實(shí)場(chǎng)景的測(cè)量。首先, 激光測(cè)距儀發(fā)射光束到物體的表面, 然后, 根據(jù)接收信號(hào)和發(fā)送信號(hào)的時(shí)間差確定物體離激光測(cè)距儀的距離, 從而獲得測(cè)量物體的大小和形狀。
展開(kāi) 
基于雙目視覺(jué)的自動(dòng)駕駛技術(shù)
來(lái)源 |
知乎@黃浴、
3D視覺(jué)工坊
不小心刪掉的文章,要求補(bǔ)上了。其實(shí)雙目視覺(jué)主要問(wèn)題是立體匹配和視差計(jì)算,最新的討論見(jiàn):https://zhuanlan.zhihu.com/p/65130734;另外,目標(biāo)檢測(cè)的雙目視覺(jué)技術(shù)討論如下:https://zhuanlan.zhihu.com/p/87074244。
單目視覺(jué)是Mobileye(ME)的看家法寶,其實(shí)當(dāng)年它也考慮過(guò)雙目,最終選擇放棄。
單目的測(cè)距和3-D估計(jì)靠什么?是檢測(cè)目標(biāo)的Bounding Box(BB),如果無(wú)法檢測(cè)的障礙物,該系統(tǒng)就無(wú)法估計(jì)其距離和3-D姿態(tài)/朝向。沒(méi)有深度學(xué)習(xí)的時(shí)候,ME主要是基于BB,攝像頭標(biāo)定得到的姿態(tài)和高度以及路面平直的假設(shè)估算距離。
有了深度學(xué)習(xí),可以根據(jù)3-D的ground truth來(lái)訓(xùn)練NN模型,得到3D大小和姿態(tài)估計(jì),距離是基于平行線原理(single view metrology)得到的。不久前百度Apollo公布的單目L3解決方案講的比較清楚了,參考論文是“3D Bounding Box Estimation by Deep Learning and Geometry".
雙目當(dāng)然可以算視差和深度了,即使沒(méi)有檢測(cè)出障礙物(因?yàn)橛懈郊拥纳疃刃畔ⅲ瑱z測(cè)器會(huì)比單目好),也會(huì)報(bào)警。問(wèn)題是,雙目視覺(jué)系統(tǒng)估計(jì)視差沒(méi)那么容易,立體匹配是計(jì)算機(jī)視覺(jué)典型的難題,基線寬得到遠(yuǎn)目標(biāo)測(cè)距準(zhǔn),而基線短得到近目標(biāo)測(cè)距結(jié)果好,這里是存在折衷的。
目前市場(chǎng)上ADAS存在的雙目視覺(jué)系統(tǒng)就是Subaru EyeSight,據(jù)說(shuō)性能還行。
百度推出的阿波龍L4擺渡車量產(chǎn)100臺(tái),就安裝了雙目系統(tǒng)。
展開(kāi) 視覺(jué)技術(shù)如何為疫苗生產(chǎn)保駕護(hù)航?
《機(jī)器視覺(jué)》雜志征文通知
《機(jī)器視覺(jué)》雜志是一本報(bào)道中國(guó)機(jī)器視覺(jué)技術(shù)最新發(fā)展?fàn)顩r的科技刊物,配合三地VisionChina展覽會(huì)的召開(kāi)而出版的會(huì)員內(nèi)部交流刊物。
《機(jī)器視覺(jué)》是一本面向圖像領(lǐng)域的工程技術(shù)人員、產(chǎn)業(yè)管理人員、專家學(xué)者以及在校大學(xué)生的專業(yè)刊物。該刊主要致力于報(bào)道機(jī)器視覺(jué)及圖像處理領(lǐng)域的新產(chǎn)品、新技術(shù)、新應(yīng)用以及市場(chǎng)等諸多方面的最新發(fā)展?fàn)顩r。將在VisionChina展會(huì)期間向業(yè)內(nèi)觀眾免費(fèi)發(fā)放。
【主要欄目】
行業(yè)新聞、專題報(bào)道、特別策劃、趨勢(shì)觀點(diǎn)、企業(yè)訪談、產(chǎn)品技術(shù)、應(yīng)用案例、公司技術(shù)專欄等。
歡迎投稿!
展開(kāi) 【產(chǎn)品技術(shù)】德承GM-1000導(dǎo)入全新的Quadro? MXM GPU模塊,滿足機(jī)器視覺(jué)的效能需求
結(jié) 語(yǔ)
德承機(jī)器視覺(jué)的首要選擇機(jī)種GM-1000, 除了具備針對(duì)機(jī)器視覺(jué)所量身打造的特性外,響應(yīng)工業(yè)領(lǐng)域長(zhǎng)期穩(wěn)定的供貨需求,提供高達(dá)十五年的長(zhǎng)期供貨,而兩款Quadro? MXM GPU系列模塊則擁有五年的供貨時(shí)間,無(wú)論是工業(yè)設(shè)備或是其他智能應(yīng)用領(lǐng)域的導(dǎo)入都能夠備感安心。
《機(jī)器視覺(jué)》雜志征文通知
《機(jī)器視覺(jué)》雜志是一本報(bào)道中國(guó)機(jī)器視覺(jué)技術(shù)最新發(fā)展?fàn)顩r的科技刊物,配合三地VisionChina展覽會(huì)的召開(kāi)而出版的會(huì)員內(nèi)部交流刊物。
《機(jī)器視覺(jué)》是一本面向圖像領(lǐng)域的工程技術(shù)人員、產(chǎn)業(yè)管理人員、專家學(xué)者以及在校大學(xué)生的專業(yè)刊物。該刊主要致力于報(bào)道機(jī)器視覺(jué)及圖像處理領(lǐng)域的新產(chǎn)品、新技術(shù)、新應(yīng)用以及市場(chǎng)等諸多方面的最新發(fā)展?fàn)顩r。將在VisionChina展會(huì)期間向業(yè)內(nèi)觀眾免費(fèi)發(fā)放。
【主要欄目】
行業(yè)新聞、專題報(bào)道、特別策劃、趨勢(shì)觀點(diǎn)、企業(yè)訪談、產(chǎn)品技術(shù)、應(yīng)用案例、公司技術(shù)專欄等。
歡迎投稿!
展開(kāi) 葉聰:朋友圈背后的計(jì)算機(jī)視覺(jué)技術(shù)與應(yīng)用
一、朋友圈爆款活動(dòng)背后的技術(shù)
今天我會(huì)從朋友圈的一些爆款的互動(dòng)活動(dòng)作為切入點(diǎn),帶大家過(guò)一遍一些計(jì)算及視覺(jué)技術(shù)與應(yīng)用,或者把AI技術(shù)產(chǎn)業(yè)化。我們經(jīng)常在朋友圈會(huì)看到一些比較有趣的互動(dòng)的活動(dòng),比如像軍裝照、武士青年這類活動(dòng)視覺(jué)比較流行的應(yīng)用,也是目前探索出來(lái)的計(jì)算機(jī)視覺(jué)能夠最快來(lái)到大家身邊的方式。以過(guò)去的五四青年節(jié)的活動(dòng)為例,這個(gè)有趣的活動(dòng)就應(yīng)用了人臉檢測(cè)與人臉檢索的技術(shù)相結(jié)合。
上傳一張照片最匹配民國(guó)時(shí)候有為青年的照片,做成這種頁(yè)面供大家分享。這種模式最開(kāi)始就是由騰訊開(kāi)啟,現(xiàn)已成為了整個(gè)行業(yè)應(yīng)用的參考。除了這個(gè)活動(dòng),H5這類應(yīng)用往往會(huì)出現(xiàn)用戶訪問(wèn)爆發(fā)性的增長(zhǎng),為了應(yīng)對(duì)這種突如其來(lái)的流量暴增,使用一整套云架構(gòu)部署,而不是傳統(tǒng)機(jī)房里面用幾臺(tái)服務(wù)器處理。比如像五四青年的活動(dòng),5萬(wàn)KPS的架構(gòu)就有這樣的承載能力。從個(gè)人角度想要做這樣的應(yīng)用,需要了解以下的基礎(chǔ)知識(shí)。
二、計(jì)算機(jī)視覺(jué)定義
首先從計(jì)算機(jī)視覺(jué)的基本定義開(kāi)始,學(xué)術(shù)角度來(lái)講是研究如何讓計(jì)算機(jī)從圖像和視頻中獲取高級(jí)抽象的信息的一種方法。但我比較喜歡后面這種工程角度的解釋,計(jì)算機(jī)視覺(jué)是可以使機(jī)器來(lái)模仿人類自動(dòng)化。現(xiàn)在我們利用計(jì)算機(jī)視覺(jué)讓整個(gè)流程更自動(dòng)化,機(jī)器可以部分的代替人力去理解圖片中的一些信息。計(jì)算機(jī)視覺(jué)還包含一些子分支,現(xiàn)在這個(gè)分支還會(huì)慢慢擴(kuò)張,這個(gè)分類也在慢慢的擴(kuò)大。主要包括物體識(shí)別、對(duì)象檢測(cè)、語(yǔ)義分割、3D的重建,動(dòng)作識(shí)別等等。
底下有幾個(gè)比較常見(jiàn)的視覺(jué)應(yīng)用,第一個(gè)是人臉識(shí)別;第二個(gè)是無(wú)人駕駛;第三個(gè)是語(yǔ)義分割。語(yǔ)義分割在人工智能這個(gè)領(lǐng)域還是比較常見(jiàn)的。一般指詞性的分割,或者詞的分割。圖像分割里面的語(yǔ)義分割一般指的是把圖像里面的不同類型的對(duì)象進(jìn)行標(biāo)注和區(qū)分。
展開(kāi)