
發布
注冊
/
登錄人臉檢測的案例
基于matlab的MTCNN(多任務卷積神經網絡)人臉檢測算法
關鍵詞:Matlab;深度學習;多任務卷積神經網絡;人臉檢測;
背景
在不受約束的環境中,由于個體姿勢的多樣性、光照條件的變化以及潛在的遮擋問題,人臉檢測和對齊任務面臨諸多挑戰。近期的研究表明,深度學習技術在這些任務上展現出了卓越的性能。本文提出了一種基于深度學習的級聯多任務框架,旨在通過檢測與對齊任務間的內在聯系來提升整體性能。具體而言,本框架采用由三個階段組成的深度卷積網絡,以自底向上的方式預測人臉及其關鍵點的位置。此外,本文還提出了一種在線硬樣本挖掘策略,以進一步提高實際應用中的性能。本方法在FDDB和WIDER FACE等具有挑戰性的人臉檢測基準測試以及AFLW人臉對齊基準測試中,均實現了比現有技術更高的準確性,同時保持了實時性能。
多任務卷積神經網絡(MTCNN)
MTCNN是由中國科學院深圳研究院于2016年提出的,用于人臉檢測任務的深度學習模型。該模型能夠在同一框架內集成人臉檢測與人臉關鍵點檢測任務。MTCNN網絡結構由三個階段組成,即P-Net、R-Net和O-Net,形成一個級聯網絡。該模型采用候選區域加分類器的方法,兼顧了檢測速度與精度,實現了快速高效的人臉檢測,如圖1所示。
圖1 MTCNN效果展示說明
方法原理
MTCNN是一種用于人臉檢測的深度學習算法。它由多個階段組成,每個階段都執行特定的任務,例如區域提議、特征提取和邊界框回歸。下面是一個簡化的流程圖,描述了使用MTCNN進行人臉檢測的一般步驟:
輸入圖像:將待檢測的圖像輸入到MTCNN模型中。
階段1:快速區域提議:使用一個卷積神經網絡(CNN)來快速生成人臉候選區域。這個階段通常使用P-Net,它能夠快速地從圖像中提取出可能包含人臉的區域。
生成多個候選區域:P-Net輸出多個候選區域,這些區域是可能包含人臉的矩形框。
展開 25 行 Python 代碼實現人臉檢測——OpenCV 技術教程
這是篇是利用 OpenCV 進行人臉識別的技術講解。閱讀本文之前,這是注意事項:
建議先讀一遍本文再跑代碼——你需要理解這些代碼是干什么的。成功跑一遍不是目的,能夠舉一反三、在新任務上找出 bug 才是。
請確保用的是 OpenCV v2
你需要一個網絡攝像頭
OpenCV
OpenCV 是最流行的計算機視覺庫,原本用 C 和 C++ 開發,現在也支持 Python。
它使用機器學習算法在圖像中搜索人的面部。對于人臉這么復雜的東西,并沒有一個簡單的檢測能對是否存在人臉下結論,而需要成千上萬的特征匹配。算法把人臉識別任務分解成數千個小任務,每個都不難處理。這些任務也被稱為分類器。
對于類似于人臉的對象,你或許需要不少于 6000 個分類器,每一個都需要成功匹配(當然,有容錯率),才能檢測出人臉。但這有一個問題:對于人臉識別,算法從左上角開始計算一個個數據塊,不停問“這是張臉嗎”。每個數據塊有超過 6000 個檢測,加起來的計算量會達到數百萬級別,計算機很可能會讓你等得花兒都謝了。
OpenCV 使用 cascades 來避免這種情況。Cascade 是什么?最佳答案已經在字典里了:一條瀑布或者連續瀑布。
好比連續瀑布,OpenCV cascade 把人臉檢測問題分解為好幾步。對于每個數據塊,它都進行一個粗略、快速的檢測。若通過,會再進行一個更仔細的檢測,以此不斷類推。該算法有 30 到 50 個這樣的階段,或者說 cascade。只有通過全部階段,算法才會判斷檢測到人臉。這樣做的好處是:大多數圖形都會在頭幾步就產生否定反饋,算法因而不需要在它上面測試所有 6000 個特征,大大節省了時間。相對于“正常流程”耗費數個小時,這可以實時實現人臉檢測。
展開 面部識別算法是如何工作的?
它可以檢測各種姿勢、光照和遮擋。良好的推理速度。
缺點:比 YOLO 模型差。雖然推理速度較好,但仍不能滿足在 CPU、低端 GPU 或移動設備上運行的要求。
BlazeFace
就像它的名字一樣,它是由谷歌發布的速度極快的人臉檢測算法。它接受 128x128 維的圖像輸入,推理時間是亞毫秒級,已優化到可以在手機中使用。它速度這么快的原因是:
YOLO 和 SSD 用來檢測大量的類別,而 BlazeFace 不同,是一個專門的人臉檢測器模型。因此 BlazeFace 的深度卷積神經網絡架構比 YOLO 和 SSD 的架構小。
它采用的是深度可分離卷積層(Depthwise Separable Convolution),而不是標準的卷積層,這樣就降低了計算量。
優點:
非常好的推理速度,且人臉檢測的準確率高。
缺點:這個模型的優化目標是對手機攝像頭獲取的圖像進行人臉檢測,因此它預期人臉會覆蓋圖像中的大部分區域,而當人臉尺寸較小時,它的識別效果就是很好。所以,當對閉路電視攝像機獲取的(CCTV ,Closed Circuit Tele Vision)圖像進行人臉檢測時,它表現得并不理想。
Faceboxes
Faceboxes 是我們使用的最新的人臉檢測算法。與 BlazeFace 類似,它是一個小型的深度卷積神經網絡,只為檢測一種類別——人臉而設計。它的推理時間可滿足 CPU 上的實時檢測需求。它的準確度可以與 Yolo 人臉檢測算法相媲美,而且,不管圖像中的人臉較大還是較小,它都可以精確地檢測。
優點:推理速度快,準確性好。
展開 在 Python 中使用 TensorFlow 進行面罩檢測 ¥8.8
['RED' 代表 'without_mask' 和 'GREEN' 代表 'with_mask]
labels_dict={0:'without_mask',1:'with_mask'}
color_dict={0:(0,0,255),1:(0,255,0)}
10 第 8 步:導入人臉檢測程序
在此之后,我們打算使用它來檢測我們是否使用 PC 的網絡攝像頭戴著口罩。為此,首先,我們需要實現人臉檢測。在這方面,我們使用基于 Haar 特征的級聯分類器來檢測面部特征。
face_clsfr=cv2 中。級聯分類器('haarcascade_frontalface_default.xml')
這個級聯分類器由 OpenCV 設計,通過訓練數千張圖像來檢測正面。需要下載相同的 .xml 文件并用于檢測人臉。我們已將文件上傳到 GitHub 存儲庫。
11 第 9 步:檢測帶和不帶蒙版的人臉
在最后一步中,我們使用 OpenCV 庫運行一個無限循環,以使用我們的網絡攝像頭,在該循環中,我們使用 Cascade Classifier 檢測人臉。代碼 webcam = cv2。VideoCapture(0) 表示 webcam 的用法。
該模型將預測這兩個類 ([without_mask, with_mask]) 中每個類的可能性。根據較高的概率,標簽將被選擇并顯示在我們的臉周圍。
main.py
Python3 語言
展開 
超聲波傳感器在行人檢測中的應用
行人檢測、行人跟蹤和行人檢索三項技術,在工業界已全面落地開花,其被廣泛應用于人工智能、車輛輔助駕駛系統、智能機器人、智能視頻監控、人體行為分析、智能交通等領域。而行人檢測是計算機視覺中一個重要但具有挑戰性的問題,特別是在以人為中心的任務中由于行人兼具剛性和柔性物體的特性,外觀易受穿著、尺度、遮擋、姿態和視角等影響是計算機視覺領域中一個既具有研究價值、同時又極具挑戰性的熱門課題。下面工網小編和大家一起了解一下超聲波傳感器在行人檢測中的應用。
行人檢測技術是自動駕駛、機器人以及智能視頻監控等研究領域的核心技術。行人檢測通過圖像處理、計算機視覺相關算法以及機器學習等技術對道路行人進行識別和追蹤,在智能車輛、自動導航、運動分析等領域都有著廣泛的應用前景。傳統的行人檢測方法主要是對目標的形狀、大小、紋理等進行識別,這種方法在圖像噪聲較大或行人多姿勢變化等場景下性能不理想。
而行人檢測要解決的問題是找出圖像或視頻幀中所有的行人,包括位置和大小,一般用矩形框表示,和人臉檢測類似,這也是典型的目標檢測問題。針對行人檢測工采網推薦使用一款MaxBotix 行人檢測超聲波傳感器 - MB1010。
該傳感器MB1010是一款超低功耗、寬波束角和高靈敏度的超聲波傳感器,它可以通過脈寬輸出、模擬電壓輸出以及串口輸出得到可靠穩定的距離數據。并且測量周期短,可測距離長達6.45米。同時,它也是公司最受歡迎的室內超聲波傳感器,因為它是一款非常出色的低成本通用型傳感器。被廣泛應用于行人檢測、安全、運動檢測、可電池供電、自動導航、教育和愛好機器人學、避免碰撞等領域。
展開 電子器件電容式傳感器本體的成分結構與檢測特性
電子器件電容式傳感器本體的成分結構與檢測特性-藤倉自動化
電容式傳感器是一種電子器件,可以簡單地檢測和測量運動化學性質、位移、電場等各種事物,還可以間接檢測許多其他可以轉化為電常數或運動的變量,如加速度、壓力、流體成分、液位等。電容傳感器將從傳感器的檢測端產生電場來檢測這些目標。傳感器可以檢測任何可能破壞電場的物體。
一、電容式傳感器的成分結構:
傳感器本體、傳感面、指示燈、電纜或電纜連接端是電容式傳感器的四大主要部件。
·傳感器主體-允許傳感器運行的電路位于傳感器主體內。
·感應人臉-檢測人臉是傳感器中可以檢測目標的部分。
·指示燈-指示燈位于傳感器感應面的另一端。當目標在傳感器的感應范圍內時,此燈會亮起,如果目標在感應范圍之外,此燈會熄滅。
·傳感器連接-這些傳感器可以通過剛剛連接的電纜或電纜擰入的連接器來獲取。
二、電容式傳感器的特性:
·可以檢測非金屬目標。
·可以檢測機戒限位開關無法檢測到的膠輕的物體或小物體。
·具有高開關率,可在對象計數應用中快速響應。
·可以通過非金屬屏障幫助檢測液體目標。
·由于其幾乎無限的操作周期,它們的使用壽命很長。
文章來源:https://www.sztengcang.com/news/hydt/1225.html
展開 對象檢測 vs 對象識別 vs 圖像分割
醫學影像處理:物體識別和圖像處理技術可以幫助更準確地檢測疾病。圖像分割有助于檢測體內存在的缺陷的形狀。例如,用于乳腺癌檢測的 Google AI 比醫生更準確地檢測。
監控和安防:如人臉識別、物體跟蹤、活動識別等。
?
養貓養狗膩味了 可以養養這個機器人
導讀: Vector機器人擁有一個高分辨率的顯示屏,能投射出多種多樣豐富的表情,這套表情系統其實關聯的是內部的檢測系統,也就是自帶的攝像頭傳感器,當它檢測到你的人臉時,就能面朝你做出不同表情,這一點也是從上一代Cozmo機器人身上繼承下來的優點。
如果《機器人總動員》中的瓦力機器人真的存在,它該是什么樣?
兩年前,極客之選曾經和小伙伴們介紹過一個有些特別的機器人——Cozmo,僅僅只靠一雙“炯炯有神”的眼睛就能傳達出喜怒哀樂的表情,當時給人的感覺就像是現實版瓦力。
除了長相Q萌之外,作為玩具的它嘗試用獨特的表情系統進行互動,并且擁有人臉檢測和環境探測等特性,可以說是當年最令我們驚喜的高科技玩具。在之后我們也對它進行了深入評測,它給人最大的感覺并不是聰明,而是充滿想象力和靈動感,但當時我們認為如果能為其加入語音交互,或者提供更多組件,它會變得更有意思。
時隔兩年時間,Cozmo機器人開發公司Anki終于發布了這個機器人的新一代——Vector,這一次,它變得更大膽更有趣,同時也更符合我們當時的想象。
我們常常覺得有些小孩很可愛還會賣萌,因為他們能通過自己的表情和動作給人一種特別的“萌動”感,在Vector機器人身上,你也能發現類似的感覺,比如它能通過一眨一眨的眼睛來表達出情緒。
這種動感給人的感覺就像機器人有了生命,而之能夠實現它們的基礎,在于獨特的硬件組合及交互設計。
Vector機器人擁有一個高分辨率的顯示屏,能投射出多種多樣豐富的表情,這套表情系統其實關聯的是內部的檢測系統,也就是自帶的攝像頭傳感器,當它檢測到你的人臉時,就能面朝你做出不同表情,這一點也是從上一代Cozmo機器人身上繼承下來的優點。
展開 盤點一下不到100行的給力代碼
目標檢測是指計算機和軟件系統能夠定位出圖像/畫面中的物體,并識別出它們。目標檢測技術已經廣泛應用于人臉檢測、車輛檢測、人流量統計、網絡圖像、安防系統和無人車等領域。和其它計算機視覺技術一樣,目標檢測未來會進一步成為人工智能的重要組成部分,有著廣闊的發展前景。
不過,在軟件應用和系統中使用現代目標檢測方法以及根據這些方法創建應用,并非簡單直接。早期的目標檢測實現主要是應用一些經典算法,比如OpenCV中支持的算法。然而這些算法的表現并不穩定,在不同情況下差異巨大。
2012年深度學習技術的突破性進展,催生了一大批高度精準的目標檢測算法,比如R-CNN,Fast-RCNN,Faster-RCNN,RetinaNet和既快又準的SSD及YOLO。使用這些基于深度學習的方法和算法,需要理解大量的數學和深度學習框架。現在全世界有數以百萬計的開發者在借助目標檢測技術創造新產品新項目,但由于理解和使用較為復雜困難,仍有很多人不得要領。
為了解決這個困擾開發者們的問題,計算機視覺專家Moses Olafenwa帶領團隊推出了Python庫ImageAI,能讓開發人員只需寥寥數行代碼就能很容易的將最先進的計算機視覺技術應用到自己的項目和產品中。
我們開頭所示的10行代碼實現,就是要用到ImageAI。
如何借助ImageAI輕松實現目標檢測
使用ImageAI執行目標檢測,你只需以下4步:
1.在電腦上安裝Python
2.安裝ImageAI及其環境依賴
3.下載目標檢測模塊文件
4.運行示例代碼,就是我們展示的那10行
下面我們一步步詳細講解。
展開 葉聰:朋友圈背后的計算機視覺技術與應用
再介紹一下騰訊云人工智能目前的提供的服務領域,包括各種人臉合成,身份證識別,智能監控,人臉軋機還有智能語音方面上的:關鍵詞搜索,語音合成等等。同時還有一些機器學習的平臺可以幫助大家快速的去實現一些模型。同時還有大數據,可以做海量數據的數據挖掘。還有其他一些底層的服務,包括CPU等等。相當于像物理機,但是完全可以交給物理云去托管。
介紹一下人臉識別的例子。人臉識比較常見的幾個應用,比如微信,人臉合成只需知道你的身份??煽啃愿哌_99.5%。人臉檢測又分靜態與活體的檢測,靜態檢測只是比對你的特征與庫里面是否一致。但假設有人用一些視頻或照片來攻擊這個系統,可以采取包括以下幾種模式的一整套活體檢測的方法:一是讓你讀一段文字或者做一些動作,或者是屏幕用不同的光線去照射臉部,利用反射光的一些特點來對臉部做區分,3D建模,從而判斷是視頻還是真人。除此之外還可采用具有3D建模能力的攝像頭,打一道光到人臉上,再將反射光收集起來。目前這些技術我們的這些技術都已比較成熟。
剛才講的是1比1的人臉合成,除此之外還有用于大型場所管理的1:N的。大家如果有機會,如果去深圳可以去騰訊的濱海大廈參觀一下,整套系統都是用這個搭建的。另外我們提供針對場景的云智智能視頻管理平臺。同時提供設備管理以及視頻監控、對外接口等一整套服務。
再來說下文字OCR,后面冀博士會詳細的介紹這部分。目前我們能使用的領域也非常廣泛,包括名片識別,傳單識別,快遞單識別等等。到了技能進階這個部分,很多人覺得做AI并不需要做算法,其實不然。首先從有想法到落地分非常多的環節。算法是非常重要的,只是相關性沒有那么強。
展開 AI芯片公司的技術路線抉擇!
地平線則是先選擇應用場景,針對此應用的算法去定制AISC芯片(這也是為數不少的公司的技術路線選擇)——針對智能攝像頭人臉檢測,開發旭日處理器;針對自動駕駛,開發征程1.0處理器。這屬于是先去設計解決方案,為了用在智能端側上的的處理器,采取“算法+芯片”的這種芯片定制設計的路線。深鑒科技則采用另一種路線,采用FPGA而非定制集成電路芯片。
FPGA最大的特點在于硬件結構可編程性。即使深度學習算法發生變化,FPGA一樣可以靈活的配置硬件結構,快速切入市場;而上述根據算法定制芯片ASIC,顯得劣勢,并且ASIC的設計生產與半導體芯片產品周期相仿,大概在12-18個月,則風險變得更大。但某些邊緣場景中,ASIC有更低功耗,體積更小的優勢。
我們不妨把目光轉移到深圳兩家AI初創公司——云天勵飛(IntelliFusion)和耐能(Kneron)。他們都有同一個特點,在選定特定的解決方案之后,把AI應用需求拓展到端側硬件,并且第一代產品采用了FPGA進行開發,而在2018年都不約而同在第二代產品上進入根據特定算法設計ASIC的方案(具體實施技術架構系統還是有不同,暫且按下不表)。這可以說是一種技術路線選擇的趨勢。但是我們仍然不能說,ASIC路線要比FPGA路線更為先進。這路線的選擇與應用場景是強相關的。
根據集邦觀察分析,Xilinx早已進入汽車領域。同時為了重申其于汽車產業的長期投入,以及看好FPGA將在自動駕駛車內部發揮重要作用,Xilinx宣布與戴姆勒(Daimler AG)合作,為未來的奔馳(Mercedes-Benz)新車款開發“超高效率AI解決方案”。Xilinx首先在車載系統,ADAS(高級輔助系統,非AI決策)證明了FPGA的高效適用。
展開 
安博會的這些安防機器人你入眼了嗎?
其中,全防損巡檢機器人能夠實現自主行走避障、性能指示燈識別、表計讀取、異常熱點識別、全局煙感、有害氣體監測、異常聲音識別、熱紅外溫度分析等功能,同時配有人性化的后臺,便于管理者輕松查看機器人狀態、監控視頻畫面、進行機器人調度與控制、生成報警日志,完美適應數據中心機房、工業管道、?;贰⑸a車間、倉儲間等應用場景的安全防損巡檢需求;偵察巡邏機器人則具備卓越的人臉檢測、圖像預處理、特征提取以及匹配與識別能力,能夠穿行于車站、機場、廣場等場景,完成平安城市工程中涉及的巡邏工作,也越來越多的被應用于諸如住宅、商業地產、園區的夜間巡邏當中。
本次安博會上出現的安防機器人當然不止于以上五款,不過限于時間問題,筆者并未全部挖掘。但值得肯定的是,一個機器人可以替代2.4個安防人員工作的安防機器人市場,正在擁抱一個億萬級藍海市場。
展開 谷歌手機芯片最強解讀
受益于Tensor,拍照時的人臉檢測也應該更快、更準確。
谷歌聲稱 Tensor 將允許改進現有功能和全新功能,例如新發布的運動模式、面部去模糊和視頻語音增強模式。
該公司還表示,它使 Pixel 6 系列能夠隨著時間的推移不斷變得更好。
據谷歌稱,與其他芯片組相比,Tensor 可以完成大部分工作,同時還可以節省電量,從而延長電池壽命。
谷歌宣揚的另一件事是該芯片組的安全性。
Tensor 有一個安全核心(這意味著敏感任務可以在專用環境中運行),并加入了 Titan M2 安全芯片。在兩者之間,這使得 Pixel 6 系列比該系列之前的型號更能抵御攻擊。
事實上,谷歌聲稱 Pixel 6 和 Pixel 6 Pro 擁有所有手機中最多的硬件安全層,獨立的安全實驗室測試表明它可以抵御各種高科技威脅,例如電磁分析、電壓毛刺和激光故障注入。
Google Tensor 芯片組還允許 Pixel 6 獲得五年的安全更新,而其他 Android 手機大多只能獲得幾年的安全更新。
谷歌制造自己的芯片組的最后一個潛在優勢是,它不必向高通這樣的另一家公司付款,因此通過去掉中間商,它最終可以省錢。但最終還是有關鍵詞的。
雖然谷歌沒有談到 Tensor 的財務狀況,但This is Tech Today 的M. Brandon Lee最近辯稱,開發新的芯片組需要很多時間,雖然最終可能會節省成本,但他們不會在幾年內這樣做。
展開 多特征融合的多目標跟蹤網絡
如檢測效果與速度均在頂尖水平的 RetinaFace人臉檢測網絡。除了使用輕量化網絡改進分割算法外,ICNet則使用了使用模型壓縮技術如量化、蒸餾、模型剪枝等技術針對訓練后的模型進行壓縮優化,并且在網絡中設計了低分辨率分割分支能夠使網絡快速獲得一個粗略的語義信息,再融合更高分辨率分支的結果補充細節,最終得到一個比較不錯的精度與分割速度的平衡。
在深度學習落地這一強大驅動力下,越來越多的研究人員不再熱衷于構造復雜又冗余的網
絡結構針對分割準確率進行刷榜。
伴隨著移動設備越來越強大的計算能力,很多語義分割應用
都在移動平臺實現了落地,如手機端的人物換臉、自動摳圖、智能換背景等應用都使用了語義
分割方法對主體與背景進行了精細的分割。
只是這類應用通常只需處理一張圖像,對實時性要
求不高。
而自動駕駛或服務機器人的使用場景則對實時性有很高的要求。
展開 計算機視覺中的傳統特征提取方法總結
放一張SIFT/HOG/LBP優缺點、適用范圍對比圖:
5.4 HAAR
人臉檢測最為經典的算法Haar-like特征+Adaboost。這是最為常用的物體檢測的方法(最初用于人臉檢測),也是用的最多的方法。
訓練過程: 輸入圖像->圖像預處理->提取特征->訓練分類器(二分類)->得到訓練好的模型;
測試過程:輸入圖像->圖像預處理->提取特征->導入模型->二分類(是不是所要檢測的物體)。
Haar-like特征是很簡單的,無非就是那么幾種,如兩矩形特征、三矩形特征、對角特征。后來,還加入了邊緣特征、線特征、中心環繞特征等。使用積分圖可以加速計算特征。最后,使用集成的方法Adaboost進行訓練。
具體細節可以參考文章:
特征提取之Haar特征
https://link.jianshu.com/?t=http://blog.csdn.net/xizero00/article/details/46929261
再附一個Haar和HOG比較的問題:
為什么在行人檢測中,HOG特征比Haar特征更精確?
https://link.jianshu.com/?
展開