
發布
注冊
/
登錄YOLOv的案例
使用 YOLOv11 完成山羊檢測和計數 ¥5
Complete Goat Detection and Counting Using YOLOv11
MP4 |視頻: h264, 1280x720 |音頻:AAC,44.1 KHz,2 Ch
語言:英語 |時長: 35m |大?。?383 MB
了解使用 YOLOv11 進行山羊檢測和計數的完整開發
了解使用 YOLOv11 進行山羊檢測和計數的完整開發
您將學
到的內容 山羊
模型訓練和優化的數據注釋和準備
實時應用程序部署
完成 YOLOv11 項目
要求
:基本的Python和ML知識
描述
通過“使用 YOLOv11 完成山羊檢測和計數”課程,解鎖 AI 驅動的對象檢測功能!這門綜合課程專為初學者和中級學習者設計,側重于使用最新的對象檢測技術 YOLOv11 構建一個真實世界的項目,用于檢測和計算圖像或視頻源中的山羊。本課程首先介紹 YOLOv11 及其強大的架構,為創建準確的檢測系統奠定了基礎。您將學習如何準備數據集、注釋圖像以及訓練為山羊檢測量身定制的 YOLOv11 模型。深入研究提高模型準確性、優化性能以及在農場管理或動物跟蹤系統等實時應用程序中部署模型的實際步驟。課程亮點: 了解 YOLOv11 的架構及其在對象檢測任務中的優勢。了解如何收集、標記和預處理數據以訓練 YOLOv11.訓練 YOLOv11 模型以檢測和計數山羊,微調參數以提高準確性。實施經過訓練的模型,以便在視頻源或 IoT 設置中進行實時山羊檢測和計數。分析檢測結果,識別挑戰,并優化模型以獲得更好的性能。本課程非常適合開發人員、AI 愛好者以及希望將 AI 解決方案集成到其工作流程中的農業或畜牧業行業的任何人。
展開 使用 Yolov11 進行實時對象檢測(帶案例) ¥8
2025 年 5 月出版
MP4 |視頻:h264、1920x1080 |音頻:AAC,44.1 KHz
語言:英語 |大?。?.04 GB |時長: 3h 0m
從注釋到推理:完整的 YOLOv11 工作流程
學習內容
了解使用 YOLOv11 進行計算機視覺和對象檢測的基礎知識。
在自定義數據集上設置和訓練 YOLOv11 模型,以進行實時對象檢測。
使用精度、召回率和 mAP 指標評估和微調 YOLOv11 性能。
使用 Python 和 OpenCV 為實際應用程序部署 YOLOv11 模型。
要求
對 Python 編程
有基本的了解 熟悉機器學習或深度學習概念是有幫助的,但不是強制性
的 具有穩定互聯網連接和至少 8GB RAM 的計算機(建議將 GPU 用于訓練模型)
愿意學習和試驗計算機視覺工具和代碼
描述
使用 YOLOv11 釋放尖端計算機視覺的力量,YOLOv11 是“You Only Look Once”對象檢測架構的最新和最先進的版本。本實踐課程將帶您從對象檢測的基本概念到實時構建、訓練和部署您自己的 YOLOv11 模型。無論您是 AI 初學者,還是希望提升技能的經驗豐富的開發人員,本課程都能提供完整、實用的學習體驗。您將使用真實數據集,學習如何注釋和準備數據,使用 Ultralytics 框架訓練模型,使用關鍵指標評估性能,并使用 Python 和 OpenCV 部署模型。每個模塊都包括代碼演練、作業和項目,旨在強化關鍵技能。不需要任何 YOLO 經驗,我們將通過清晰的說明和示例指導您完成每個步驟。此外,您還將深入了解對象檢測在各個行業的使用,包括自動駕駛、醫療保健、零售分析和監控。
展開 基于深度學習的目標檢測算法面試必備(RCNN~YOLOv5)
論文:Focal Loss for Dense Object Detection
主要優點
1、多尺度:借鑒FPN網絡通過自下而上、自上而下的特征提取網絡,并通過無代價的橫向連接構建增強特征提取網絡,利用不同尺度的特征圖檢測不同大小的目標,利用了底層高分率的特征圖有效的提高了模型對小尺度目標的檢測精度
2、樣本不平衡:引入Focal Loss用于候選框的【類別預測】,克服正負樣本不平衡的影響及加大困難樣本的權重
主要不足
1、實時性:網絡使用ResNet-101作為主干特征提取網絡,檢測效率略微不足
YOLOv3
論文:YOLOv3: An Incremental Improvement
主要優點
1、實時性:相比RetinaNet,YOLOv3通過犧牲檢測精度,使用Darknet主干特征提取網絡而不是Resnet101,從而獲取更快的檢測速度
2、多尺度:相比于YOLOv1-v2,與RetinaNet采用相同的FPN網絡作為增強特征提取網絡得到更高的檢測精度
3、目標重疊:通過使用邏輯回歸和二分類交叉熵損失函數進行類別預測,將每個候選框進行多標簽分類,解決單個檢測框可能同時包含多個目標的可能
主要不足
1、準確率:主要因為Darknet的特征提取不夠強,未進行精細化結構模型設計
YOLOv4
論文:YOLOv4: Optimal Speed and Accuracy of Object Detection
鑒于YOLOv3的缺點,YOLOv5進行了Darknet53主干特征提取網絡等一系列改進
主要優點
1、實時性:借鑒CSPNet網絡結構將Darknet53改進為CSPDarknet53
展開 深度學習|基于MobileNet的多目標跟蹤深度學習算法
對于多目標跟蹤算法, 由于很難使用單一評分評估多目標跟蹤性能, 采用MOT Challenge評價標準.
3.1
目標檢測算法對比實驗
表 1為YOLOv3目標檢測算法、基于MobileNet的目標檢測算法和其他檢測算法實驗對比結果.
表 1 目標檢測算法性能對比結果
本文選取比較流行的單階段檢測算法和兩階段檢測算法進行對比實驗. 由表 1可見, 基于MobileNet的目標檢測算法模型是YOLOv3算法模型的1/3, 并且相比SSD和Fater R-CNN, 模型最小; 單張圖片檢測時間相比YOLOv3模型提高了2倍; 在精度方面, 本文檢測算法相比YOLOv3模型下降約12.4 %, 但相比SSD提高1.5 %. 總體而言, 雖然本文檢測算法在檢測精度上有所降低, 但可以滿足檢測跟蹤的實際需求, 并且在模型大小和單張檢測時間上具有優勢. 精度降低的原因是由于YOLOv3的網絡結構中使用了殘差網絡, 并且網絡層數更深, 而MobileNet網絡結構僅使用深度可分離卷積, 沒有使用殘差結構, 在網絡深度方面也比YOLOv3更淺, 因此造成本文檢測算法在mAP值上與YOLOv3差距較大.
展開 
YOLO v2 – 對象檢測
結果和結論:
不同對象檢測框架的結果
YOLOv2 在 PASCAL VOC 和 COCO 上提供了最先進的檢測精度。它可以在不同尺寸上運行,從而在速度和準確性之間進行權衡。在 67 FPS 時,YOLOv2 可以提供 76.8 的 mAP,而在 40 FPS 時,檢測器的精度為 78.6 mAP,優于更快的 R-CNN 和 SSD 等最新模型,同時運行速度明顯快于這些模型。
不同物體檢測的速度與精度曲線
該模型也是 YOLO9000 模型的基礎,該模型能夠實時檢測 9000 多個類。
無人車行駛環境圖像的幾何測距
目前基于深度學習的主流目標檢測算法主要有以R-CNN[14-16]系列(R-CNN、Fast R-CNN、Faster RCNN)為代表的算法,和以SSD[17]、YOLO[18-20]系列(YOLOv1,YOLOv2,YOLOv3,Tiny-YOLO)為代表的算法。一般情況下,R-CNN系列算法精度比SSD、YOLO系列算法高,但SSD、YOLO系列算法速度更快。SSD、YOLO系列算法在經過改進后精度已有很大的提升,已接近甚至超越了R-CNN系列算法。本文中基于YOLOv2模型的簡化版本Tiny-YOLOv2進行目標檢測,提高了訓練速度與處理效率。
1.2 Tiny-YOLOv2網絡改進
本文中的數據集數據較少、物體種類不多,且識別目標較小,基于通用物體識別的Tiny-YOLOv2網絡并不能表現出最優的檢測效果,故在此對原網絡模型進行改進。由于Tiny-YOLOv2本身即為簡化版本,網絡結構已達到效率最高,故在此保留原網絡層數,而將第13層的卷積層由Conv3*1024改為Conv3*512,將最后一層卷積層由Conv1*425改為Conv1*50,具體情況如表1所示,以此來進一步提高物體的檢測準確率與檢測效率。
表1 改進前后網格對比
利用265張訓練集圖片數據進行訓練,60張測試集圖片進行測試,共檢測識別了5種不同的物體,分別為門牌、逃生通道燈、車牌和兩種常見提示牌,在同一電腦配置下,通過原網絡和改進網絡進行訓練,在其余參數設置相同的情況下,原網絡在迭代次數為400次時損失函數不再下降,改進網絡在迭代次數為1 100次時損失函數不再下降,改進網絡訓練情況部分識別結果如圖1所示,原網絡訓練情況在這里不做描述,訓練集損失函數對比如圖2所示。
展開 yolov7-pytorch可用于訓練自己的數據集
YOLOV7:You Only Look Once目標檢測模型在pytorch當中的實現
所需環境
torch==1.2.0+
為了使用amp混合精度,推薦使用torch1.7.1以上的版本。
全部 代碼 ,預訓練模型 獲取方式:
關注微信公眾號 datayx 然后回復 v7 即可獲取。
訓練步驟
a、訓練VOC07+12數據集
數據集的準備
本文使用VOC格式進行訓練,訓練前需要下載好VOC07+12的數據集,解壓后放在根目錄
數據集的處理
修改voc_annotation.py里面的annotation_mode=2,運行voc_annotation.py生成根目錄下的2007_train.txt和2007_val.txt。
開始網絡訓練
train.py的默認參數用于訓練VOC數據集,直接運行train.py即可開始訓練。
訓練結果預測
訓練結果預測需要用到兩個文件,分別是yolo.py和predict.py。我們首先需要去yolo.py里面修改model_path以及classes_path,這兩個參數必須要修改。
model_path指向訓練好的權值文件,在logs文件夾里。
classes_path指向檢測類別所對應的txt。
完成修改后就可以運行predict.py進行檢測了。運行后輸入圖片路徑即可檢測。
b、訓練自己的數據集
數據集的準備
本文使用VOC格式進行訓練,訓練前需要自己制作好數據集,
訓練前將標簽文件放在VOCdevkit文件夾下的VOC2007文件夾下的Annotation中。
訓練前將圖片文件放在VOCdevkit文件夾下的VOC2007文件夾下的JPEGImages中。
展開 智慧課堂實時監測系統
YOLOv3目標檢測
項目中教室內學生的位置檢測以及人數統計使用Paddle模型庫中的YOLOv3模型
數據集
采用我校教務處提供的一周(5天)教學視頻為基礎,每天視頻時長14小時(8:00——22:00,有前后兩個攝像頭),每隔10分鐘截取一張圖片,一共289張圖片,進行人為手工標準(EasyDL平臺上也有相同模型)
訓練
在本機上以batch_size=2,一共訓練20000輪
RestNet圖像分類
在目標檢測將學生位置識別出來之后,將這些學生圖像單獨摳出來放入到圖像分類模型中進行分類,分為:正常聽課、看手機、睡覺、站立,采用Paddle模型庫中的ResNet模型,56層
數據集
在上一步目標檢測標注完的數據集基礎上,將所有學生摳出來保存成單獨的圖片,進行分類,一共正常:2431張,看手機:1149張,睡覺:189張,站立:56張
為了不讓數據樣本偏差太大,隨機抽取比較平衡的數據量:正常:300張,看手機:300張,睡覺:189張,站立:56張
訓練
以batch_size=8,進行100輪的訓練
top1 acc=0.7
調用方式
情感分類
使用Paddle模型庫中Senta情感分類模型進行文字的情感傾向分析
數據集
從互聯網中查找在課堂場景中的語言文本,分為積極、消極兩類
功能介紹
實時監測線程
本項目中的所有監測功能均采用線程的方式進行識別
對于GPU的調用、UI的刷新都用線程鎖進行控制
總監控界面
總監控頁顯示了對于所有教室的統籌監控,顯示該課堂的基本信息以及教室內的學生人數
用戶可以在教學樓欄里按照校區、教學樓、樓層進行篩選
在狀態欄里可以根據該教室是上課還是下課進行篩選
實時監控界面
展開 視覺傳感器:2D感知算法
YOLOv1采用卷積和Pooling結合提取特征,最后的特征圖空間大小為7*7。與SSD和RetinaNet不同,YOLOv1采用全連接層直接輸出每個7*7位置的物體類別和邊框,并不需要Anchor的輔助。每個位置輸出兩個物體,并選擇置信度較大的那一個。當場景中小物體比較多的時候,相近位置的物體有可能會被丟掉,這也是YOLOv1的一個主要問題。
之后YOLO又推出四個改進的版本(v2-v5),增強了特征提取網絡,采用多尺度特征圖,利用了Anchor和IOU Loss來輔助邊框回歸,以及很多其他物體檢測領域的Trick,大幅提高了檢測的準確率,在運行速度和部署的靈活性上也仍然保持了YOLO一貫的優勢。
YOLO
2.3 無Anchor檢測
之前介紹的方法大都采用Anchor來輔助物體框的回歸。Anchor的參數是需要手工設計的,通常需要根據不同的檢測任務設計不同的Anchor,影響了算法的通用性。此外,為了覆蓋任務中的所有物體,Anchor的數量會比較大,對算法的速度也有一定影響。
因此,如何避免使用Anchor或者說讓網絡自動的學習Anchor參數,目前受到了越來越多的重視。這類方法一般是將物體表示為一些關鍵點,CNN被用來回歸這些關鍵點的位置。關鍵點可以是物體框的中心點(CenterNet),角點(CornerNet)或者代表點(RepPoints)。
CenterNet[8]采用多層卷積神經網絡處理輸入圖像,將其轉換成物體類別的Heatmap,其上的Peak位置對應物體中心。中心點處的特征被用來進行邊框的回歸。整個網絡可以完全通過卷積操作來實現,非常的簡潔。
展開 面部識別算法是如何工作的?
YOLOV3
YOLO(“You only look once”)是用于物體檢測的最先進的深度學習算法。它由許多卷積神經網絡組成,形成一個深度 CNN 模型 (深度意味著模型架構復雜性很高)。
原始的 YOLO 模型可以檢測 80 個不同的物體類別,而且檢測精度很高,而我們只需要用該模型檢測一個物體——人臉。我們在 WiderFace(包含 393,703 個面部標簽 的圖像數據集)數據集上訓練了這個算法。
YOLO 算法還有一個微型版本,即 Yolo-Tiny。Yolo-Tiny 需要的計算時間比較少,但卻犧牲了一些準確性。我們用相同的數據集訓練了一個 Yolo-Tiny 模型,其邊界框(boundary box)結果并不一致。
優點:非常準確,沒有任何缺陷。比 MTCNN 更快。
缺點:由于具有巨大的深度神經網絡層,它需要的計算資源更多。因此,該算法在 CPU 或移動設備上運行地很慢。在 GPU 上,它的大型架構也需要耗費更多的 VRAM。
SSD
SSD(Single Shot Detector)也是一個類似 YOLO 的深度卷積神經網絡模型。
優點:良好的準確性。它可以檢測各種姿勢、光照和遮擋。良好的推理速度。
缺點:比 YOLO 模型差。雖然推理速度較好,但仍不能滿足在 CPU、低端 GPU 或移動設備上運行的要求。
BlazeFace
就像它的名字一樣,它是由谷歌發布的速度極快的人臉檢測算法。它接受 128x128 維的圖像輸入,推理時間是亞毫秒級,已優化到可以在手機中使用。
展開 自動駕駛汽車中的激光雷達和攝像頭傳感器融合
這部分不過多描述,像YOLOv4這樣的算法可以執行對象檢測。有關它的更多信息,可以閱讀YOLOv4研究評論。
3.ROI匹配
最后一部分稱為感興趣區域匹配。我們將簡單地融合每個邊界框內的數據。
輸出是什么?
對于每個邊界框,相機給出分類結果。
對于每個激光雷達投影點,都有一個非常準確的距離。
?? 因此,我們得到了準確測量和分類的物體。
可能會出現一個問題:我們選擇哪一點作為距離?
每個點的平均值?
中位數?
中心點?
最近的?
使用2D障礙物檢測時,會遇到如下問題。如果我們選擇的點屬于另一個邊界框怎么辦?或者屬于背景?這是一個棘手的過程。分割方法可能會更好,因為將點與像素精確匹配。
下面是結果的樣子,箭頭顯示融合可能失敗的點。
后期傳感器融合:融合結果
后期融合是在獨立檢測后融合結果。
我們可以想到的一種方法是運行獨立檢測,在兩端獲得3D邊界框,然后融合結果。
另一種方法是運行獨立檢測,得到兩端的2D邊界框,然后融合結果。
因此我們有兩種可能;在2D或3D中進行融合。
下面是一個2D示例:
在本文中,我將介紹3D過程,因為它更難。相同的原則適用于2D。
展開 
深度學習算法檢測無人機靠譜嗎?
這些算法分別是Cascade R-CNN,Faster R-CNN,FPN,Grid R-CNN,RefineDet,RetinaNet,SSD512和YOLOv3。
02
深度學習算法檢測無人機的效果
有了數據和算法后,接下來就可以開展基于視覺信息的無人機檢測的研究了。首先,Det-Fly被分成了訓練集和測試集,然后分別對這8種算法做了訓練和測試。從測試的結果來看,基于視覺信息的無人機檢測確實是一個非常具有挑戰性的任務,目前這些主流算法的檢測成功率都在70%~80%之間。各算法在一些測試視頻上的表現見下面的視頻。
視頻:各算法在數據集上的測試結果
那么,影響無人機檢測的因素有哪些呢?其中的難點是什么呢?我們把目光聚焦在了觀測距離、觀測視角、背景環境以及挑戰性因素,并且在實驗中有了一些發現: 1)隨著觀測距離的增大,無人機檢測的成功率呈現迅速下降的趨勢,見圖5; 2)在仰視、平視和俯視三個視角中,平視的檢測難度最大,仰視的檢測成功率最高,見圖6; 3)天空背景最容易檢測到無人機,而城市環境最困難,見圖7;4)在強/弱光、運動模糊和部分遮擋這三個挑戰性因素的測試中,部分遮擋對無人機檢測的影響最大,運動模糊的影響較小,見圖8。
03
小 結
基于視覺信息的無人機檢測是一個富有挑戰性的問題,即便是目前性能最好的一些深度學習算法仍然無法有效解決這個問題。
展開 用于自動駕駛的實時車道線檢測和智能告警
然后,我們使用YOLOv5來構建對道路上其他物體的理解。這可以用來生成智能警報。
英文原文:
https://towardsdatascience.com/real-time-lane-detection-and-alerts-forautonomous-driving-1f0a021390ee
幾個攝像頭和雷達融合的目標檢測方法
后處理采用gradient boosting,視覺來自YOLOv3,雷達來自1D segmentation network。
FCN-8 inspired radar network
Image of a radar detection example with four predicted slice bundles
YOdar
2 “Warping of Radar Data into Camera Image for Cross-Modal Supervision in Automotive Applications”,12,2020
將雷達的range-Doppler (RD) spectrum投射到攝像頭平面。由于設計的warping函數可微分,所以在訓練框架下做BP。該warping操作依賴于環境精確的scene flow,故提出一個來自激光雷達、攝像頭和雷達的scene flow估計方法,以提高warping操作精度。實驗應用涉及了direction-of-arrival (DoA) estimation, target detection, semantic segmentation 和 estimation of radar power from camera data等。
展開 12篇論文看盡深度學習目標檢測史
2018: YOLO v3
YOLOv3: 漸進式改進
YOLO v3 是官方 YOLO 系列的最后一個版本。遵循 YOLO v2的傳統,YOLO v3從以前的研究中借鑒了更多的想法,并且得到了一個難以置信的像怪物一樣強大的單階段檢測器。YOLO v3很好地平衡了速度、準確率和實現的復雜性。由于它的快速和簡單的組件,它在行業中非常受歡迎。
源自論文“Dive Really Deep into YOLO v3: A Beginner’s Guide”
源自論文“Dive Really Deep into YOLO v3: A Beginner’s Guide”
簡單地說,YOLO v3的成功來自于它更強大的主干功能提取器和帶有 FPN 頸部的類似 RetinaNet 的檢測頭。新的主干網絡 Darknet-53利用了 ResNet 的skip連接,以達到與 ResNet-50相當的準確度,但速度要快得多。此外,YOLO v3拋棄了 v2的pass through層,完全采用 FPN 的多尺度預測設計。從那時起,YOLO v3終于扭轉了人們對它在處理小目標時表現不佳的印象。
此外,關于 YOLO v3還有一些有趣的事實。它diss了 COCO mAP 0.5:0.95度量標準,證明了條件密集預測時Focal Loss沒啥用。一年后作者Joseph甚至決定放棄整個計算機視覺研究,因為他擔心會用到軍事上。
2019: Objects As Points
盡管近年來圖像分類領域變得不那么活躍,但目標檢測的研究還遠未成熟。
展開