跳至主要内容

YOLO 系列

You Only Look Once — 即時目標檢測架構的演進與學習筆記。

YOLO 是一個單階段目標檢測模型系列,它在單次前向傳播中處理圖像,因此與兩階段檢測器相比速度極快。

演進時間軸

版本年份關鍵創新學習筆記
YOLOv12016首個單階段檢測器📄 筆記
YOLOv22017批歸一化 (BN)、錨框 (Anchor Boxes)📄 筆記
YOLOv32018特徵金字塔網絡 (FPN)📄 筆記
YOLOv42020CSPDarknet、馬賽克增強📄 筆記
YOLOv52020PyTorch 實現📄 筆記
YOLOv62022工業級優化📄 筆記
YOLOv72022E-ELAN 架構📄 筆記
YOLOv82023統一框架📄 筆記
YOLOv92024可編程梯度資訊 (PGI)📄 筆記
基礎知識

在深入 YOLO 之前,建議先複習 CNN 基礎知識,以了解卷積層、池化和激活函數。

核心概念

單階段 vs. 兩階段

不同於 R-CNN 系列(先提議區域再分類的兩階段模型),YOLO 將目標檢測視為一個回歸問題,直接從圖像像素預測邊界框坐標和類別概率。

網格策略 (Grid Cell Strategy)

YOLO 將輸入圖像劃分為 S×SS \times S 的網格。如果目標的中心落在某個網格單元中,該網格單元就負責檢測該目標。

參考論文