YOLO 系列
You Only Look Once — 即時目標檢測架構的演進與學習筆記。
YOLO 是一個單階段目標檢測模型系列,它在單次前向傳播中處理圖像,因此與兩階段檢測器相比速度極快。
演進時間軸
| 版本 | 年份 | 關鍵創新 | 學習筆記 |
|---|---|---|---|
| YOLOv1 | 2016 | 首個單階段檢測器 | 📄 筆記 |
| YOLOv2 | 2017 | 批歸一化 (BN)、錨框 (Anchor Boxes) | 📄 筆記 |
| YOLOv3 | 2018 | 特徵金字塔網絡 (FPN) | 📄 筆記 |
| YOLOv4 | 2020 | CSPDarknet、馬賽克增強 | 📄 筆記 |
| YOLOv5 | 2020 | PyTorch 實現 | 📄 筆記 |
| YOLOv6 | 2022 | 工業級優化 | 📄 筆記 |
| YOLOv7 | 2022 | E-ELAN 架構 | 📄 筆記 |
| YOLOv8 | 2023 | 統一框架 | 📄 筆記 |
| YOLOv9 | 2024 | 可編程梯度資訊 (PGI) | 📄 筆記 |
基礎知識
在深入 YOLO 之前,建議先複習 CNN 基礎知識,以了解卷積層、池化和激活函數。
核心概念
單階段 vs. 兩階段
不同於 R-CNN 系列(先提議區域再分類的兩階段模型),YOLO 將目標檢測視為一個回歸問題,直接從圖像像素預測邊界框坐標和類別概率。
網格策略 (Grid Cell Strategy)
YOLO 將輸入圖像劃分為 的網格。如果目標的中心落在某個網格單元中,該網格單元就負責檢測該目標。