YOLO 系列
You Only Look Once — 实时目标检测架构的演进与学习笔记。
YOLO 是一个单阶段目标检测模型系列,它在单次前向传播中处理图像,因此与两阶段检测器相比速度极快。
演进时间轴
| 版本 | 年份 | 关键创新 | 学习笔记 |
|---|---|---|---|
| YOLOv1 | 2016 | 首个单阶段检测器 | 📄 笔记 |
| YOLOv2 | 2017 | 批归一化 (BN)、锚框 (Anchor Boxes) | 📄 笔记 |
| YOLOv3 | 2018 | 特征金字塔网络 (FPN) | 📄 笔记 |
| YOLOv4 | 2020 | CSPDarknet、马赛克增强 | 📄 笔记 |
| YOLOv5 | 2020 | PyTorch 实现 | 📄 笔记 |
| YOLOv6 | 2022 | 工业级优化 | 📄 笔记 |
| YOLOv7 | 2022 | E-ELAN 架构 | 📄 笔记 |
| YOLOv8 | 2023 | 统一框架 | 📄 笔记 |
| YOLOv9 | 2024 | 可编程梯度信息 (PGI) | 📄 笔记 |
基础知识
在深入 YOLO 之前,建议先复习 CNN 基础知识,以了解卷积层、池化和激活函数。
核心概念
单阶段 vs. 两阶段
不同于 R-CNN 系列(先提议区域再分类的两阶段模型),YOLO 将目标检测视为一个回归问题,直接从图像像素预测边界框坐标和类别概率。
网格策略 (Grid Cell Strategy)
YOLO 将输入图像划分为 的网格。如果目标的中心落在某个网格单元中,该网格单元就负责检测该目标。