跳到主要内容

YOLO 系列

You Only Look Once — 实时目标检测架构的演进与学习笔记。

YOLO 是一个单阶段目标检测模型系列,它在单次前向传播中处理图像,因此与两阶段检测器相比速度极快。

演进时间轴

版本年份关键创新学习笔记
YOLOv12016首个单阶段检测器📄 笔记
YOLOv22017批归一化 (BN)、锚框 (Anchor Boxes)📄 笔记
YOLOv32018特征金字塔网络 (FPN)📄 笔记
YOLOv42020CSPDarknet、马赛克增强📄 笔记
YOLOv52020PyTorch 实现📄 笔记
YOLOv62022工业级优化📄 笔记
YOLOv72022E-ELAN 架构📄 笔记
YOLOv82023统一框架📄 笔记
YOLOv92024可编程梯度信息 (PGI)📄 笔记
基础知识

在深入 YOLO 之前,建议先复习 CNN 基础知识,以了解卷积层、池化和激活函数。

核心概念

单阶段 vs. 两阶段

不同于 R-CNN 系列(先提议区域再分类的两阶段模型),YOLO 将目标检测视为一个回归问题,直接从图像像素预测边界框坐标和类别概率。

网格策略 (Grid Cell Strategy)

YOLO 将输入图像划分为 S×SS \times S 的网格。如果目标的中心落在某个网格单元中,该网格单元就负责检测该目标。

参考论文