【Yolov5+Deepsort】训练自己的数据集（1）| 目标检测追踪

📢前言：本篇是关于如何使用YoloV5+Deepsort训练自己的数据集，从而实现目标检测与目标追踪，并绘制出物体的运动轨迹。本章讲解的为第一个内容：简单介绍YoloV5+Deepsort中所用到的目标检测，追踪及sort&Deppsort算法。本文中用到的数据集均为自采，实验动物为斑马鱼。文尾附Deepsort原论文。

💬源码如下：

GitHub - mikel-brostrom/yolo_tracking: A collection of SOTA real-time, multi-object tracking algorithms for object detectors

GitHub - Sharpiless/Yolov5-Deepsort: 最新版本yolov5+deepsort目标检测和追踪，能够显示目标类别，支持5.0版本可训练自己数据集

Ⅰ简述目标检测

0x00 什么是目标检测

0x01 一般步骤

0x02 常用算法

Ⅱ 简述目标追踪

0x00 什么是目标追踪

0x01 一般步骤

0x02 常用算法

Ⅲ sort算法

0x00 卡尔曼滤波

0x01 匈牙利算法

Ⅳ Deepsort

0x00 算法的一般流程

Ⅰ简述目标检测

0x00 什么是目标检测

目标检测是计算机视觉领域的一个重要任务，它旨在识别图像或视频中的特定对象，并通过在目标周围绘制边界框（bounding box）来标记它们的位置。

这种技术在许多实际应用中都有广泛的应用，如自动驾驶、安防监控、智能交通、人脸识别、工业质检等。

0x01 一般步骤

1. 输入图像:

首先，目标检测算法会接收一个输入图像或视频帧。

2. 特征提取：

然后，算法会通过卷积神经网络（CNN）等方法对图像进行特征提取。这些特征可以是边缘、纹理、颜色等图像的局部或全局特征。

3. 候选区域生成：

接下来，目标检测算法会根据特征图选择一些可能包含目标的候选区域，通常称为区域提议（Region Proposals）。常用的方法包括Selective Search、R-CNN等。

4. 目标分类与定位:

在得到候选区域后，算法会对每个区域进行目标分类和边界框的回归。目标分类是指确定区域中是否包含目标（如车、人、动物等），而边界框回归则是调整候选框的位置和大小以更准确地围绕目标。

5. 后处理:

最后，算法会进行一些后处理步骤，例如非极大值抑制（NMS），以剔除重叠的边界框并保留最可信的检测结果。

目标检测有许多不同的算法和架构，其中一些著名的方法包括Faster R-CNN、YOLO、SSD（SINGLE SHOT MULTIBOX DETECTOR）、RetinaNet等。每种方法都有其优缺点和适用场景，取决于应用需求和计算资源。

0x02 常用算法

RCNN系列：

RCNN（Region-based Convolutional Neural Networks）: 首先通过选择性搜索（Selective Search）算法提取候选区域，然后对每个候选区域进行卷积神经网络（CNN）特征提取和目标分类。

Fast R-CNN: 在RCNN的基础上引入ROI池化（ROI Pooling）层，使得特征提取更高效。

Faster R-CNN: 引入RPN（Region Proposal Network），将候选区域的提取和目标分类合并为一个端到端的网络，大大加快了检测速度。

YOLO系列：

YOLOv1：将目标检测看作回归问题，通过一个CNN直接预测目标的边界框和类别概率。
YOLOv2 / YOLO9000：在YOLOv1基础上改进，引入Darknet-19网络和多尺度预测，提高检测精度。YOLO9000是在YOLOv2的基础上通过联合训练多个数据集实现了多标签分类和检测。
YOLOv3：进一步改进YOLOv2，采用更深的Darknet-53网络和FPN，提高小目标检测性能。