对象检测是一项计算机视觉任务,涉及识别和定位图像或视频中的对象。它是许多应用的重要组成部分,例如自动驾驶汽车、机器人和视频监控。
多年来,已经开发了许多方法和算法来查找图像中的对象及其位置。执行这些任务的最佳质量来自使用卷积神经网络。
YOLO 是这项任务最流行的神经网络之一,由 Joseph Redmon、Santosh Divvala、Ross Girshick 和 Ali Farhadi 在他们著名的研究论文“You Only Look Once: Unified, Real-Time Object Detection”中于 2015 年创建。
从那时起,YOLO 出现了好几个版本。最近的版本可以做的不仅仅是物体检测。最新版本是YOLOv8,我们将在本教程中使用它。
在这里,我将向您展示该网络用于对象检测的主要功能。首先,我们将使用预训练模型来检测猫狗等常见对象类别。然后,我将展示如何训练您自己的模型来检测您选择的特定对象类型,以及如何为此过程准备数据。最后,我们将创建一个 Web 应用程序,以使用自定义训练模型在 Web 浏览器中检测图像上的对象。
以下是我们将介绍的内容: