YOLOv1–v11: 版本演进及其关键技术解析

news2024/11/18 17:42:51

最新消息:Yolo11发布最新版本2024.10

YOLO (You Only Look Once) 是一种高效的目标检测算法,自其初代发布以来,经过多次迭代,逐步提升了检测速度和精度。本文将详细介绍 YOLO 从 v1 到 v11 的各个版本,涵盖每个版本的发布日期、作者、项目地址及主要功能特性。

1. YOLOv1 (2016)

发布日期: 2016年6月
作者: Joseph Redmon, Santosh Divvala, Ross Girshick, Ali Farhadi
论文: "You Only Look Once: Unified, Real-Time Object Detection"
项目地址: YOLOv1 GitHub
主要功能:

  • 创新思想:YOLOv1 首次将目标检测任务转化为一个单次前向传播的问题,显著提升了检测速度。
  • 检测速度快:能够以 45 FPS 的速度处理图像,并且有一个更快的版本可以达到 155 FPS。
  • 限制:YOLOv1 在小物体检测上的精度较差,且定位误差较高。

2. YOLOv2 (2017)

发布日期: 2017年12月
作者: Joseph Redmon, Ali Farhadi
论文: "YOLO9000: Better, Faster, Stronger"
项目地址: YOLOv2 GitHub
主要功能:

  • YOLO9000:YOLOv2 被称为 YOLO9000,能够检测 9000 种类别物体。
  • 多尺度训练:通过不同分辨率的训练图像增强模型的鲁棒性。
  • Anchor Boxes:引入 anchor boxes 改进了对小物体的检测能力。

3. YOLOv3 (2018)

发布日期: 2018年4月
作者: Joseph Redmon, Ali Farhadi
论文: "YOLOv3: An Incremental Improvement"
项目地址: YOLOv3 GitHub
主要功能:

  • 改进的网络结构:引入了 Darknet-53 作为主干网络,结合残差网络提高检测精度。
  • 多尺度预测:在不同尺度上进行预测,改善对小物体的检测。
  • 分类器移除:取消了软分类器,使用独立的二元分类器来提高性能。

4. YOLOv4 (2020)

发布日期: 2020年4月
作者: Alexey Bochkovskiy, Chien-Yao Wang, Hong-Yuan Mark Liao
论文: "YOLOv4: Optimal Speed and Accuracy of Object Detection"
项目地址: YOLOv4 GitHub
主要功能:

  • Bag of Freebies 和 Bag of Specials:提出了一系列的免费(Freebies)和特效(Specials)优化策略,大幅提高了模型精度。
  • CSPDarknet53:更高效的主干网络,提升了网络的推理速度和精度。
  • CIoU 损失函数:引入 CIoU 损失,提高了边界框回归的性能。

5. YOLOv5 (2020)

发布日期: 2020年6月
作者: Glenn Jocher
项目地址: YOLOv5 GitHub
主要功能:

  • Pytorch 实现:YOLOv5 转向了 Pytorch 框架,便于开发者使用和扩展。
  • 自动学习的 anchor boxes:通过自适应的 anchor box 学习机制,进一步提高检测效率。
  • 丰富的预训练模型:提供了多种尺寸的预训练模型,满足不同场景的需求。

6. YOLOv6 (2022)

发布日期: 2022年6月
作者: Meituan 技术团队
项目地址: YOLOv6 GitHub
主要功能:

  • 行业应用优化:YOLOv6 是针对行业应用优化的版本,尤其注重推理速度。
  • 改进的网络结构:引入 EfficientRep 带来了更高效的网络架构。
  • 支持部署:优化模型部署性能,适合工业环境中的大规模应用。

7. YOLOv7 (2022)

发布日期: 2022年7月
作者: Wong Kin-Yiu, Alexey Bochkovskiy, Chien-Yao Wang
论文: "YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors"
项目地址: YOLOv7 GitHub
主要功能:

  • 精度和速度的新突破:YOLOv7 在 COCO 数据集上达到了新的速度与精度平衡。
  • 跨尺度特征融合:通过跨尺度的特征融合,提高了对不同尺度物体的检测能力。
  • 动态标签分配:改进了训练过程中的标签分配方式,使得训练效率更高。

8. YOLOv8 (2023)

发布日期: 2023年1月
作者: Ultralytics 团队
项目地址: YOLOv8 GitHub
主要功能:

  • 模块化设计:提供了可定制的模块化设计,方便用户根据需求进行扩展。
  • 自动化训练和优化:内置了多种训练和超参数优化策略,简化了模型调优过程。
  • 集成检测、分割和跟踪:YOLOv8 不仅支持目标检测,还集成了语义分割和目标跟踪功能。

YOLOv9(2024.02)

  • 版本名称: YOLOv9
  • 发布日期: 2024年2月
  • 作者/贡献者: WongKinYiu, 可能还有其他贡献者
  • 项目地址: GitHub - WongKinYiu/yolov9
  • 主要功能:
    • 引入了可编程梯度信息(PGI)的概念。
    • 设计了一种新的轻量级网络架构—基于梯度路径规划的通用高效层聚合网络(GELAN)。
    • 提高了模型的学习能力,并在整个检测过程中保留关键信息。
    • 改进了GhostNet主干网络以提高效率。
    • 融合了Involution新卷积算子来增强上下文信息提取能力。
    • 为道路缺陷检测等特定应用场景引入了DCNv4、自研BSAM注意力机制及极简的神经网络VanillaBlock等技术。
    • 替换MobileNetV2作为主干网络实现轻量化。

10. YOLOv10 (2024.05)

发布日期: 2024.05
作者: 清华大学

论文:https://arxiv.org/pdf/2405.14458
项目地址: https://github.com/THU-MIG/yolov10
主要功能:实时端到端的对象检测。主要是速度和性能方面的提升。

11. YOLOv11 (2024)

发布日期: 2024.09
作者: Ultralytics 团队
项目地址: https://github.com/ultralytics/
主要功能:
Ultralytics YOLO11 is a cutting-edge, state-of-the-art (SOTA) model that builds upon the success of previous YOLO versions and introduces new features and improvements to further boost performance and flexibility. YOLO11 is designed to be fast, accurate, and easy to use, making it an excellent choice for a wide range of object detection and tracking, instance segmentation, image classification and pose estimation tasks.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2184114.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

高性价比PCB分板机高速主轴SycoTec 4025 HY

德国 SycoTec 4025 HY 迷你型高速主轴以其悠久的历史、卓越的性能、良好的散热和长寿命,成为PCB分板的高性价比选择。 一、4025 HY亮点 1.悠久历史与 拥有 50 多年的应用历史,被称为 “主轴之母”,充分证明了其在行业中的可靠性和稳定性。 …

人工智能 | 手工测试用例转Web自动化测试生成

简介 在传统编写 Web 自动化测试用例的过程中,基本都是需要测试工程师,根据功能测试用例转换为自动化测试的用例。市面上自动生成 Web 或 App 自动化测试用例的产品无非也都是通过录制的方式,获取操作人的行为操作,从而记录测试用…

迎国庆,开源完全免费工作流引擎AntFlow 0.9最强版本发布,支持tidb,提升易用性and more...

AntFlow是一款前端仿钉钉的企业级工作流引擎。后端既可嵌入到现有业务系统,也可以做为独立的流程引擎中台部署(SAAS模式)。嵌入业务系统模式已经在笔者所在企业使用多年,功能丰富,能适多种国产办公场景;简单…

sql-labs靶场第一关测试报告

目录 一、测试环境 1、系统环境 2、使用工具/软件 二、测试目的 三、操作过程 1、寻找注入点 2、注入数据库 ①Order by判断列数 ②判断回显地方 ③爆库,查看数据库名称 ④爆表,查看security库的所有表 ⑤爆列,查看users表的所有…

【CKA】五、网络策略–NetworkPolicy

5、配置网络策略–NetworkPolicy 1. 考题内容: 2. 答题思路: 1、根据题目分析要创建怎样的网络策略 2、按题目要求查看ns corp-net的label 3、编写yaml,其中注意 namespace、label、port 3. 官网地址: https://kubernetes.io/…

【EXCEL数据处理】000011 案列 EXCEL带有三角形图标的单元格转换

前言:哈喽,大家好,今天给大家分享一篇文章!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 💕 目录 【EXCEL数据处理】000011 案列 EXCEL带有三角形图标的单元格转换。使用…

数据结构-4.3.串的存储结构

一.串的顺序存储: 1.静态数组会由系统自动回收;动态数组需要手动回收; 2.优点:随机存取,可以立即找到所需的字符;缺点:插入和删除较麻烦; 3.串的顺序存储方案: 对于方…

双指针--收尾的两道题

双指针 (封面起到吸引读者作用,和文章内容无关哈,但是文章也是用心写的) 三数之和 给你一个整数数组 nums ,判断是否存在三元组 [nums[i], nums[j], nums[k]] 满足 i ! j、i ! k 且 j ! k ,同时还满足 nums[i] nums…

面向代理的从单体到基于服务架构的转变的好处

论文标题:《Benefits of Agent-Oriented Transitioning from Monolithic To Service-Based Architectures》 作者信息: Daniel-Costel Bouleanu, University of Craiova, Romania; Polytechnic of Bari, ItalyMarco Alfredo Loaiza Carrillo, Universi…

根据视频id查询播放量

声明:文章仅用于学习交流,如有侵权请联系删除 如何根据视频ID查询视频的播放数量 在数字化时代,视频内容的消费已成为人们日常生活的重要组成部分。无论是社交媒体平台上的短视频,还是视频分享网站上的长视频,了解视频的播放数量…

TryHackMe 第5天 | Pre Security (四)

该学习路径讲解了网络安全入门的必备技术知识,比如计算机网络、网络协议、Linux命令、Windows设置等内容。过去三篇已经对前三块内容进行了简单介绍,本篇博客将记录 Windows设置 部分。 Windows Fundamentals Part 1 对于 Windows ,肯定会感…

只需10秒,昂首资本发现短线交易4个优点

在金融市场,短线交易已经成为投资者追求高效收益的重要工具。那么,这种交易的本质究竟是怎样的?以下是昂首资本对短线交易的深入解析,以及其优缺点的详细分析。 短线交易的本质可以这样描述:交易会有相当小的止损&…

LeetCode 983.最低票价

在一个火车旅行很受欢迎的国度,你提前一年计划了一些火车旅行。在接下来的一年时间里,你要旅行的日子将以名为 days 的数组给出。每一项是一个 1 到 365 的整数。 火车票有三种不同的销售方式: 一张为期一天的通行证售价为cost[0]美元 一张为…

Stable Diffusion绘画 | 来训练属于自己的模型:素材准备篇

首先要说明的是,模型训练,需要显卡持续不间断地一致运行, 快则0.5-1小时左右,慢的话可能需要跑上几小时,甚至是几天, 原因跟显卡的配置和训练设置参数都有关系。 模型训练与显卡配置: 训练 L…

从零开始搭建UVM平台(七)-加入monitor

书接上回: 从零开始搭建UVM平台(一)-只有uvm_driver的验证平台 从零开始搭建UVM平台(二)-加入factory机制 从零开始搭建UVM平台(三)-加入objection机制 从零开始搭建UVM平台(四&…

sadTalker本地编译

SadTalker一款开源的可生成逼真的人像动画的工具。它利用深度学习技术,根据输入的图像和音频,生成具有生动表情和动作的视频。用户可以通过上传照片或使用预设的模型,轻松创建个性化的动画内容. 以上是官网的图, 下边是本地部署生成的,效果差…

Vue+NestJS项目实操(图书管理后台)

一、项目搭建 前端基于vben进行二次开发 在Github下载vben框架,搜索vben即可 下载地址:https://github.com/vbenjs/vue-vben-admin 下载完成后,进行安装依赖,使用命令: // 下载依赖 pnpm install// 运行项目 pnpm …

麒麟系统命令失效快速修复

麒麟系统命令失效快速修复 1、问题描述2 问题原因3、解决方法 💐The Begin💐点点关注,收藏不迷路💐 1、问题描述 麒麟操作系统中,所有命令突然无法使用。 2 问题原因 /usr目录权限可能被错误修改。 3、解决方法 准…

MySQL基础篇 - 多表查询

01 多表关系 【1】概念:项目开发中,在进行数据库表结构设计时,会根据业务需求及业务模块之间的关系,分析并设计表结构,由于业务之间相互关联,所以各表结构之间也存在着各种联系,基本上分为三种…

安装epic games错误码2738解决(安装ue错误码2738)

这个错误不好找到解决方案,尝试删除注册表以及通过电脑管家下载安装都不生效,仍然会错误2738。直到找到了这个解决方案。 1.cmd然后右键以管理员身份运行, 2.cd %windir%\syswow64进入该目录 3.reg delete “HKCU\SOFTWARE\Classes\Wow6432No…