五一堵车 | AI“高速”车辆检测轻而易举监测大家安全

news2024/12/26 11:03:27

133b85171133e1141761cb72f1bd9973.gif

点击蓝字关注我们

关注并星标

从此不迷路

计算机视觉研究院

a3852f97bcc6123c18ae9d5546fb477f.gif

190afd93903486f5e4a09c8046c13abe.gif

学习群|扫码在主页获取加入方式

计算机视觉研究院专栏

作者:Edison_G

五一节不管是离开小城镇还是进入大城市,每个高速路口都是堵车,现在人工智能愈来愈发达,不再用通过交警得知高速公路上的案发事件,现在都是摄像机覆盖,AI可以通过镜头&算法检测到行驶的车辆,如果有交通事故都是第一时间传达交警来处理。以至于有些路段都是通过无人机来进行交通事故处理!

0d767c8f34c2243b78c807e40de16294.jpeg

一、简要

Single-stage目标检测方法因其具有实时性强、检测精度高等特点,近年来受到广泛关注。通常,大多数现有的single-stage检测器遵循两个常见的实践:它们使用在ImageNet上预先训练的网络主干来完成分类任务,并使用自顶向下的特征金字塔表示来处理规模变化。

12e460517ac580caf56fbcc73190a55a.gif

好比在国庆节的高速路上,车辆较多,而且车辆的行驶速度不一,大多数都是高速行驶状态中,所以有研究者研究了一个single-stage检测框架,它结合了微调预训练模型和从零开始训练的优点。新框架构成了一个标准的网络,使用一个预先训练的主干网络和一个并行的轻型辅助网络从零开始训练。

75cadcebf93aaa1269d8308b2176be52.png

此外,研究者认为通常使用的自顶向下的金字塔表示只关注于将高级语义从顶层传递到底层。然而在新的检测框架中引入了一个双向网络,它可以有效地传递中低层次和高层次的语义信息。

二、背景&动机

研究表明,训练检测模型从零开始解决这个问题,导致精确定位。但是与基于微调的对应网络相比,从零开始训练时间花费多。因此研究者引入一个训练模型,将训练前的和从零开始训练的优点结合起来,该框架使用一个预训练前的主干和一个从零开始训练的浅辅助网络。提出的方法相比baseline在AP指标上分别提高了7.4%4.2%。在COCO测试集上,固定300×300输入,提出的以ResNet为backbone的检测器在单级推理方面超过了现有的单级检测方法,AP达到了34.3 ,在一个Titan X GPU上时间为19毫秒,同时兼顾了精度和速度。

a1f739b3481ad98b35a9f3b97fe99efe.png

现在遇到的问题:

  • 小目标检测的难点

小目标检测是一个具有挑战性的问题,它既需要精确描述对象的低层/中层信息,也需要区分目标对象与背景或其他对象类别的高级语义信息。

近来的one-stage探测器的目标是获得与two-stage相近的检测精度。
尽管在大中型目标上效果较好,但这些探测器在小目标上的性能却低于预期。
例如:
当使用一个500×500的输入时,使用RetinaNet在COCO数据集上,
AP为47,但在小目标上,AP只有 14。
  • 预训练网络的利弊

主流的one-stage目标检测框架的通用策略是:利用一个经过ImageNet预训练的backbone完成分类任务。然后利用检测目标的数据集进行微调,从而达到快速收敛的效果。但是目标检测中的分类任务和定位任务之间仍然存在较大差异,尤其是在目标框重叠阈值高的情况下。

在ICCV2019Kaiming He的最新论文中,也对利用ImageNet
进行预训练然后fine-tune这种模式进行了思考,并且认为从
零开始训练检测模型,有助于精确定位。但是另一方面,与典
型的基于微调的网络相比,从零开始训练非常深的网络需要的
训练时间要长得多。

三、新框架

0b8303d012f3261063ab0cafd6e8a282.png

新框架图图显示了由三个主要组件组成的总体架构:标准SSD网络轻量级暂存网络(LSN)双向网络

标准SSD使用预先训练的网络主干。因此将来自标准SSD层的功能(conv4_3,FC_7,conv8_2,conv9_2,conv10_2和conv11_2)称为主干特征,因为它们源自预先训练的网络主干。研究者采用VGG-16作为主干网络。轻量级暂存网络(LSN)产生低/中级特征表示,然后将其注入到后续标准预测层的主干特征中以改善其性能。然后,将当前层和前一层的结果特征以自下而上的方式组合到双向网络中。双向网络中的自顶向下方案包含独立的并行连接,以将高级语义信息从网络的较后一层注入到前一层。

不同之处:

新框架中双向网络与现有的几个单级检测器使用的特征金字塔网络(FPN)相比有以下不同之处。

首先,FPN的自底向上部分遵循了标准中使用的CNN的金字塔特征层次结构SSD的框架。FPN和SSD的自底向上部分都遵循骨干网的前馈计算,建立了特征层次结构。除了FPN/标准SSD中的自底向上部分外,新框架中的双向网络中的自底向上方案以级联的方式将前一层的特性传播到后一层。此外,FPN中的topdown金字塔通过级联操作逐层融合了许多CNN层。在双向网络的自顶向下方案中,预测层通过独立的并行连接进行融合,而不是逐层逐层的级联/顺序融合。

LSN Feature Extraction

在现有检测框架中常用的特征提取策略包括从网络主干,如VGG-16,在多个卷积块和最大池层的重复堆栈中提取特征,以产生语义强的特征(见下图)。

876eed829a8407e52b0c79e12e181c71.png

这种特征提取策略有利于偏好平移不变性的图像分类任务。与图像分类不同,目标检测还需要精确的目标描述,其中局部低/中水平特征(如纹理)信息也是至关重要的。为了补偿预先训练的网络的主干特征中的信息损失,在新框架的LSN中使用了另一种特征提取方案,如上图(b)。

首先,通过池化操作将输入图像下采样到第一SSD预测层的目标大小。然后,得到的下采样图像通过轻量级串行操作(LSO),包括卷积、batch-norm和ReLU层。请注意,LSN是用随机初始化从零开始训练的。它遵循类似的金字塔特征层次,如标准SSD。

四、实验

469c790cb20418222f9e4e9d71803d07.png

[18]  Tsung-Yi Lin, Priya Goyal, Ross Girshick, Kaiming He, and Piotr Dollr. Focal loss for dense object detection. In ICCV, 2017

bd3f909016699459a8bac1589b119ce7.png

3a3a0445718edebae52acd403a392ab2.png

82b20206bb208e1de5759f2b91be92d5.png

计算机视觉研究院 ▶▶▶

JOIN US

学习群

73cc84d0932b6e4fe5487814ea80b7a5.gif

© THE END 

转载请联系本公众号获得授权

7738a46d640e5751074a6230020c8bfd.gif

计算机视觉研究院学习群等你加入!

ABOUT

计算机视觉研究院

计算机视觉研究院主要涉及深度学习领域,主要致力于目标检测、图像分割、模型量化、模型部署等研究方向。研究院接下来会不断分享最新的论文算法新框架,我们这次改革不同点就是,我们要着重”研究“。之后我们会针对相应领域分享实践过程,让大家真正体会摆脱理论的真实场景,培养爱动手编程爱动脑思考的习惯!

VX:2311123606

40da565be810402b518055f21bc40a4c.png

往期推荐 

🔗

  • 最近几篇较好论文实现代码(附源代码下载)

  • AI助力社会安全,最新视频异常行为检测方法框架

  • 新技术:高效的自监督视觉预训练,局部遮挡再也不用担心!

  • VS Code支持配置远程同步了

  • 改进的阴影抑制用于光照鲁棒的人脸识别

  • 基于文本驱动用于创建和编辑图像(附源代码)

  • 基于分层自监督学习将视觉Transformer扩展到千兆像素图像

  • 霸榜第一框架:工业检测,基于差异和共性的半监督方法用于图像表面缺陷检测

  • CLCNet:用分类置信网络重新思考集成建模(附源代码下载)

  • YOLOS:通过目标检测重新思考Transformer(附源代码)

  • 工业检测:基于密集尺度特征融合&像素级不平衡学习框架(论文下载)

  • Fast YOLO:用于实时嵌入式目标检测(附论文下载)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/477165.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

git fetch时,FETCH_HEAD和.git\refs\remotes\origin会有哪些变化

目录 github远程仓库状态clone 到本地对新clone的仓库直接 fetchgit fetchgit fetch origingit fetch origin test1git fetch origin test2:test22 结论 github远程仓库状态 clone 到本地 git fetchgit fetch origingit fetch origin test3git fetch origin test2:test22 git f…

Photon AI Translator 和做产品的一些思考

近 4 个月内我一直在做 Apple 平台的产品,虽然从使用量来说「简体中文」用户是占多数,但我一直有做多语言的支持:英语、简体中文和繁体中文。习惯上 Google 翻译的我,基本上在使用 Xcode 过程中也会一直在浏览器开着 Google Trans…

复古决战快速施法穿墙秒怪分析流程及安全防护

《决战》是一款非常古老的RPG游戏,作为热血传奇同期的热门游戏也深受7080后的喜爱。 在十几年前玩这个游戏时,我也使用过瞬移穿墙,快速施法秒怪等功能的辅助。 下面我们就用一个自己架设的单机版来回顾一下当年辅助开发的流程,并…

【三十天精通Vue 3】 第二十二天 Vue 3的UI框架详解

✅创作者:陈书予 🎉个人主页:陈书予的个人主页 🍁陈书予的个人社区,欢迎你的加入: 陈书予的社区 🌟专栏地址: 三十天精通 Vue 3 文章目录 引言一、常用的Vue 3 UI框架概览1. 常用的Vue 3 UI框架有哪些&…

不同主题增删改查系统【控制台+MySQL】(Java课设)

有很多顾客都是只要实现各种各样的增删改查系统即可,只是主题和数据库表不一样,功能都是增删改查这四个功能,做出来的效果和下面的截图是一样的,后续这样的增删改查系统的运行效果请参考下面的截图,我就不一一演示了&a…

OSPF-MGRE综合实验

拓扑结构: 要求: 1、R6为ISP只能配置IP地址,R1~R5的环回为私有网段 2、R1/4/5为全连的MGRE结构,R1/2/3为星型的拓扑结构,R1为中心站点 3、所有私有网段可以互相通讯,私有网段使用OSPF协议完成 使用的设备…

【Java笔试强训 13】

🎉🎉🎉点进来你就是我的人了博主主页:🙈🙈🙈戳一戳,欢迎大佬指点! 欢迎志同道合的朋友一起加油喔🤺🤺🤺 目录 一、选择题 二、编程题 🔥参数解析…

忆暖行动|“ 还可以留一点做成柿饼,做法也很简单,就是挑硬柿子把皮削掉,用开水烫个几秒”

追忆过往 感恩现在 我们知道,现在的生活与之前相比发生了翻天覆地的变化,您觉得有什么变化呢? 现在的生活好啊,家家房子都盖起来了,你瞅我这房子,是我子女们大前年给我盖的,我原来都是住的土房…

【Unity-UGUI控件全面解析】| Image 图片组件详解

🎬【Unity-UGUI控件全面解析】| Image 图片组件详解一、组件介绍二、组件属性面板2.1 Image Type三、代码操作组件四、组件常用方法示例4.1 简易血条制作4.2 简易技能冷却条制作五、组件相关扩展使用5.1 Mask 遮罩💯总结🎬 博客主页:https://xiaoy.blog.csdn.net 🎥 本…

Java每日一练(20230430)

目录 1. 文本左右对齐 🌟🌟🌟 2. 求素数和 🌟 3. 整数转换英文表示 🌟🌟🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专…

mycat的基本介绍及安装

海量数据存储解决方案之分库分表原理解析及mycat安装及使用_已经存在大量数据 可以使用mycat分表吗_踩踩踩从踩的博客-CSDN博客 Mycat核心概念工作原理及高级特性分析_mycat-mini-monitor_踩踩踩从踩的博客-CSDN博客 前言 在之前的文章中,介绍了一部分的mycat&am…

Web App Manager - 将任何网站转换为应用程序

Web App Manager - 将任何网站转换为应用程序 WebApp Manager 是一款实用程序,由 Linux Mint 和 Peppermint 基于 Peppermint 的 ICE 合作创建——用户可以使用该应用程序将他们喜欢的应用程序转换为独立的 Web 应用程序,它最早于 2010 年首次发布&…

CKA/CKS/CKAD认证考试攻略

什么是CKA考试? CKA认证考试是由Linux基金会和云原生计算基金会(CNCF)创建的,以促进Kubernetes生态系统的持续发展。该考试是一种远程在线、有监考、基于实操的认证考试,需要在运行Kubernetes的命令行中解决多个任务。CKA认证考试是专为Kube…

vue---组件基本知识

目录 一、组件基础 二、Props组件交互 三、自定义组件交互 一、组件基础 对于组件,我个人的理解是每个网页其实都是由一个个组件组成的,它可以理解成网页元素的组成单位,下面我们来看下如何将组件加载到页面中。 (1&#xff09…

120 · 单词接龙

链接&#xff1a;LintCode 炼码 class Solution { public:/*** param start: a string* param end: a string* param dict: a set of string* return: An integer*/int ladderLength(string &start, string &end, unordered_set<string> &dict) {// write y…

基于springcloud微服务的java课程资源在线学习考试系统

在我国&#xff0c;由于计算机与网络技术的不断发展&#xff0c;信息化建设的不断深入&#xff0c;不管是企业、学校或个人都在结合计算机网络技术队现有的管理或生活中的一些环节进行开发研究&#xff0c;运用计算机进行一些必要的数据信息管理&#xff0c;分析及发布&#xf…

故事连载:AION之殆之永恒的深渊

AION深渊 魔族长老齐西尔内召集了魔族两大司令官&#xff0c;由于天族无法进入伏魔殿&#xff0c;魔族无法进入极乐世界&#xff1b;亚特雷亚事件关系到天魔两族的存亡&#xff0c;天族大神宫尤克类阿斯也意识到事情的严重性&#xff0c;带领天族众将与齐西尔内相约永恒之塔&am…

Centos8手动设置时区、日期、时间,且将时间设置为24小时格式

一、快速设置Centos时间为24小时显示步骤 1.1、查看当前的系统显示时间格式 查看当前Centos系统的时间命令: date 查看后发现Centos系统确实是只显示12小时格式的时间,且使用的不是北京时区时间,因此我们在需要对系统的时区和时间格式需要进行设置。 1.2、快速设…

HTB靶机05-Nibbles-WP

Nibbles 2023-04-04 16:38:48 Scan ┌──(xavier㉿kali)-[~] └─$ sudo nmap -sSV -T4 10.10.10.75 Starting Nmap 7.92 ( https://nmap.org ) at 2023-04-04 16:39 CST Nmap scan report for 10.10.10.75 Host is up (0.43s latency). Not shown: 998 closed tcp ports (…

关于《浏览器如何工作》---塔利加西尔 博客的疑惑与解答

疑惑与解答 1.浏览器组件和浏览器管理的线程是一个概念吗&#xff1f;2.浏览器中的各个线程又是由哪些组件创建与管理的呢&#xff1f;3.为什么使用CDN可以加速JavaScript文件的加载? 1.浏览器组件和浏览器管理的线程是一个概念吗&#xff1f; 浏览器组件和浏览器管理的线程是…