【深度学习】实验5布置:滴滴出行-交通场景目标检测

news2024/11/26 14:54:18

DL_class

学堂在线《深度学习》实验课代码+报告(其中实验1和实验6有配套PPT),授课老师为胡晓林老师。课程链接:https://www.xuetangx.com/training/DP080910033751/619488?channel=i.area.manual_search。

持续更新中。
所有代码为作者所写,并非最后的“标准答案”,只有实验6被扣了1分,其余皆是满分。仓库链接:https://github.com/W-caner/DL_classs。 此外,欢迎关注我的CSDN:https://blog.csdn.net/Can__er?type=blog。
部分数据集由于过大无法上传,我会在博客中给出下载链接。如果对代码有疑问,有更好的思路等,也非常欢迎在评论区与我交流~

实验5:滴滴出行-交通场景目标检测

1 任务和数据简介

本次案例将使用深度学习技术来完成城市交通场景下的目标检测任务,案例所使用的数据集由滴滴出行提供,基于D2-City大规模行车记录视频数据集[1],经过视频抽帧等预处理步骤得到。数据集共包含12,000张图像,每张图像的大小为1080×1920或720×1280,已划分为训练集(10,000张)、验证集(1,000张)、测试集(1,000张)。

其中训练集和验证集提供了检测标签,测试集仅提供图像,用于提交后测试模型效果。本数据集共包含12个待检测的物体类别,包括小汽车、公交车、自行车、行人等,具体定义及示例如图1所示。本任务的目标是在给定的交通场景图像中,尽可能完整、准确地检测出所有要求的物体,检测结果示例如图2所示。关于数据的更多细节可参考D2-City文献[1]。

为了方便使用,数据集的标注信息已被预处理成MS-COCO格式,MS-COCO是通用物体检测领域最常用的数据集,如需深入理解数据集格式,请自行学习:MS-COCO数据集官网[2]、MS-COCO数据集文献[3]、MS-COCO标注格式[4]。

模型的评估指标也使用MS-COCO常用指标mAP(meanaverageprecision),请自行学习其定义及计算方式(无需自己实现):mAP定义[5],mAP计算方式[6]。

2 参考程序及使用说明

本次案例提供了完整、可供运行的参考程序,选取了带FPN[8]结构的FasterR-CNN[9]模型,基于MMDetection物体检测框架[10]实现,各程序简介如下:

  • faster_rcnn_r50_fpn_1x_didi.py为模型配置文件,安装MMDetection后置于mmdetection/configs/faster_rcnn路径下;

  • didi_detection.py 为数据集配置文件,置于 mmdetection/configs/base/datasets 路径下,并将 data_root 变量修改为数据集所在路径;

  • didi_demo.ipynb 用于可视化模型的检测结果。

参考程序的使用步骤及说明:

  • 自行安装 MMDetection 最新版(v2.1.0)及其全部依赖库,包括 PyTorch 等 (MMDetection GitHub: [10],安装指南: [11]);学习必要的使用说明: MMDetection 文档[12] (请务必仔细阅读 Getting Started 章节);

    图1: 待检测的 12 个物体类别及其示例

    请添加图片描述
    图2: 检测结果示例,不同颜色的框代表不同类别

  • 下载案例数据集,链接:https://pan.baidu.com/s/1TQTLl8GoyE0Qkw8dkbtzfg ,密码:n1nn。配置上述文件并置于 MMDetection 目录下的指定位置;

  • 以参考程序(Faster R-CNN with FPN)为例,训练模型: python tools/train.py configs/faster_rcnn/faster_rcnn_r50_fpn_1x_didi.py

  • 根据训练得到的模型(.pth 文件,训练后自动保存于 work_dirs/路径下),在测 试集上进行推理并得到.json 格式的输出文件:

    python tools/test.py configs/faster_rcnn/faster_rcnn_r50_fpn_1x_didi.py \ ./work_dirs/faster_rcnn_r50_fpn_1x_didi/latest.pth \ --format-only --options "jsonfile_prefix=./test_results"

    该命令会生成 test_results.json 文件,用于最终提交和评分。

  • 参考程序的超参数沿用了MS-COCO数据集上的配置,可能在本案例数据集上表现不够好,仅以此为例展示如何完成本案例;图3是参考程序训练完成后在验证集上的结果(每轮训练结束后自动输出),图4是测试集上的结果(学生不可见,用于最后评分)。
    请添加图片描述
    图3: 参考程序训练完成后在验证集上的mAP结果
    请添加图片描述
    图4:参考程序训练完成后在测试集上的mAP结果(学生不可见)

3 要求和建议

在参考程序的基础上,综合使用深度学习各项技术,尝试提升该模型在城市交通场景目标检测任务上的效果,以最后提交的.json输出结果对应的测试集mAP值为评价标准。

可从物体检测领域的各个方面着手对模型进行提升,如尝试其它的检测算法(替换FasterR-CNN),如FCOS,CascadeR-CNN等;或者尝试改进FasterR-CNN算法本身的部件,如尝试其它网络结构(替换ResNet50)、其它更适合本案例数据集的超参数(训练图像分辨率、anchor设置、训练策略等)。

建议参考MMDetection已经实现好的若干模型[13],以及通用物体检测领域的其它常用方法和技巧[14]。

4 注意事项

  • 提交所有代码和一份案例报告,提交 test_results.json 文件;
  • 案例报告应详细介绍所有改进尝试及对应的结果(包括验证集 mAP 值和若 干检测结果示例图),无论是否成功提升模型效果,并对结果作出分析;
  • 禁止任何形式的抄袭,借鉴开源程序务必加以说明。

5 参考资料

[1] Che et al. D2 -City: A Large-Scale Dashcam Video Dataset of Diverse Traffic Scenarios. arXiv 2019.

[2] MS-COCO 数据集: https://cocodataset.org/

[3] Lin et al. Microsoft COCO: Common Objects in Context. ECCV 2014.

[4] MS-COCO 标注格式: https://www.immersivelimit.com/tutorials/create-coco-annotations-from-scratch

[5] MS-COCO mAP 定义: https://cocodataset.org/#detection-eval

[6] mAP 计算方式: https://www.zhihu.com/question/53405779

[7] mAP 计算方式: https://github.com/rafaelpadilla/Object-Detection-Metrics/

[8] Lin et al. Feature pyramid networks for object detection. CVPR 2017.

[9] Ren et al. Faster r-cnn: Towards real-time object detection with region proposal networks. NIPS 2015.

[10] MMDetection: https://github.com/open-mmlab/mmdetection

[11] MMDetection 安装指南: https://github.com/open-mmlab/mmdetection/blob/master/docs/install.md

[12] MMDetection 文档: https://mmdetection.readthedocs.io/

[13] MMDetection Model Zoo: https://github.com/open-mmlab/mmdetection/blob/master/docs/model_zoo.m

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/27495.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

电脑c盘分区太小如何可以扩大,电脑c盘不够用了,如何给电脑分区

C盘是很重要的系统盘,会影响到整个系统的正常化运行。如果电脑c盘分区太小如何可以扩大? 一、清理C盘的垃圾文件 C盘分区不足的原因之一就是因为C盘的垃圾文件没有及时清理,导致垃圾文件越来越多,电脑越来越卡,所以&a…

2022最新软件测试面试八股文,全网最全最新,堪称地表最强

前言 2022秋招已经结束,在应聘过程中相信很多同学都感受到了目前测试就业越来越严峻,内卷也成了测试领域的代名词了。的一个HR朋友告诉我,由于门槛较低,现在普通测试岗(偏功能)的投递比已经将近100&#x…

如何让皮卡丘在网页上跑起来

说在前面 🎈相信很多80、90后的朋友,对QQ宠物印象非常深刻,每次开机宠物就会自动跑出来。曾经很多人想饿死他,但失败了;也有很多人一上线就退出,但就是不愿因取消“开机自动开启”的勾选。2018年09月15日&a…

Adobe Audition CS6 下载与安装教程

文章目录Adobe Audition CS6 简介(一)Adobe Audition cs6软件功能(二)Adobe Audition cs6软件特色(三)Adobe Audition cs6新增功能一,Adobe Audition CS6 下载二,Adobe Audition CS6…

ReactHook技巧

ReactHook技巧 文章目录ReactHook技巧一 概念二 useState三 useEffect3.1 无需清除副作用(**Effect**)3.2 需要清除副作用(**Effect**)3.3 控制(**Effect**)调用次数一 概念 1.什么是hook? 2.为什么要用hook? -: 为函数组件提供状态管理能力, 扩展 -: 在Function组件中勾入…

常用的国际物流运输方式有哪些

目前我国从事跨境电商行业的人才众多,不仅促进了我国外贸业务的活力,也促进了国际物流业的发展。国际货贸运输涉及陆运物流、海运物流、空运物流、管道物流、多式联运物流、邮运物流等多种运输方式。一、陆运物流 陆运物流含公路和铁路联运物流&#xff…

C语言百日刷题第十天

前言 今天是刷题第10天,放弃不难,但坚持一定很酷~ 快来跟我一起刷题吧。 C语言百日刷题第十天前言81.连接两个字符串82.输入一行字符,分别统计其中英文字母、空格、数字和其他字符的个数。83.写一个排序函数实现数组从小到大的排序84.字母的大…

SPARKSQL3.0-DataFrameAPI与spark.sql()区别源码分析

一、前言: 阅读本节需要先掌握spark-sql内部执行的基本知识: SessionState Unresolved阶段 Analyzer阶段中queryExecution的介绍 二、区别 spark.sql的执行顺序为: sql字符串 -> antlr4解析成AST语法树 -> unreolved解析成logicalPlan ->…

云计算正当时!将你的Java项目容器化

将您的 Java 应用程序 Docker 化 长按关注《Java学研大本营》,加入读者群,分享更多精彩 扫码关注《Java学研大本营》,加入读者群,分享更多精彩 随着每个人都转向 Kubernetes,知道如何对应用程序进行 Dockerize 是件好…

IPv6转换难点分析之一:国家监测指标-中科三方

从IPv4过渡到IPv6就像是“打破一个旧世界,创建一个新世界”,注定要经历一个长期的过程,但终究会实现。 一、IPv6过渡转换的障碍 目前互联网上还是以IPv4设备为主,不可能迅速过渡到IPv6,这主要受制于以下几个方面: &…

Nat. Mach. Intell2021 | MolCLR+:基于GNN的分子表征对比学习

原文标题:Molecular Contrastive Learning of Representations via Graph Neural Networks 代码:https://github.com/yuyangw/MolCLR 一、问题提出 首先,分子信息难以完全表示。例如,基于字符串的表示,如SMILES和SE…

未来展望:Starday供应链火力全开,为跨境电商再添动力!

2022年末将至,回顾这“命途多舛”的一年,也是令人非常唏嘘。近日,联合国发布《2022年年中世界经济形势与展望》报告,该报告指出正处于疫情恢复期的全球经济可能又到了一场新危机的边缘。据相关统计显示,2022年相比于20…

HttpServlet学习中的常见问题(个人珍藏笔记)

目录 一、HttpServlet 1.1核心方法 1.2、面试:谈谈Servlet的生命周期 二、HttpServletRequest 2.1、核心方法 2.2、如何获取请求头 三、HttpServletResponse 3.1核心方法 四、setCharacterEncoding和setContentType区别? 五、Json格式的转换问题…

串行通讯协议,只需要一文就可以给你讲懂

前言 最近在做一个通过ESP8266和STM32通讯从而实现远程控制,中间需要用到串口来发送报文,通过报文来实现两者之间的通讯。 今天刚好趁着这个机会来给大家讲解一下串行通讯,希望能给大家以后的学习提供一些思路。 串行通讯介绍 串口通信线…

磨金石教育摄影干货分享|怎样拍出唯美有内涵的“中国风”照片

之前有网友私聊我,说这两年很多人都在拍中国元素的照片,他们的照片不仅仅是对古建筑简单的拍摄,照片的内容拥有丰富的文化内涵。想问我这样的照片应该怎么拍才能达到有内涵的水平。 其实这个问题确实有一定的难度,每个人都有自己…

腾格尔成影视圈的香饽饽,十月天传媒正式邀请演唱主题曲

俗话说:姜还是老的辣,酒还是陈酿好。这句话用到音乐人腾格尔身上,就再贴切不过了。说起音乐人腾格尔,这位来自草原的雄鹰和苍狼,有很多部音乐作品,都被歌迷朋友们一直传唱。 如今的腾格尔老师,已…

六.初阶指针

前言:大家好哇!今天带大家认识下C语言中的指针,指针的用法等,希望对大家有所帮助! 目录 一.指针是什么 1.指针是什么? 2.如何理解指针变量 二.指针和指针的类型 1.指针类型 2.指针类型的意义 &#x…

http 跨域资源共享详解

http 跨域资源共享详解 由于浏览器同源策略限制,会导致出现跨域问题。而跨域资源共享(CORS)可以突破浏览的同源策略的限制,不过需要服务端配合设置相应的响应头,从而使跨源数据传输得以安全进行。 跨域资源共享新增了…

进销存软件对中小型企业管理有什么作用?

进销存软件对中小型企业管理有什么作用? 01 更加有序 库存不乱单据不乱价格不乱 使用进销存软件可以把这些都记录下来,有条不紊,出现什么问题也有据可查,不像纸质单据,会丢会坏,乱成一团。 02 能打印正式…

[Spring Cloud] Hystrix通过配置文件统一设置参数/与OpenFeign结合使用

✨✨个人主页:沫洺的主页 📚📚系列专栏: 📖 JavaWeb专栏📖 JavaSE专栏 📖 Java基础专栏📖vue3专栏 📖MyBatis专栏📖Spring专栏📖SpringMVC专栏📖SpringBoot专…