开荒手册3——构思一篇小论文

news2024/11/23 19:30:55

0 写在前面

又过了一个gap week,总算想清楚了之前遇到的一些问题,现在需要把之前画的大饼们一个一个消化掉。跳出来就会知道,总有一些something is wrong的人喜欢散播点焦虑,你要做的不是惩戒他们,而是赶紧远离,世间事物总是平衡的,得到多少就会失去多少,同样失去多少就会得到多少。


分割线分割住焦虑。
事情的起因是由于中期了,需要搜集点专业资料用来画饼吹牛,然后再就是需要奶一波师弟,我希望我的师弟们也可以成为最好的师弟。因此,就有这篇,半教程半纪实的手册。(前段时间没更新的原因是太焦虑了调整自己用了很久,以及确实没有啥好的idea主题和素材,如果大家想有什么想知道的,可以私信告诉我)
我的一生就是要穷尽无限可能。

1 一个新思路

之前从魔法的角度说明了应该如何写一篇小论文/找创新点,都是一回事。现在用一个新角度和实例来说明该怎么做。
之前看的机器学习八股,有个很重要的知识点——机器学习的步骤。

  1. 收集数据
  2. 准备数据
  3. 选择模型
  4. 训练
  5. 评估
  6. 超参数调整
  7. 预测

那么我们这次试试使用机器学习完整的流程来解释应该做什么。

1.1 收集数据

收集数据:就是确定你的研究对象/研究目标是什么,通俗来说就是毕业论文题目中的物和数据。深度学习依赖大量的数据,所以需要进行数据集的搜集。
常见的COCO,VOC数据集,特定的在网上找一下或者海鲜市场。(感兴趣我做一个数据集整理)以我个人为例:我是扒的比赛数据集,另外和同学也可以共享。
特此解释一下,本人目前在手册中展示的ppt或者数据集均为个人资源以及课题组资料,目前无法开源。NEU师弟师妹可以凭学生证私信,无偿分享。不支持白嫖党,格局开了有没完全开。感谢理解。

传统水下目标检测数据集为:扇贝、海星、海胆、海参。
来源比赛:全国水下机器人大赛湛江赛:比赛链接
每年扩充数据集的内容变化不大,可参照2021年湛江赛为标准版本。
数据集内容:
train:8200
test:1200
样图:
在这里插入图片描述

1.2 准备数据

准备数据的意义:数据的处理和准备也是做实验的一个必要前提,处理得当的数据,也会促进实验效果。
处理数据要从以下几点考虑:

  • 如果要引用同行的数据实验:首先检验以下数据集是否一致,其次检验处理方法是否一致
  • 数据集是否需要重新标注
  • 是否数据集需要自己制作
  • 数据集的大小对检测结果的影响
  • 数据集预处理
  • 数据集中是否有影响检测效果的因素:即是否需要进行数据清洗

1.3 选择模型

深度学习模型有很多种,那么如何选择模型呢?

  • 首先选择最新的:新就是查看当年最新的论文/会议和项目,开源代码优先,缺点是对工程能力不强的人来说,比较难调试以及优化
  • 其次选择经典的:经典永流传,一个经典的框架是经过时代的验证,经典的框架有大厂进行维护,所以结构是比较完整的,也更模块化,比较好优化
  • 最后是根据你研究的问题来选择模型:比如做提升精度,尽量选择一些baseline精度较高,精益求精;解决的是工程问题,尽量选择比较轻的模型

1.4 训练

训练模型其实就是找到路径,将数据进行喂进去,再调整超参数。超参数的设置一般先按开源的框架给定描述来,其次是查阅对比文献,按对比文献的参数进行调整,实现控制变量的原则。

1.5 评估

一般来说,选择大厂背书过的模型是有集成的评价指标,如果需要增添其他的评价指标,需要自己进行写入。常见的目标检测指标一般为:

  • IOU
  • Precision
  • Recall
  • AP
  • mAP

1.6 超参数调整

这步有需要可以进行一定的实验,因为在某些文章中会根据炼丹过程进行判定,但是我还没有使用过这个,可以在后续的学习中了解一下再回来补上。

1.7 预测

在目标检测中,这个步骤叫做推理,就是检验你训练过的模型,是否能够在未打标的数据集上进行推理预测,检验结果。推理的结果可作为可视化展示的图片,上面标清楚了结果预测的数值,作为一个很好的判断。

2 有效复盘

其实构思小论文时,任何一步都会成为突破口,包括从评价指标点的切入,从提升推理时间的角度考虑。 都可以作为改进的创新点,然后检索出一个小的突破口,在进行深入的研究,就可以得到进展。
In a word嘛,就是阅读文章+做实验,一定可以有进展的,大家加油哦!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/59065.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

windows下安装ubuntu linux子系统

windows下安装ubuntu linux子系统一、win10下安装ubuntu linux子系统二、下载ubuntu子系统三、启动ubuntu子系统四、配置ubuntu子系统一、win10下安装ubuntu linux子系统 但我们现在自己的主机上跑linux时,有几种选择 同时安装多个操作系统,每次重启电…

js 代码的运行机制

前言: 自己从一开始学习 javaScript 的时候,踩过很多很多坑,初学之路上也问过很多大佬许多为什么...现在回过头感叹,当时问的某些问题确实是有一丢丢幼稚。但是作为一个过来者,我深知这些问题的对于很多“后来者”来说…

tensorflow的模型持久化

参考 tensorflow的模型持久化 - 云社区 - 腾讯云 目录 1、持久化代码实现 2、持久化原理及数据格式 1、meta_info_def属性 2、graph_def属性 3、saver_def属性 4、collection_def属性 1、持久化代码实现 tensorflow提供了一个非常简单的API来保存和还原一个神经网络模型…

自主式模块化无人机设计

目 录 摘 要 I Abstract II 1 绪论 1 1.1 研究背景与意义 1 1.2 国内外研究现状 1 1.3 主要研究内容 2 2自主式模块化无人机的总体结构设计 3 2.1结构形式 3 2.2工作原理 3 2.3机架及桨叶的选择 5 2.3.1 单个桨叶空气动力分析及桨叶的选择 5 2.3.2材料的选择 6 2.3.3机架结构分…

【教学类-20-01】20221203《世界杯16强国旗》(大班)

展示效果: 单人使用样式: 多页打印样式 ​ 背景需求: 做《蒙德里安》格子画时,我把A4纸分割为正方形画框和长条纸支撑。活动中幼儿询问:为什么我的画站不起来?(底边剪的不平整、提手太重、画…

知识直播:时代乐见搜狐的长期主义选择

国内著名商业咨询顾问刘润说:“所有伟大的机会都源自于巨大的结构性改变。大成就背后,一定有涌动的、因商业逻辑巨变而释放出来的红利。” 这话用在当前的互联网行业身上再好不过。面对重重不确定性,如何拨开迷雾,看懂市场趋势&a…

HTTP到底是什么?

文章目录HTTP简介HTTP协议的特点1) 简单快速2) 灵活3) 无连接4) 无状态HTTP协议的发展历程1) HTTP/0.92) HTTP/1.03) HTTP/1.14) HTTP/2.0HTTP的工作流程HTTP简介 HTTP 全称为 Hypertext Transfer Protocol,翻译为中文是“超文本传输协议”的意思,它是互…

Java并发编程—volatile

文章目录volatile的应用volatile的定义与实现原理专业术语:volatile是如何来保证可见性的呢?volatile的原理:volatile的两条实现原则:(物理上如何实施)volatile的内存语义volatile的特性例:下面…

SpringBoot -集成Druid

文章目录Druid概述使用问题解决Spring监控不生效方式1:修改yml的配置写法方式2:参考DruidSpringAopConfiguration自行注入Bean,灵活(更建议)Druid 概述 官网: https://github.com/alibaba/druid   文档&a…

校园论坛(Java)—— 用户管理系统模块

校园论坛(Java)—— 用户管理系统模块 文章目录校园论坛(Java)—— 用户管理系统模块[toc]1、写在前面2、系统结构设计2.1 各个页面之间的调用关系2.2. 用户管理系统模块各层的设计3、管理员管理用户功能3.1 管理员查看普通用户的…

微服务框架 SpringCloud微服务架构 10 使用Docker 10.1 镜像命令

微服务框架 【SpringCloudRabbitMQDockerRedis搜索分布式,系统详解springcloud微服务技术栈课程|黑马程序员Java微服务】 SpringCloud微服务架构 文章目录微服务框架SpringCloud微服务架构10 使用Docker10.1 镜像命令10.1.1 镜像相关命令10.1.2 镜像操作命令10.1.…

SpringBoot_整合PageHelper

分页插件/PageHelper插件 我们在正常的查询业务之中,只需要加上一行代码就可以实现分页的数据的封装处理 实现原理 PageHelper方法使用了静态的ThreadLocal参数,分页参数和线程是绑定的。内部流程是ThreadLocal中设置了分页参数(pageIndex&#xff0c…

TypeScript21(装饰器Decorator)

Decorator 装饰器是一项实验性特性,在未来的版本中可能会发生改变 不仅增加了代码的可读性,清晰地表达了意图,而且提供一种方便的手段,增加或修改类的功能; 若要启用实验性的装饰器特性,你必须在命令行或…

计算机网络 HTTPS

HTTPS HTTPS (全称:Hypertext Transfer Protocol Secure ),是以安全为目标的 HTTP 通道,在HTTP的基础上通过传输加密和身份认证保证了传输过程的安全性 。HTTPS 在HTTP 的基础下加入SSL,HTTPS 的安全基础是…

git:多分支管理

多分支管理1. 列出分支2. 新建分支3. 删除分支4. 切换分支5. 分支合并多分支开发的特点 | 作用1. 测试:合并之后再在分支中工作是否主分支里面的相同文件不会更改2. 测试:修改编辑test分支的文件,最后再合并分支,是否是直接覆盖&a…

FT2004(D2000)开发实战之启动流程介绍

一 启动流程概述 飞腾FT2004/D2000芯片提供两种引导方案,具体如下所示: 方案一: 方案二: 方案一和方案二的区别是第二阶段的运行组件不同,方案一运行的是U-boot、方案二运行的是UEFI 那么为什么会这样的了? 答案是:飞腾FT2004/D2000芯片既可以用于嵌入式方案,也可以…

Docker中网络的使用和配置用法详解

一、单个物理机中docker网络 1.1 Docker默认网桥 安装Docker 服务默认会创建一个 docker0 网桥(其上有一个 docker0 内部接口),它在内核层连通了其他的物理或虚拟网卡,这就将所有容器和本地主机都放到同一个物理网络。 使用 doc…

初识猿如意开发工具

嗨,大家好,我是异星球的小怪同志 一个想法有点乱七八糟的小怪 如果觉得对你有帮助,请支持一波。 希望未来可以一起学习交流。 一、初遇猿如意 第一次听说猿如意开发工具,于是抱着试试的心态,开始下载尝试。 首先是…

算法导论23章最小生成树习题—23.2练习

23.2-1对于同一个输人图,Kruskal 算法返回的最小生成树可以不同。这种不同来源于对边进行排序时,对权重相同的边进行的不同处理。证明:对于图G的每棵最小生成树T,都存在一种办法来对G的边进行排序,使得Kruskal算法所返回的最小生成…

HTML+CSS+JS网页设计期末课程大作业——上海旅游景点(10页)web前端开发技术 web课程设计 网页规划与设计

👨‍🎓学生HTML静态网页基础水平制作👩‍🎓,页面排版干净简洁。使用HTMLCSS页面布局设计,web大学生网页设计作业源码,这是一个不错的旅游网页制作,画面精明,排版整洁,内容…