【Datawhale AI夏令营第五期】 CV方向 Task01学习笔记 YOLO方案baseline
第四期给我的体验相当不错,于是我又冲动报名了第五期。这次比第四期的AIGC和大模型应用都要上强度。
CV这边进度拉得快,Task01都发布了。一看,好家伙,老朋友Yolo。
Yolo这块我有一个很推荐的B站UP:@肆十二
主页链接:https://space.bilibili.com/161240964
传送门
这位好心的大佬用人话讲解了好多基于Yolo的项目,而且专门针对学生毕设/小白练手的痛点。我第一次跑通Yolo就是跟着这位大佬学的。这位大佬在CSDN也有账号,膜拜.jpg。
我之前跟的是一个口罩检测的项目,特别适用于防疫期间抓不戴口罩的漏网之鱼,很有实际应用价值。这合集里面好像没放。
这个比赛应用场景不错耶,而且居然数据集是视频标注的,我之前实习只做过文本标注,然后自学了图像标注,这还是第一次看到视频标注的数据集!
我们下一个标注的案例来看看:
json是他的标注文件,标的就是违规行为帧编号,ID,行为类别和图形框坐标。
视频文件平平无奇,就是一段几秒的监控视频。
讲真,我觉得这个标注才有难度,垃圾桶、占道经营还好点,但我完全不知道咋看机动车违规停车,而且每帧视频要修改的地方和数量不固定,需要随机应变,比价值观标注要难得多。
模型居然是yolo8的,先进。我当时那个口罩检测还用的yolo5。
还没试运行完就遇到报错:
拖出去斩了,重新运行,活了!
然后又突发恶疾了:
缺东西,我第一反应是网不好,前面东西没下完。
但我重新Run了好几轮都报错,最后突然想起来,每一次训练会在Run下面建立一个新的文件夹,起名train+序号。我差的模型文件是训练中自动保存的最佳模型,那肯定是保存到了最新的train目录,我一共前后跑了四次,也就是这个train4里面。
至于为什么第一个那个train里面没东西,因为我第一次卡在上面那个bug了,没走完训练流程,所以也没有结果模型。我发现卡bug就整个重开了,所以第一次出结果其实是在train2里面。
但是源代码肯定还是默认白板配置,所以没有改索引目录,这个只能根据人想要第几轮的结果手工改——把train后面加上需要的轮次序号就行了,我这就是train4。
咱就是说得亏我现在有点跑模型训练的经验,还猜出了这个bug的原因。如果是当时啥也不知道的我估计只能原地抓瞎……
按照Baseline的指示,结果保存至result.zip里面。
拿VsCode打开看一下,发现增加了置信度Confidence这个指标。
注意关机要选择【无卡模式】:
学习手册写得很详细,提交就是提交这个result.zip文件,里面是每个视频的json信息。
哈哈,看来我的结果不太妙,笑死。
看了一下排行榜,基本上没动过模型按部就班跑完BaseLine的都是这样:
上面这段话我感觉对这几个参数的解释不够准确,问一下Kimi确认一下:首先含义是xy坐标和长宽,只是比例尺是相对原图的比例。
不得不说这些线上实例真的太方便了,解决了我很多装环境的烦恼。之前这个Ultraalytics库我也尝试跑过,无一例外又双叒叕是各种环境报错阻碍进度……
BaseLine这里给了我们一些可以参考的观测指标: