yolov8-03训练自己的数据集并保存推理结果

news2024/11/15 14:10:00

目标:将推理结果保存为xyxy形式,并以 pkl 格式保存

主要采取了两种方式,一种是阅读源码,通过CIL的方式保存结果。
一种是在IDE内,通过python代码的形式。

  1. 查看推理相关的源码,探索保存结果的相关信息。
    在文件 ultralytics-main\ultralytics\yolo\engine 中
  2. 在IDE中运行python

1. 分析源码

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. 通过CIL形式运行并对源码进行修改

a. 在这里插入图片描述在这里插入图片描述
获得的坐标结果是归一化后的结果,不是目标理想结果。

results 中有关于坐标转换的信息,进而发现具体内容在utils.ops中。
在这里插入图片描述

ops 中:

在这里插入图片描述
本项目目标:返回 xyxy 格式。
data 中原本格式应该就是 xyxy
在这里插入图片描述

做如下修改,将xywhn 改为xyxy
在这里插入图片描述
CIL运行:

yolo detect predict model=C:\WORK\puniu\yolo\trafficmodel\traffic_das581_yolo8.pt source=C:\WORK\puniu\yolo\data\partdata save_txt=True save_conf=True

sad ,坐标没有变成原图坐标
在这里插入图片描述
继续修改

3. IDE 内运行python代码

ps : 转步IDE,格式
在IDE中使用代码的方式读取和保存。
https://docs.ultralytics.com/modes/predict/

from ultralytics import YOLO

# Load a model
model = YOLO('yolov8n.pt')  # pretrained YOLOv8n model

# Run batched inference on a list of images
results = model(['im1.jpg', 'im2.jpg'])  # return a list of Results objects

# Process results list
for result in results:
    boxes = result.boxes  # Boxes object for bbox outputs
    masks = result.masks  # Masks object for segmentation masks outputs
    keypoints = result.keypoints  # Keypoints object for pose outputs
    probs = result.probs  # Class probabilities for classification outputs
import pickle

# Load a model
model = YOLO('traffic_das581_yolo8.pt')  # pretrained YOLOv8n model

# Run batched inference on a list of images
#results = model("20230621-163105-0.bmp")  # return a list of Results objects
results = model("..//data")  # return a list of Results objects
preds=[]
# Process results list
for result in results:
    boxes = result.boxes  # Boxes object for bbox outputs
    pred = boxes.data
    preds.append(pred)

with open('my_listv8.pkl', 'wb') as f22:
    pickle.dump(preds, f22)

查看result,会有大惊喜,yolo8真的太仙了,里面包含各种形式的输出结果
xyxy xywh xywhn cls conf 等,想要的结果都有。

在这里插入图片描述

并且,result.save_txt 也可也直接将结果保存为txt。 在IDE中运行时,之前对results.py做的修改就可以起作用,输出未归一化之前的xyxy。
但是还是不能理解,为什么在CMD 里通过CIL的形式结果不对。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/696995.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PySide6/PyQT 之应用程序最小化到系统托盘

前言 在使用 PySide6/PyQT 时,应用程序默认只会在任务栏展示一个初始图标。很显然,这是不够人性化的。 而在使用微信时候, 按下键盘的Esc,就是隐藏窗口;按下键盘的快捷键 Ctrl Alt W就是显示或隐藏窗口&#xff1…

【Axure高保真原型】多选树穿梭框选择器

今天和大家分享多选树穿梭框的原型模板,左侧多选树选择子级选项后,可以在右侧看到对应的标签,取消选中也会删除对应标签。多选树可以通过选中或取消选中父级自动选中或取消选对应的子级,也可以选中或取消选子级自动反选父级。右侧…

首届“天网杯”网络安全大赛启动 | 赛宁网安提供全面技术支撑

​​6月25日,由中华人民共和国公安部、天津市人民政府指导,天津市公安局、天津市委网信办、天津市工信局、天津市滨海新区人民政府、公安部第一研究所、国家计算机病毒应急处理中心共同主办,南京赛宁信息技术有限公司提供全面技术支撑的首届“…

文件后缀名和MimeType的映射关系

tomcat 的源码里边有。 打开 Tomcat官网 在 Download 菜单下找一个版本&#xff0c;比如 Tomcat 9&#xff0c;点进去&#xff0c;下载源码 找到 conf 目录下的 web.xml 文件 打开&#xff0c;里边有很多 <mime-mapping> 节点就是&#xff0c;总共一千多个吧 粘出来&…

银行卡如何大批量合并转到一个excel表中?并形成结构化数据

将银行卡图片转为Excel后&#xff0c;可以更方便地进行储存、管理和查看&#xff0c;其次也可以快速地进行数据的筛选、统计处理和分析&#xff0c;以提高工作效率&#xff0c;最后&#xff0c;还可以避免手工输入数据时出现的错误&#xff0c;提高数据的准确性。总之&#xff…

FreeRTOS学习笔记—FreeRTOS移植

文章目录 一、FreeRTOS移植1.1 将FreeRTOS的源码添加到工程1.2 修改部分文件1.2.1 修改 SYSTEM 文件1.2.2 修改 usart.c 文件1.2.3 修改 delay.c 文件 二、FreeRTOS移植测试 一、FreeRTOS移植 这里以博主STM32俗称笔记系列的GPIO工程文件为例&#xff0c;学习一下如何进行Free…

c++语言 打字游戏(随机字母)

c语言 打字游戏(随机字母) 程序运行如下 按 enter 回车键 随机字母之后&#xff0c;输入 测出正确率 用时多少秒 测试完按空格键从新开始 退出系统 按 Esc键 #include <stdio.h> #include <time.h> #include <stdlib.h> #include <math.h> #includ…

Bootstrap 排版

文章目录 Bootstrap 排版标题内联子标题 引导主体副本强调缩写地址&#xff08;Address&#xff09; Bootstrap 排版 Bootstrap 使用 Helvetica Neue、 Helvetica、 Arial 和 sans-serif 作为其默认的字体栈。 使用 Bootstrap 的排版特性&#xff0c;您可以创建标题、段落、列…

解决Tomcat控制台窗口输出乱码问题

由于编码的问题&#xff0c;tomcat的控制台窗口输出的都是中文乱码&#xff0c;这明显是编码格式导致的&#xff0c;只要找到对应的编码格式修改一下就好了&#xff0c; 由于我的服务器编码是GBK&#xff0c;所有只需把输出的编码修改为GBK就行了。 936就是GBK编码。找到tomca…

EasyCVR电子地图鼠标悬停展示经纬度的技术实现

EasyCVR可拓展性强、视频能力灵活、部署轻快&#xff0c;可支持的主流标准协议有GB28181、RTSP/Onvif、RTMP等&#xff0c;以及厂家私有协议与SDK接入&#xff0c;包括海康Ehome、海大宇等设备的SDK等&#xff0c;能对外分发RTSP、RTMP、FLV、HLS、WebRTC等格式的视频流。平台可…

python字典学习

读取和拷贝 if __name__ __main__:print()dictInfo {1: "This is one", 2: "", 3: , 5: "This is five"}# 字典的读取assert (len(dictInfo[1]) > 0)assert (len(dictInfo[2]) < 0)assert (len(dictInfo[3]) < 0)if 4 in dictInfo:a…

昨天去银行转钱,最后怒失300万

**本文首发于公众号【看点代码再上班】&#xff0c;建议关注公众号&#xff0c;及时阅读最新文章。** 原文&#xff1a;昨天去银行转钱&#xff0c;最后怒失300万 大家好&#xff0c;我是Eric&#xff0c;这是我的第24篇原创文章 我的300万"不见"了 小埃年初的时候看…

将grub安装到u盘

安装grub sudo apt-get install grub查看磁盘信息 fdisk -lu盘设备是/dev/sdb 使用fdisk编辑磁盘 fdisk /dev/sdbd命令删除磁盘分区 n命令新建磁盘分区 a命令将分区激活 w命令将更改保存到磁盘 创建两个分区&#xff0c;将其中一个设置活动分区。用于安装grub。剩下的分区可…

【源码解读】扩散模型核心:DDPM专题-结合源码讲解

目录 1. 训练1.1 Uniform({1,...,T})1.2 ϵ ∼ N ( 0 , I ) \boldsymbol{\epsilon} \sim \mathcal{N}(\mathbf{0}, \mathbf{I}) ϵ∼N(0,I)1.3 加噪1.4 加噪图片送入UNet预测加入的噪声1.5 预测的噪声和加入的噪声进行损失计算 2. 采样3. 推理 本次训练采用的是cifar数据集&am…

15天涨粉50万!B站有900万人看过都说“震撼”

“卷”是内容创作者对现在互联网竞争最大的评价&#xff0c;创作者之间复制力极强&#xff0c;导致赛道竞争力大&#xff0c;创作者亟待不断地推动自己找到一个又一个新的内容差异、流量风口。 所以不管是创作者还是品牌&#xff0c;只要是涉及到内容运营的都只有一个目标&…

【C#】反射机制,动态加载类文件

系列文章 【C#】编号生成器&#xff08;定义单号规则、固定字符、流水号、业务单号&#xff09; 本文链接&#xff1a;https://blog.csdn.net/youcheng_ge/article/details/129129787 【C#】日期范围生成器&#xff08;开始日期、结束日期&#xff09; 本文链接&#xff1a;h…

网络解析----yolov3网络解析

Yolov3是一种针对目标检测任务的神经网络模型&#xff0c;其网络结构主要由三个部分组成&#xff1a;特征提取网络、检测头和非极大值抑制&#xff08;NMS&#xff09;模块。特征提取网络采用Darknet-53作为骨干网络&#xff0c;Darknet-53由53个卷积层和5个Max-Pooling层组成&…

死锁的产生

死锁的产生&#xff1a;有一个公共区的玩具&#xff0c;A和B想玩&#xff0c;但是A先得到了玩具&#xff0c;A玩完玩具之后又去干别的事情&#xff0c;但是并没有把玩具还回去&#xff0c;此时B就玩不到了玩具&#xff0c;在无限期的等待。 如下图所示&#xff1a; 线程1把num资…

php压缩一个文件夹,php下载多个图片

$area_id 100;$area_name 一百;shell_exec("cd /www/wwwroot/api/public/images/ && zip -r " . $area_name . ".zip " . $area_id . "/"); 把 100/ 这个文件夹&#xff0c;压缩成 一百.zip 然后得到zip所在的下载url 这个功能&…

百度编辑器(Ueditor)视频上传到阿里云 + 预览不支持FLASH问题解决 + 输入框不展示视频播放页面问题解决

目前需求方提出的问题是以下四个&#xff1a; 1.百度编辑器&#xff08;Ueditor&#xff09;视频上传到阿里云 2.解决不支持FLASH问题 3.视频上传后可以预览 4.修改视频封面 看一下原始的功能是什么样的 上传视频&#xff1a; 视频上传完成 上传视频保存的路径&#xff1…