YOLO训练心得

news2024/12/23 0:18:21

文件框架

通过简单的模型训练,对于YOLO的理解更加透彻了。

detect.py文件

如上图所示,weights表示权重。source表示识别图像的位置。

train.py文件

如上图所示,weights是权重,我们通常使用YOLO提供的训练权重进行训练。data是训练数据。

之前我一直存在一个疑惑,通过本次项目训练有了很清楚的解答

问题:为什么训练里面没有写数据集的具体文件,具体文件在哪里?

解答: 具体文件就是data.yaml文件,由于这个文件后缀比较奇特,原来一直没见过,所以就一直没有太在意。

如上图所示,对应的train、val、test,链接到了三个具体位置,(有时候这里链接的是三个txt文件,里面对应的txt文件是具体的YOLO数据标注格式(一种txt,里面包含了图片的一些参数)的一个列表),下面的nc对应了类型数,下面的names对应了识别的物体类型有哪些种类。

附赠代码

XML数据标注类型文件转YOLO数据标注txt文件

import copy
from lxml.etree import Element, SubElement, tostring, ElementTree

import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join

# 类别
classes = ["auto", "bus", "tempo", "tractor", "truck"]


CURRENT_DIR = os.path.dirname(os.path.abspath(__file__))


def convert(size, box):
    dw = 1. / size[0]
    dh = 1. / size[1]
    x = (box[0] + box[1]) / 2.0
    y = (box[2] + box[3]) / 2.0
    w = box[1] - box[0]
    h = box[3] - box[2]
    x = x * dw
    w = w * dw
    y = y * dh
    h = h * dh
    return (x, y, w, h)


def convert_annotation(image_id):
    in_file = open('./XML_annotation/truck\%s.xml' % (image_id), encoding='UTF-8')
    out_file = open('./XML_annotation/truck\%s.txt' % (image_id), 'w')  # 生成txt格式文件
    tree = ET.parse(in_file)
    root = tree.getroot()
    size = root.find('size')
    w = int(size.find('width').text)
    h = int(size.find('height').text)

    for obj in root.iter('object'):
        cls = obj.find('name').text
        # print(cls)
        if cls not in classes:
            continue
        cls_id = classes.index(cls)
        xmlbox = obj.find('bndbox')
        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),
             float(xmlbox.find('ymax').text))
        bb = convert((w, h), b)
        out_file.write(str(cls_id) + " " +
                       " ".join([str(a) for a in bb]) + '\n')


xml_path = os.path.join(CURRENT_DIR, 'XML_annotation\\truck')
print(xml_path)
# xml list
img_xmls = os.listdir(xml_path)
for img_xml in img_xmls:
    # print(img_xml)
    label_name = img_xml.split('.')[0]
    print(label_name)
    convert_annotation(label_name)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1051460.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

ADworld reverse wp easyre-153

逆向分析 做逆向题先查壳, 就像做pwn先checksec一样 用PEid查不出来, 用Exeinfo PE可以查出ELF文件的壳 用工具直接脱upx壳, kali自带的工具或者手动安装一个windows的upx工具 脱壳之后拖入IDA32 int __cdecl main(int argc, const char **argv, const char **envp) {int …

SLAM从入门到精通(amcl定位使用)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 学习slam,一般就是所谓的边定位、边制图的知识。然而在实际生产过程中,比如扫地机器人、agv、巡检机器人、农业机器人&…

Sentinel学习——sentinel的使用,引入依赖和配置 对消费者进行流控 对生产者进行熔断降级

前言 Sentinel 是面向分布式、多语言异构化服务架构的流量治理组件,主要以流量为切入点,从流量路由、流量控制、流量整形、熔断降级、系统自适应过载保护、热点流量防护等多个维度来帮助开发者保障微服务的稳定性。 本篇博客介绍sentinel的使用&#x…

Bug:elementUI样式不起作用

前端问题合集:VueElementUI 1. Vue引用Element-UI时,组件无效果解决方案 前提: 已经安装好elementUI依赖 //安装依赖 npm install element-ui //main.js中导入依赖并在全局中使用 import ElementUI from element-ui Vue.use(ElementUI)如果此…

电压提前/滞后电路 —— 电赛综测备赛

电容可以让交流波形提前或滞后,不过很多人不知道用法 电压滞后电路 我们从中间输出给示波器 波形(红色) 电容越大电阻越大,波形越滞后 电压提前电路 波形(红色)提前 电容越小电阻越小,波形…

【python】numpy库

文章目录 简单介绍功能示例代码 简单介绍 NumPy(Numerical Python的简称)是Python数值计算最重要的基础包。大多数提供科学计算的包都是用NumPy的数组作为构建基础。 NumPy是在一个连续的内存块中存储数据,独立于其他Python内置对象。NumPy…

uniapp iOS离线打包——如何创建App并提交版本审核?

uniapp 如何创建App,并提交版本审核? 文章目录 uniapp 如何创建App,并提交版本审核?登录 appstoreconnect创建AppiOS 预览和截屏应用功能描述技术支持App 审核信息 App 信息内容版权年龄分级 价格与销售范围App 隐私提交审核 登录…

VS Code使用clang-format自定义C++代码默认格式化样式

解决的问题 让 VS Code 在不使用.clang-format或_clang-format文件时,默认使用自定义的 C 代码格式化样式。以下假定规则文件为D:\ClangFormat\rules.txt。 格式规则 具体设置参照 Clang-Format官方文档,也可以使用 Clang-Format交互式构建器。 贴上…

Spring Boot 中使用 Micrometer 进行度量和监控

Spring Boot 中使用 Micrometer 进行度量和监控 Micrometer 是一个开源的度量库,用于在应用程序中收集、存储和展示度量数据。它提供了一种统一的方式来度量应用程序的各种指标,如响应时间、请求次数、内存使用等。在Spring Boot中,Micromet…

kuaishou sig、sig3参数记录分析

**免责任声明: 任何可操作性的内容与本文无关,文章内容仅供参考学习 如有侵权, 损害贵公司利益, 请联系作者,会立刻马上进行删除** 经常研究快手的小伙伴都知道,快手有几个比较重要的参数,像sig,token-sig和sig3字段…

linux-定时任务

目录 一、crond命令 1、什么是计划任务 2、crond服务的概念 3、crontab 二、at命令 1、at任务的概念 三、邮件服务 1、概念 2、启动postfix 四、mailx命令 1、三个概念: 2、交互式发邮件 3、非交互式发邮件 四、cron定时任务实践 1、系统定时任务配置…

What is a UDP Flood Attack?

用户数据报协议 (UDP) 是计算机网络中使用的无连接、不可靠的协议。它在互联网协议 (IP) 的传输层上运行,并提供跨网络的快速、高效的数据传输。与TCP(其更可靠的对应物)不同,UDP不提…

ChatGPT,AIGC 助力人力资源管理对身份证号处理

HR,行政,文员办公对于员工信息管理中有一项目非常重要的操作,便是从身份证号中提取相关信息如下: 可以用ChatGPT完成三个字段的提取与计算。 我们先让ChatGPT描述一下身份证号每一位都代表什么意思。 接下来从身份证号中提取出生…

leetCode 139.单词拆分 + 完全背包 + 排列数

给你一个字符串 s 和一个字符串列表 wordDict 作为字典。请你判断是否可以利用字典中出现的单词拼接出 s 。 注意:不要求字典中出现的单词全部都使用,并且字典中的单词可以重复使用。 示例 1: 输入: s "leetcode", wordDict […

BUUCTF reverse wp 31 - 40

[HDCTF2019]Maze 脱壳, IDA打开, 发现无法F5, 而且反汇编失败 这种情况一般是花指令, 误导了IDA的递归反汇编, 这里E8是call指令, nop掉按p设置main函数入口再F5即可 int __cdecl main(int argc, const char **argv, const char **envp) {int v4; // [esp0h] [ebp-24h]int v5…

Python语言简介和版本选择

博主:命运之光 专栏:Python程序设计 目录 Python语言简介 Python发展历史 Python语言概述 Python版本选择 Python语言简介 解释型 解释执行可移植好 3种编程模式 函数式编程;对象编程;命令式编程 丰富的库 内置强大标准…

【软件评测】Apowersoft 傲软抠图AI智能换背景工具软件

现如今的数字图像处理已经成为人们生活中不可或缺的一部分,而图像抠图作为其中的重要环节,更是被广泛应用于设计、摄影、广告等领域。为了满足用户的需求,Apowersoft推出了一款傲软抠图AI智能换背景工具,宣称能够自动抠图并智能替…

提升 Windows 生产力的实用工具集:Microsoft PowerToys | 开源日报 No.42

microsoft/PowerToys Stars: 95.2k License: MIT Microsoft PowerToys 是一套用于调整和优化 Windows 体验以提高生产力的实用工具集。该项目包含多个功能模块,其中主要功能有:Always on Top、FancyZones、File Explorer Add-ons 等。其核心优势和关键特…

opencv实现目标跟踪及视频转存

创建跟踪器 def createTypeTracker(trackerType): 读取视频第一帧,选择跟踪的目标 读第一帧。 ok, frame video.read() 选择边界框 bbox cv2.selectROI(frame, False) 初始化跟踪器 tracker_type ‘MIL’ tracker createTypeTracker(tracker_type) 用第一…

AD20软件学习

一.建立文件夹以及汉化操作 1.创建工程 菜单栏- > File -> New -> Project 2.创建原理图 菜单栏- > File -> New -> Schematic 记得保存!!! 3.创建PCB 菜单栏- > File -> New -> PCB 依次为综合库,原…