目标检测——GDXray数据集转为YOLO格式

news2025/1/23 15:03:40

关于该数据集的介绍可以看我写的另一篇博客:链接

论文题目:《GDXray: The Database of X-ray Images for Nondestructive Testing》
论文链接:https://link.springer.com/article/10.1007/s10921-015-0315-7

Github链接  https://github.com/computervision-xray-testing/GDXray/blob/main/README.md

以GDXray的Baggages为例,其原数据集下载下来如下所示:

 

 其中每个文件夹里都有ground_truth.txt,即坐标框相关的信息,ground_truth.txt内容如下:

 知道了每个数字对应的含义,接下来的任务就简单了,因此只需要针对相同的ID创建同样的TXT的Label,并且对应图片的ID名即可,参考代码如下:
注:该代码仅是针对一组图片的,所有的图片都需转换的话再套一个循环即可!

import os


def map_number_to_filename(dir_name, number):
    """
    将数字映射为特定的文件名格式。

    参数:
    - number: 一个浮点数,表示映射的键。

    返回:
    - str: 按照给定格式映射后的文件名。
    """


    # 将浮点数转换为字符串,并去掉不必要的小数点和之后的所有0
    number_str = format(number, '.0f')
    
    # 将字符串格式化为至少4位的数字,不足部分前面补0
    number_str_padded = number_str.zfill(4)
    
    # 构造文件名
    img_name = f"{dir_name}_{number_str_padded}.png"
    label_name = f"{dir_name}_{number_str_padded}.txt"

    
    return label_name, img_name


import cv2

def get_image_dimensions(image_path, pos_list):
    """
    使用OpenCV获取指定图片文件的宽度和高度。
    
    参数:
    - image_path: 图片文件的路径。
    
    返回:
    - (width, height): 图片的宽度和高度的元组。
    """
    templist = []
    # 使用cv2.imread读取图片,0表示以原始格式读取
    image = cv2.imread(image_path, 0)
    
    # 检查图片是否正确读取
    if image is None:
        raise FileNotFoundError(f"The image at path {image_path} could not be found or is not a valid image file.")
    
    # 图片的尺寸可以通过image.shape属性获取,它返回一个三元组(height, width, channels)
    height, width = image.shape[:2]

    b_w = float(pos_list[1]) - float(pos_list[0])
    b_h = float(pos_list[3]) - float(pos_list[2])
    b_x = (float(pos_list[0]) + float(pos_list[1]))/2.0
    b_y = (float(pos_list[2]) + float(pos_list[3]))/2.0

    x = float(b_x)/width
    y = float(b_y)/height
    w = float(b_w)/width
    h = float(b_h)/height
    
    templist.append(x)
    templist.append(y)
    templist.append(w)
    templist.append(h)
    return templist


if __name__ == "__main__":
    dir_path = r"F:\BaiduNetdiskDownload\DataSet\GDXray\Baggages\Baggages\B0001"
    dir_basename = os.path.basename(dir_path)
    ground_truth_txt = os.path.join(dir_path,'ground_truth.txt')
    save_txt_dir = os.path.join(os.path.dirname(dir_path), f"YOLO_{dir_basename}")
    if not os.path.exists(save_txt_dir):
        os.makedirs(save_txt_dir)

    f = open(ground_truth_txt,'r',encoding='utf-8')
    contents = f.readlines()

    for content in contents:
        content = content.strip().split("   ")
        filename, img_name = map_number_to_filename(dir_name=dir_basename, number=float(content[0]))
        img_path = os.path.join(dir_path, img_name)
        yolo_pos_list = get_image_dimensions(img_path, pos_list=content[1:])

        save_filename = os.path.join(save_txt_dir,filename)
        f_s = open(save_filename,'a',encoding='utf-8')
        f_s.write("0 ")
        f_s.write(str(yolo_pos_list[0]))
        f_s.write(" ")
        f_s.write(str(yolo_pos_list[1]))
        f_s.write(" ")
        f_s.write(str(yolo_pos_list[2]))
        f_s.write(" ")
        f_s.write(str(yolo_pos_list[3]))
        

拿一组数据集来进行实验,B0001文件夹

运行代码得到: 

进行可视化验证,相关代码如下:链接

 

 

针对于它的类别暂时不知道写什么,但是框的位置没问题了,类别后期确定了根据做个映射就行,完美!!! 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1978080.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JavaScript小本本|JavaScript 对象方法定义的演变

在微信中阅读,欢迎关注公众号:CodeFit。 创作不易,如果你觉得这篇文章对您有帮助,请不要忘了 点赞、分享 和 关注,为我的 持续创作 提供 动力! 欢迎订阅《Vue 3.x 必修课|2024》:htt…

JAVA项目基于SpringBoot的外卖点餐管理系统

目录 一、前言 二、技术介绍 三、系统实现 四、论文参考 五、核心代码 六、源码获取 全栈码农以及毕业设计实战开发,CSDN平台Java领域新星创作者,专注于大学生项目实战开发、讲解和毕业答疑辅导。获取源码联系方式请查看文末 一、前言 随着生活节…

C++20中的模块

大多数C项目使用多个翻译单元(translation units),因此它们需要在这些单元之间共享声明和定义(share declarations and definitions)。headers的使用在这方面非常突出。模块(module)是一种language feature,用于在翻译单元之间共享声明和定义。它们是某些…

追问试面试系列:Dubbo

欢迎来到Dubbo系列,在面试中被问到Dubbo相关的问题时,大部分都是简历上写了Dubbo,或者面试官想尝试问问你对Dubbo是否了解。 本系列主要是针对面试官通过一个点就使劲儿往下问的情况。 面试官:说说你们项目亮点 好的面试官 我们这个项目的技术亮点在于采用了Spring Cloud…

正点原子imx6ull-mini-Linux驱动之Linux I2C 驱动实验(21)

I2C 是很常用的一个串行通信接口,用于连接各种外设、传感器等器件,在裸机篇已经对 I.MX6U 的 I2C 接口做了详细的讲解。本章我们来学习一下如何在 Linux 下开发 I2C 接口器件 驱动,重点是学习 Linux 下的 I2C 驱动框架,按照指定的…

人工智能深度学习系列—探索Jaccard相似度损失:图像分割领域的新利器

文章目录 1. 背景介绍2. Loss计算公式3. 使用场景4. 代码样例5. 总结 1. 背景介绍 在深度学习的各种应用中,图像分割是一项极具挑战性的任务。Jaccard相似度损失(Jaccard Similarity Loss),又称为IoU损失(Intersectio…

计算机基本理论与程序运行原理概述

目录 计算机的基本表示方法 计算机的组成 程序运行的原理 指令执行的流水线 编译原理 个人理解 面试题总结 计算机的基本表示方法 计算机系统使用高、低电平来表示逻辑1和0。数据在计算机中的存储、传输和处理均以二进制形式进行。数据通过总线作为电信号进行传输&…

Es6常用的一些数组处理方法

在平时的开发中,我们很多时候用到数组结构数据,那么如何高效处理数组是可以提高开发效率的,现在越来越多人使用es6,那么它的很多方法简化了我们对数据的操作,比如以前数组循环用for循环写比较多的代码,现在…

HTML-07.表格标签

一、要制作的表格如下 二、代码如下 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>表格标签<…

探索数据结构:二叉搜索树的递归与非递归实现

✨✨ 欢迎大家来到贝蒂大讲堂✨✨ &#x1f388;&#x1f388;养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; 所属专栏&#xff1a;数据结构与算法 贝蒂的主页&#xff1a;Betty’s blog 1. 二叉搜索树的介绍 二插入搜索树&#xff08;Binary Search Tree&…

第16课 Scratch入门篇:师生问候-广播版

师生问候-广播版 故事背景&#xff1a; 上节课我们完成了师生问候功能&#xff0c;指令罗列的蛮多&#xff0c;写起来很麻烦&#xff0c;而且阅读起来不容易理解&#xff0c;这节课我们把上节课内容进行优化&#xff0c;引入一个新的指令-广播&#xff0c;广播相当于一个事件的…

DFS之迭代加深+双向DFS+IDA*

迭代加深&#xff1a; 搜索范围一层一层扩大&#xff0c;可以快速某些分支比较深&#xff0c;但是答案比较浅的问题。 https://www.acwing.com/problem/content/172/ 通过观察可以发现&#xff1a; 1.搜索时最坏情况可能搜到100层&#xff0c;比较深&#xff0c;但是答案应…

【Javax.Validation】✈️整合 SpringBoot 实现运行时的参数校验

目录 &#x1f44b;前言 &#x1f440;一、Validation 依赖 &#x1f4eb;二、常见注解 2.1 不需要指定注解参数 2.2 需要声明注解参数 &#x1f49e;️三、项目测试注解使用 3.1 依赖引入 3.2 实体类创建 3.3 创建对外接口 3.4 模拟请求 &#x1f331;四、章末 &#x1f…

RSS 2024 清华大学交叉院高阳提出高效的机器人操作技能学习方法

机器人掌握一项新技能需要几步&#xff1f; 一般来说&#xff0c;在传统机器学习方法中&#xff0c;通常使用演示学习的方式教会机器人掌握新技能&#xff0c;然而&#xff0c;收集高质量的演示数据成本高且耗时&#xff0c;一定程度上影响了机器人技能学习进度。尽管视频作为…

⭕️【论文阅读】《Interactive Class-Agnostic Object Counting》

[2309.05277] Interactive Class-Agnostic Object Counting (arxiv.org) code&#xff1a; cvlab-stonybrook/ICACount: [ICCV23] Official Pytorch Implementation of Interactive Class-Agnostic Object Counting (github.com) 目录 Abstract Abstract 我们提出了一个新…

linux学习记录(一)--------目录及文件操作

文章目录 前言Linux目录及文件操作1.Linux目录结构2.常用的Linux命令3.vi编辑器的简单使用4.vi的两个模式 前言 小白学习linux记录有错误随时指出~ Linux目录及文件操作 Linux采用Shell命令->操作文件 1.Linux目录结构 根目录&#xff1a;/ 用户目录&#xff1a;~或者/ho…

float转uint8_t数组

float类型在x64中占4字节&#xff0c;需要占据uint8_t数组大小4字节 数据float类型3.14&#xff0c;在内存中4字节地址应该为0x4048f5c3 如果直接使用memcpy内存复制&#xff0c;0xc3会放在数组下标小的位置

〖任务1〗ROS2 jazzy Linux Mint 22 安装教程

前言&#xff1a; 本教程在Linux系统上使用。 目录 一、linux安装二、linux VPN安装三、linux anaconda安装&#xff08;可选&#xff09;四、linux ROS2 安装五、rosdep init/update 解决方法六、安装GUI 一、linux安装 移动硬盘安装linux&#xff1a;[LinuxToGo教程]把ubunt…

代码随想录算法训练营第43天|LeetCode 300.最长递增子序列、674. 最长连续递增序列、718. 最长重复子数组

1. LeetCode 300.最长递增子序列 题目链接&#xff1a;https://leetcode.cn/problems/longest-increasing-subsequence/description/ 文章链接&#xff1a;https://programmercarl.com/0300.最长上升子序列.html 视频链接&#xff1a;https://www.bilibili.com/video/BV1ng411J…

进阶SpringBoot之 Spring 官网或 IDEA 快速构建项目

SpringBoot 就是一个 JavaWeb 的开发框架&#xff0c;约定大于配置 程序 数据结构 算法 微服务架构是把每个功能元素独立出来&#xff0c;再动态组合&#xff0c;是对功能元素的复制 这样做可以节省调用资源&#xff0c;每个功能元素的服务都是一个可替代、可独立升级的软…