变电站缺陷数据集8307张,带xml标注和txt标注,可以直接用于yolo训练

news2024/9/20 22:32:09

变电站缺陷数据集8307张,
带xml标注和txt标注,可以直接用于yolo训练,赠附五个脚本

变电站缺陷数据集

数据集概述

变电站缺陷数据集是一个专门针对变电站设备和环境缺陷检测的图像数据集。该数据集包含了8307张经过标注的图像,旨在通过机器学习和计算机视觉技术来识别和分类变电站中的各种缺陷,如设备损坏、异常行为等。数据集同时提供了XML和TXT两种标注格式,可以直接用于YOLO系列目标检测模型的训练。

数据集特点
  1. 全面性:数据集涵盖了变电站设备的各种缺陷类型,包括但不限于设备损坏、异常行为等。
  2. 详细标注:每张图像都带有详细的标注信息,包括对象的类别、边界框坐标等。
  3. 兼容性强:提供了XML和TXT两种标注格式,既适合传统的基于XML的标注方式,也方便YOLO模型的直接使用。
  4. 实用性:数据集可以直接应用于变电站的安全监控和设备维护,帮助及时发现并处理潜在的安全隐患。
数据集构成

  • 图像数量:8307张
  • 标注格式
    • XML格式:适用于多种基于XML的标注工具和模型训练。
    • TXT格式:适用于YOLO系列目标检测模型的训练。

数据集用途
  • 缺陷检测:用于训练和测试识别变电站中设备缺陷的算法。
  • 安全监控:在实际应用中,可以用于自动化监控变电站设备的状态,及时发现并处理安全隐患。
  • 故障预防:帮助电力部门提前预警,减少由于设备缺陷导致的事故风险。
  • 研究与开发:为研究人员提供一个基准数据集,用于比较不同算法的效果。
  • 教育与培训:作为教学资源,帮助学生理解计算机视觉和机器学习的基本概念。
数据集获取

变电站缺陷数据集可以从相关的科研机构、数据提供商或者通过开源社区获取。获取数据集时,请遵循数据集发布的许可协议,确保合法使用。

示例代码

下面是一个简单的示例代码,展示了如何使用Python加载和预览变电站缺陷数据集中的图像及其XML格式的标注信息。

1import os
2import random
3import xml.etree.ElementTree as ET
4import matplotlib.pyplot as plt
5from PIL import Image
6
7# 数据集目录路径
8data_dir = 'path/to/transformer_station_defect_dataset'
9image_dir = os.path.join(data_dir, 'images')
10annotation_dir = os.path.join(data_dir, 'annotations_xml')
11
12# 随机选择一张图像
13image_files = os.listdir(image_dir)
14image_file = random.choice(image_files)
15image_path = os.path.join(image_dir, image_file)
16
17# 加载图像
18image = Image.open(image_path)
19
20# 加载XML标注
21xml_file = os.path.splitext(image_file)[0] + '.xml'
22xml_path = os.path.join(annotation_dir, xml_file)
23tree = ET.parse(xml_path)
24root = tree.getroot()
25
26# 绘制边界框
27fig, ax = plt.subplots(1, figsize=(10, 10))
28ax.imshow(image)
29ax.axis('off')
30
31for obj in root.findall('object'):
32    bbox = obj.find('bndbox')
33    xmin = int(bbox.find('xmin').text)
34    ymin = int(bbox.find('ymin').text)
35    xmax = int(bbox.find('xmax').text)
36    ymax = int(bbox.find('ymax').text)
37    label = obj.find('name').text
38    
39    ax.add_patch(plt.Rectangle((xmin, ymin), xmax - xmin, ymax - ymin, edgecolor='r', facecolor='none'))
40    ax.text(xmin, ymin, label, color='r', fontsize=8)
41
42plt.show()
YOLO标注格式转换

如果您需要将XML格式的标注转换为YOLO所需的TXT格式,可以使用以下Python代码示例:

1import os
2import xml.etree.ElementTree as ET
3
4# 数据集目录路径
5data_dir = 'path/to/transformer_station_defect_dataset'
6annotation_dir_xml = os.path.join(data_dir, 'annotations_xml')
7annotation_dir_yolo = os.path.join(data_dir, 'annotations_yolo')
8
9if not os.path.exists(annotation_dir_yolo):
10    os.makedirs(annotation_dir_yolo)
11
12# 类别映射字典
13class_map = {
14    'defect_type_1': 0,  # 替换为实际的类别名和索引
15    'defect_type_2': 1,
16    # 添加更多的类别
17}
18
19for xml_file in os.listdir(annotation_dir_xml):
20    if not xml_file.endswith('.xml'):
21        continue
22    
23    tree = ET.parse(os.path.join(annotation_dir_xml, xml_file))
24    root = tree.getroot()
25    
26    image_width = int(root.find('size/width').text)
27    image_height = int(root.find('size/height').text)
28    
29    with open(os.path.join(annotation_dir_yolo, os.path.splitext(xml_file)[0] + '.txt'), 'w') as f:
30        for obj in root.findall('object'):
31            label = obj.find('name').text.lower().strip()
32            if label in class_map:
33                class_id = class_map[label]
34                
35                bbox = obj.find('bndbox')
36                xmin = int(bbox.find('xmin').text)
37                ymin = int(bbox.find('ymin').text)
38                xmax = int(bbox.find('xmax').text)
39                ymax = int(bbox.find('ymax').text)
40                
41                x_center = (xmin + xmax) / 2.0
42                y_center = (ymin + ymax) / 2.0
43                w = xmax - xmin
44                h = ymax - ymin
45                
46                x_center /= image_width
47                y_center /= image_height
48                w /= image_width
49                h /= image_height
50                
51                f.write(f"{class_id} {x_center:.6f} {y_center:.6f} {w:.6f} {h:.6f}\n")

总结

此变电站缺陷数据集是一个高质量的数据集,涵盖了变电站设备的多种缺陷类型。数据集的特点是全面性、详细标注和兼容性强,能够满足不同研究需求。通过使用该数据集,研究者可以在变电站安全监控和设备维护领域推动技术进步,提高工作效率和安全性。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2145502.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Maven和Springboot初识

(一)Maven Maven是一个项目管理工具,通过一小段描述信息来管理项目的构建,报告和文档的项目管理工具 (可以通过pom.xml文件的配置来获取jar包,而不用手动添加) Maven可以提高我们的开发效率减少…

Mistral AI 又又又开源了闭源企业级模型——Mistral-Small-Instruct-2409

就在不久前,Mistral 公司在开源了 Pixtral 12B 视觉多模态大模型之后,又开源了自家的企业级小型模型 Mistral-Small-Instruct-2409 (22B),这是 Mistral AI 最新的企业级小型模型,是 Mistral Small v24.02 的…

C++源代码封装成dll动态链接库,并在WPF项目中使用的步骤说明

文章目录 1. 创建并生成C的DLL(C动态链接库)(1)新建项目-->开发语言选定C,在搜索栏搜索“动态链接库”-->配置项目名称和路径-->添加类,此处命名为My_C_Class(2)实现类的功能&#xff…

Elasticsearch 下载安装及使用总结

官网文档地址:Elasticsearch Guide [8.13] 官网下载地址:Download Elasticsearch 1. 下载安装 1、下载对应系统的版本 这里下载的 Elasticsearch 版本为 8.13.2,Elasticsearch 依赖 Java,因此要先在服务器上安装 JDK&#xff…

SOLIDWORKS® 2025 新增功能 - SIMULATION

SOLIDWORKS Simulation 1常规弹簧连接 • 通过定义仅轴向、各向同性或正交各向异性弹簧, 在曲面之间轻松创建自定义弹簧连接。 • 通过添加自定义合规性提高仿真性能和精度。 优点 利用新的弹簧连接功能, 实现更简单、更逼真的仿真 设置。 2增强了…

Unity 百度AI实现无绿幕拍照抠像功能(详解版)

目录 一、前言 1.抠像效果 2.去哪找百度ai抠图 3.基础流程跳过 二、获取AccessToken 1.什么是Token 2.为什么要获取Token 3.如何获取token 4.解析json 5.完整代码 三、抠像 1.准备地址 2.建立链接,和基本配置 3.图片格式转换 4.开始上传 5.获取回复…

SpringBoot 整合docker,执行容器服务

我使用以下文章的镜像作为演示镜像,读者有自己的镜像可以使用自己的 TencentARC/GFPGAN人脸恢复Ubuntu-22.04搭建(附带Docker镜像)_tencentarc gfpgan-CSDN博客 1. 封装springboot 启动docker容器的方法 public String runDockerCommand(String[] command) {StringBuilder res…

代码随想录Day 49|leetcode题目:42.接雨水、84.柱状图中最大矩形

提示:DDU,供自己复习使用。欢迎大家前来讨论~ 文章目录 题目题目一:42. 接雨水解题思路:暴力解法双指针优化思路:单调栈解法单调栈处理逻辑 题目二: 84.柱状图中最大的矩形解题思路:暴力解法双…

闯关leetcode——35. Search Insert Position

大纲 题目地址内容 解题代码地址 题目 地址 https://leetcode.com/problems/search-insert-position/description/ 内容 Given a sorted array of distinct integers and a target value, return the index if the target is found. If not, return the index where it wou…

【数据结构】排序算法---冒泡排序

文章目录 1. 定义2. 算法步骤3. 动图演示4. 性质5. 算法分析6. 代码实现C语言PythonJavaCGo 结语 1. 定义 冒泡排序(英语:Bubble sort)是一种简单的排序算法。它重复地走访过要排序的数列,一次比较两个元素,如果它们的…

svn回退到以前历史版本修改并上传

svn回退到以前版本,并在以前版本上修改代码后,上传到svn库当中,如下步骤: 3、 以回退到版本号4为例:选中版本号4,右键->Revert to this version,在出现的对话框中 点击yes! 4、 5、

【ARM】Trustzone和安全架构

Trustzone的基本概念&背景和历史 什么是Trustzone? 什么是TEE? Trustzone是一个技术,是一个技术的设计,一个安全架构,既不是软件也不是硬件。 TEE (Trusted Execution Environment) 可信执行环境。就是依托Trust…

Java项目——苍穹外卖(二)

Redis 简介 Redis是一个基于内存的key-value结构数据库 基于内存存储,读写性能高适合存储热点数据(热点商品、资讯、新闻)企业应用广泛 基础操作 启动 在redis安装目录中打开cmd,输入如上图指令即可启动,按下crtl…

linux入门到实操-6 Linux服务管理、系统运行级别、配置服务开机启动和关闭防火墙、关机重启

教程来源:B站视频BV1WY4y1H7d3 3天搞定Linux,1天搞定Shell,清华学神带你通关_哔哩哔哩_bilibili 整理汇总的课程内容笔记和课程资料(包含课程同版本linux系统文件等内容),供大家学习交流下载:…

html详细知识

1-标题标签、水平线、字体标签 <!--1.标题标签1&#xff09;格式&#xff1a;<hn></hn> n的范围是1-6&#xff0c;依次递减2&#xff09;标题标签特点&#xff1a;a:单独占一行b:自动加粗2.水平线1&#xff09;格式&#xff1a;<hr/>2)属性&#xff1a;…

soc及其相关概念

用户无法直接操作内存&#xff0c;只能让内存映射到用户空间然后操作 1. 内存映射&#xff08;Memory-Mapped Files&#xff09;内存映射文件是一种方法&#xff0c;它允许一个或多个进程将一个文件或者一个匿名区域映射到它们各自的虚拟地址空间中。当文件被映射到内存后&…

rsync 远程同步及实时同步部署

一、rsync 远程同步 1.1 rsync简介 Rsync&#xff08;Remote Sync&#xff0c;远程同步&#xff09;是一个开源的快速备份工具&#xff0c;适用于异地备份、镜像服务器等应用。它的主要功能特性包括&#xff1a; 数据镜像同步&#xff1a;在不同主机之间同步整个目录树。增量…

基于STM32的无人小车自主避障系统设计

文章目录 前言资料获取设计介绍功能介绍设计程序具体实现截图参考文献设计获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计划导师&#xff0c;一名热衷于单片机技术探索与分享的博主、专注于 精通51/STM32/MSP430/AVR等单片机设…

设计模式 享元模式(Flyweight Pattern)

享元模式 简绍 享元模式&#xff08;Flyweight Pattern&#xff09;是一种结构型设计模式&#xff0c;它的目的是通过共享技术来有效地支持大量细粒度的对象。享元模式可以极大地减少内存的使用&#xff0c;从而提高程序的性能。它特别适用于需要创建大量相似对象的场景&#…

鸿蒙 ArkUI组件三

ArkUI组件&#xff08;续&#xff09; QRCode组件 用于显示单个二维码的组件。 说明 该组件从API Version 7开始支持。后续版本如有新增内容&#xff0c;则采用上角标单独标记该内容的起始版本。二维码组件的像素点数量与内容有关&#xff0c;当组件尺寸过小时&#xff0c;可能…