python:YOLO格式数据集图片和标注信息查看器

news2025/1/11 21:06:56

作者:CSDN @ _养乐多_

本文将介绍如何实现一个可视化图片和标签信息的查看器,代码使用python实现。点击下一张和上一张可以切换图片。

在这里插入图片描述


文章目录

      • 一、脚本界面
      • 二、完整代码


一、脚本界面

界面如下图所示,

在这里插入图片描述

二、完整代码

使用代码时,需要修改 class_id_to_name 还有 YOLO 格式的图片(images)文件夹路径和标签(labels)文件夹路径。

from PIL import Image, ImageDraw, ImageFont, ImageTk
import tkinter as tk
from tkinter import ttk
import os

# 创建类别 ID 到中文名称的映射
class_id_to_name = {
    0: "飞机",
    1: "船只",
    2: "储油罐",
    3: "棒球场",
    4: "网球场",
    5: "篮球场",
    6: "跑道场地",
    7: "港口",
    8: "桥梁",
    9: "车辆"
}

def get_image_size(image_path):
    # 打开图片文件
    with Image.open(image_path) as img:
        # 获取图片的宽度和高度
        width, height = img.size
        return width, height

def read_yolo_labels(label_file, img_width, img_height):
    with open(label_file, 'r') as file:
        lines = file.readlines()

    boxes = []
    for line in lines:
        parts = line.strip().split()
        class_id = int(parts[0])
        x_center = float(parts[1])
        y_center = float(parts[2])
        width = float(parts[3])
        height = float(parts[4])

        # 将 YOLO 格式转换为像素坐标
        x_center_px = int(x_center * img_width)
        y_center_px = int(y_center * img_height)
        width_px = int(width * img_width)
        height_px = int(height * img_height)

        # 计算矩形框的左上角和右下角点
        x1 = int(x_center_px - width_px / 2)
        y1 = int(y_center_px - height_px / 2)
        x2 = int(x_center_px + width_px / 2)
        y2 = int(y_center_px + height_px / 2)

        boxes.append((x1, y1, x2, y2, class_id))

    return boxes

def draw_boxes_on_image(image_path, boxes):
    # 使用 PIL 加载图片
    img = Image.open(image_path)
    draw = ImageDraw.Draw(img)

    # 定义颜色和线宽
    box_color = "yellow"  # 选择一个亮色
    line_width = 5  # 设置较粗的线宽

    # 使用支持中文字符的系统字体
    try:
        # 尝试使用支持中文的常见系统字体
        font = ImageFont.truetype("msyh.ttc", size=24)  # 微软雅黑
    except IOError:
        # 回退到默认字体
        font = ImageFont.load_default()

    for (x1, y1, x2, y2, class_id) in boxes:
        # 绘制矩形框
        draw.rectangle([x1, y1, x2, y2], outline=box_color, width=line_width)
        # 从 class_id 获取类别名称
        class_name = class_id_to_name.get(class_id, "未知")
        text = class_name
        text_width, text_height = 50, 40  # 设定文本框的宽度和高度
        text_x = x1
        text_y = y1 - text_height - 5
        # 绘制带背景矩形的文本
        draw.rectangle([text_x, text_y, text_x + text_width, text_y + text_height], fill=box_color)
        draw.text((text_x, text_y), text, fill="black", font=font)

    return img

def display_image_with_boxes(image_file, label_file):
    # 获取图片尺寸
    img_width, img_height = get_image_size(image_file)

    # 读取 YOLO 标签
    boxes = read_yolo_labels(label_file, img_width, img_height)

    # 在图片上绘制矩形框
    img_with_boxes = draw_boxes_on_image(image_file, boxes)

    return img_with_boxes

class ImageViewer:
    def __init__(self, root, image_files, label_files):
        self.root = root
        self.image_files = image_files
        self.label_files = label_files
        self.current_index = 0

        # 设置固定的查看器大小
        self.viewer_width = 800
        self.viewer_height = 600

        # 初始化界面
        self.init_ui()

    def init_ui(self):
        self.canvas = tk.Canvas(self.root, width=self.viewer_width, height=self.viewer_height)
        self.canvas.pack()

        self.prev_button = ttk.Button(self.root, text="上一张", command=self.prev_image)
        self.prev_button.pack(side=tk.LEFT)

        self.next_button = ttk.Button(self.root, text="下一张", command=self.next_image)
        self.next_button.pack(side=tk.RIGHT)

        self.update_image()

    def update_image(self):
        image_file = self.image_files[self.current_index]
        label_file = self.label_files[self.current_index]
        img_with_boxes = display_image_with_boxes(image_file, label_file)

        # 将图片转换为 Tkinter 可用格式
        img_with_boxes = img_with_boxes.convert("RGB")
        img_tk = ImageTk.PhotoImage(img_with_boxes)

        # 计算缩放比例
        img_width, img_height = img_with_boxes.size
        scale = min(self.viewer_width / img_width, self.viewer_height / img_height)
        new_width = int(img_width * scale)
        new_height = int(img_height * scale)

        # 缩放图片
        img_resized = img_with_boxes.resize((new_width, new_height), Image.Resampling.LANCZOS)
        img_tk_resized = ImageTk.PhotoImage(img_resized)

        # 清除画布上的内容
        self.canvas.delete("all")

        # 在画布上显示图片
        self.canvas.create_image(self.viewer_width / 2, self.viewer_height / 2, image=img_tk_resized)

        # 保持对图像的引用
        self.canvas.image = img_tk_resized

    def prev_image(self):
        if self.current_index > 0:
            self.current_index -= 1
            self.update_image()

    def next_image(self):
        if self.current_index < len(self.image_files) - 1:
            self.current_index += 1
            self.update_image()

if __name__ == "__main__":
    # 图片和标签文件的路径
    image_folder = 'E:\\DataSet\\positive'
    label_folder = 'E:\\DataSet\\yolo_labels'

    # 获取所有图片和标签文件
    image_files = sorted([os.path.join(image_folder, f) for f in os.listdir(image_folder) if f.endswith('.jpg')])
    label_files = sorted([os.path.join(label_folder, f) for f in os.listdir(label_folder) if f.endswith('.txt')])

    # 创建 Tkinter 窗口
    root = tk.Tk()
    root.title("图片标注查看器")

    # 启动图像查看器
    viewer = ImageViewer(root, image_files, label_files)
    root.mainloop()

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1982333.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

无线WiFi破解原理(超详细)

大家应该都有过这样的经历&#xff0c;就是感觉自己家的无线网怎么感觉好像变慢了&#xff0c;"是不是有人蹭我家网&#xff1f;""还有的时候咱们出门也想试图蹭一下别人家的网"&#xff0c;这里"蹭网"的前提是要破解对方的"无线密码"…

SQL注入复现1-18关

一、联合查询&#xff08;1-4关&#xff09; 首先打开第一关查看源代码&#xff0c;他的闭合方式为 找到闭合方式后&#xff0c;我们就可以使用order by来确定列数 我们可以看到使用order by 4--回车时报错&#xff0c;使用order by 3--时显示&#xff0c;所以我们就得到他得列…

微信丨QQ丨TIM防撤回工具

适用于 Windows 下 PC 版微信/QQ/TIM的防撤回补丁。支持最新版微信/QQ/TIM&#xff0c;其中微信能够选择安装多开功能。微信防撤回信息&#xff01; 「防撤回」来自UC网盘分享https://drive.uc.cn/s/95f9aabbc9684

2024年起重机司机(限桥式起重机)证模拟考试题库及起重机司机(限桥式起重机)理论考试试题

题库来源&#xff1a;安全生产模拟考试一点通公众号小程序 2024年起重机司机(限桥式起重机)证模拟考试题库及起重机司机(限桥式起重机)理论考试试题是由安全生产模拟考试一点通提供&#xff0c;起重机司机(限桥式起重机)证模拟考试题库是根据起重机司机(限桥式起重机)最新版教…

elasticsearch教程

1. 单点部署(rpm): #提前关闭firewalld,否则无法组建集群 #1. 下载ES rpm包 ]# https://www.elastic.co/cn/downloads #2. 安装es ]# rpm -ivh elasticsearch-7.17.5-x86_64.rpm #3. 调整内核参数(太低的话es会启动报错) echo "vm.max_map_count655360 fs.file-max 655…

MySQL1 DDL语言

安装与配置 官网&#xff1a; MySQL :: Download MySQL Installer 阿里云&#xff1a; MySQL8 https://www.alipan.com/s/auhN4pTqpRp 点击链接保存&#xff0c;或者复制本段内容&#xff0c;打开「阿里云盘」APP &#xff0c;无需下载极速在线查看&#xff0c;视频原画倍速…

外卖项目day14(day11)---数据统计

Apache ECharts 大家可以看我这篇文章&#xff1a; Apache ECharts-CSDN博客 营业额统计 产品原型 接口设计 新建admin/ReportController /*** 数据统计相关接口*/ RestController RequestMapping("/admin/report") Api(tags "数据统计相关接口") Slf…

快速解密哈希算法利器Hasher:解密MD5、SHA256、SHA512、RIPEMD160等最佳工具

文章目录 一、工具概述1.1主要功能点1.2 支持多种哈希算法 二、安装方法三、使用教程四、结语 一、工具概述 Hasher 是一个哈希破解工具,支持多达 7 种类型的哈希算法,包括 MD4、MD5、SHA1、SHA224、SHA256、SHA384、SHA512 等。它具有自动检测哈希类型、支持 Windows 和 Linux…

浙大阿里联合开源AudioLCM,在通用音频合成领域实现潜在一致性模型的新突破...

文本到通用音频生成&#xff08;Text-to-Audio Generation&#xff0c;简称 TTA&#xff09;作为生成任务的一个子领域&#xff0c;涵盖了音效创作、音乐创作和合成语音&#xff0c;具有广泛的应用潜力。在此前的神经 TTA 模型中&#xff0c;潜在扩散模型&#xff08;Latent Di…

【RHEL7】无人值守安装系统

目录 一、kickstart服务 1.下载kickstart 2.启动图形制作工具 3.选择设置 4.查看生成的文件 5.修改ks.cfg文件 二、HTTP服务 1.下载HTTP服务 2.启动HTTP服务 3.将挂载文件和ks.cfg放在HTTP默认目录下 4.测试HTTP服务 三、PXE 1.查看pxe需要安装什么 2.安装 四、…

批量按照原图片名排序修改图片格式为00000001.png(附代码)

&#x1f4aa; 专业从事且热爱图像处理&#xff0c;图像处理专栏更新如下&#x1f447;&#xff1a; &#x1f4dd;《图像去噪》 &#x1f4dd;《超分辨率重建》 &#x1f4dd;《语义分割》 &#x1f4dd;《风格迁移》 &#x1f4dd;《目标检测》 &#x1f4dd;《暗光增强》 &a…

ARMxy工控机使用Node-Red教程:安装工具和依赖(2)

2.3 工具安装 Node-Red 安装过程需要用到网络。请通过网线将设备千兆网口 ETH1 连接至互联网&#xff0c;确保可正常访问互联网。 Node-Red 是一个基于Node的可视化编程工具&#xff0c;因此需要先安装Node。为了便于测试&#xff0c;我司提供的 node-v16.14.0-linux-arm64.t…

原神升级计划数据表:4个倒计时可以修改提示信息和时间,可以点击等级、命座、天赋、备注进行修改。

<!DOCTYPE html> <html lang"zh-CN"><head><meta charset"UTF-8"><title>原神倒计时</title><style>* {margin: 0;padding: 0;box-sizing: border-box;body {background: #0b1b2c;}}header {width: 100vw;heigh…

「队列」实现FIFO队列(先进先出队列|queue)的功能 / 手撕数据结构(C++)

概述 队列&#xff0c;是一种基本的数据结构&#xff0c;也是一种数据适配器。它在底层上以链表方法实现。 队列的显著特点是他的添加元素与删除元素操作&#xff1a;先加入的元素总是被先弹出。 一个队列应该应该是这样的&#xff1a; --------------QUEUE-------------——…

大数据资源平台建设可行性研究方案(58页PPT)

方案介绍: 在当今信息化高速发展的时代&#xff0c;大数据已成为推动各行各业创新与转型的关键力量。为了充分利用大数据的潜在价值&#xff0c;构建一个高效、安全、可扩展的大数据资源平台显得尤为重要。通过本方案的实施企业可以显著提升数据处理能力、优化资源配置、促进业…

SQL注入实例(sqli-labs/less-8)

0、初始页面 1、确定闭合字符 ?id1 and 11 ?id1 and 12 ?id1 ?id1 and 11 -- ?id1 and 12 -- 确定闭合字符为单引号&#xff0c;并且正确页面与错误页面的显示不同 2、爆库名 使用python脚本 def inject_database1(url):name for i in range(1, 20):low 32high 1…

【大模型从入门到精通5】openAI API高级内容审核-1

这里写目录标题 高级内容审核利用 OpenAI 内容审核 API 的高级内容审核技术整合与实施使用自定义规则增强审核综合示例防止提示注入的策略使用分隔符隔离命令理解分隔符使用分隔符实现命令隔离 高级内容审核 利用 OpenAI 内容审核 API 的高级内容审核技术 OpenAI 内容审核 AP…

SQL注入漏洞复现1

一、靶场信息 sqli-labs下载&#xff1a;https://github.com/Audi-1/sqli-labs phpstudy下载地址&#xff1a;http://down.php.cn/PhpStudy20180211.zip 我是在本地安装小皮搭建环境&#xff0c;相比于在服务器上搭建环境&#xff0c;更加简单 二、注入实操 Less-1 爆库名…

搭建高可用OpenStack(Queen版)集群(三)之部署认证管理服务(Keystone)控制节点集群

一、搭建高可用OpenStack&#xff08;Queen版&#xff09;集群之部署认证服务&#xff08;Keystone&#xff09;控制节点集群 一、Identity 服务简介 1、Identity概述 Identity为认证管理&#xff0c;授权管理和服务目录服务管理提供单点整合。其它Openstack服务将身份认证服务…