完美解决labelimg xml转可视化中文乱码问题,不用matplotlib

news2024/10/5 16:21:24

背景简述

我们有一批标注项目要转可视化,因为之前没有做过,然后网上随意找了一段代码测试完美(并没有)搞定,开始疯狂标注,当真正要转的时候傻眼了,因为测试的时候用的是英文标签,实际标注的是中文标签,结果都是一大堆??????,在这里插入图片描述
结果瞬间让我满脑袋??????,赶紧找资料解决,各种方法试了个遍,网上大多数都是用cv2+matplotlib实现的计算和渲染,所以解决的主要思想就是集中在各种显示的设置matplotlib字体,然并卵;最后找到一种另辟蹊径的办法使用PIL+cv2实现,最后完美解决,在这里插入图片描述
贴上解决代码:

import cv2
import os
import numpy as np  
from PIL import Image, ImageDraw, ImageFont
import xml.etree.ElementTree as ET

data_path = 'E:\\test\\tianjingulou'
imgs_path = os.path.join(data_path, "img")
anns_path = os.path.join(data_path, "xml")
result_path = os.path.join(data_path)

img_names = set([os.path.splitext(i)[0] for i in os.listdir(imgs_path)])
ann_names = set([os.path.splitext(i)[0] for i in os.listdir(anns_path)])
img_names = list(img_names)
ann_names = list(ann_names)

for i in range(len(img_names)):
    img_path = os.path.join(imgs_path, img_names[i] + ".jpg")
    img_bgr = cv2.imread(img_path)

    xml_path = os.path.join(anns_path, ann_names[i] + ".xml")

    xml_inf = open(xml_path, encoding='utf-8')
    tree = ET.parse(xml_inf)
    root = tree.getroot()

    bbox_color = (0, 129, 255)
    bbox_thickness = 2
    # 把rgb转成16进制'#0081FF'
    bbox_color_str = "#{:02x}{:02x}{:02x}".format(*bbox_color)

    # 把rgb转成bgr再转16进制'#FF8100'
    # bbox_color_rgb = bbox_color[::-1]
    # bbox_color_str = "#{:02x}{:02x}{:02x}".format(*bbox_color_rgb)

    bbox_labelstr = {
        'font_size': 16,
        'font_thickness': 2,
        'offset_x': 0,
        'offset_y': -20,
    }

    # 创建一个空白图像
    img_pil = Image.fromarray(cv2.cvtColor(img_bgr, cv2.COLOR_BGR2RGB))
    draw = ImageDraw.Draw(img_pil)

    # 设置字体  SimHei.ttf黑体,msyh.ttf微软雅黑
    # 打开命令行窗口或者Anaconda Prompt,输入python,进入python解释器窗口,
    #   输入import matplotlib;引入可视化库;
    #   然后输入print(matplotlib.matplotlib_fname())打印出当前库所在位置;
    #   进入到上面打印出的路径下字体目录:mpl-data\\fonts\\ttf,下载中文字体放进去
    font_path = "D:\\ProgramData\\anaconda3\\Lib\\site-packages\\matplotlib\\mpl-data\\fonts\\ttf\\msyh.ttf"  # 请替换为实际路径
    font = ImageFont.truetype(font_path, bbox_labelstr['font_size'])

    # 画框和文字
    for obj in root.iter('object'):
        bbox_label = obj.find('name').text
        bbox_top_left_x = int(obj.find('bndbox').find('xmin').text)
        bbox_top_left_y = int(obj.find('bndbox').find('ymin').text)
        bbox_bottom_right_x = int(obj.find('bndbox').find('xmax').text)
        bbox_bottom_right_y = int(obj.find('bndbox').find('ymax').text)

        draw.rectangle([(bbox_top_left_x, bbox_top_left_y), (bbox_bottom_right_x, bbox_bottom_right_y)],
                       outline=bbox_color, width=bbox_thickness)

        draw.text((bbox_top_left_x + bbox_labelstr['offset_x'], bbox_top_left_y + bbox_labelstr['offset_y']),
                  bbox_label, font=font, fill=bbox_color_str)

    img_bgr = cv2.cvtColor(np.array(img_pil), cv2.COLOR_RGB2BGR)

    # 保存图像
    cv2.imwrite(result_path + "\\{}.jpg".format(img_names[i]), img_bgr)

下面是matplotlib+cv2版代码

# 数据集可视化
import cv2
import os
import matplotlib.pyplot as plt
import xml.etree.ElementTree as ET

# 设置 Matplotlib 使用的字体为黑体
plt.rcParams['font.sans-serif'] = ['SimHei']
plt.rcParams['axes.unicode_minus'] = False 

imgs_path = 'E:\\test\\tianjingulou\\img'
anns_path = 'E:\\test\\tianjingulou\\xml'
 
img_names = set([os.path.splitext(i)[0] for i in os.listdir(imgs_path)])
ann_names = set([os.path.splitext(i)[0] for i in os.listdir(anns_path)])
img_names = list(img_names)
ann_names = list(ann_names)

for i in range(len(img_names)):
    img_path = os.path.join(imgs_path, img_names[i] + ".jpg")
    img_bgr = cv2.imread(img_path)
 
    xml_path = os.path.join(anns_path, ann_names[i] + ".xml")
 
    xml_inf = open(xml_path, encoding='utf-8')
    tree = ET.parse(xml_inf)
    root = tree.getroot()
 
# 框可视化配置
    bbox_color = (255, 129, 0)  # 框的颜色
    bbox_thickness = 2  # 框的线宽
 
# 框类别文字
    bbox_labelstr = {
        'font_size': 1,  # 字体大小
        'font_thickness': 2,  # 字体粗细
        'offset_x': 0,  # X 方向,文字偏移距离,向右为正
        'offset_y': -10,  # Y 方向,文字偏移距离,向下为正
    }
# 画框
    for obj in root.iter('object'):  # 一个object代表一个标注物体
 
        # 框的类别
        bbox_label = obj.find('name').text
 
        # 框的两点坐标
        # 左上角坐标
        bbox_top_left_x = int(obj.find('bndbox').find('xmin').text)
        bbox_top_left_y = int(obj.find('bndbox').find('ymin').text)
        # 右下角坐标
        bbox_bottom_right_x = int(obj.find('bndbox').find('xmax').text)
        bbox_bottom_right_y = int(obj.find('bndbox').find('ymax').text)
 
        # 画矩形:画框
        img_bgr = cv2.rectangle(img_bgr, (bbox_top_left_x, bbox_top_left_y), (bbox_bottom_right_x, bbox_bottom_right_y),
                            bbox_color, bbox_thickness)

        # 写框类别文字:图片,文字字符串,文字左上角坐标,字体,字体大小,颜色,字体粗细
        img_bgr = cv2.putText(img_bgr, bbox_label, (
            bbox_top_left_x + bbox_labelstr['offset_x'],
            bbox_top_left_y + bbox_labelstr['offset_y']),
                          cv2.FONT_HERSHEY_SIMPLEX, bbox_labelstr['font_size'], bbox_color,
                          bbox_labelstr['font_thickness'])
 
    cv2.imwrite("E:\\test\\tianjingulou\\{}.jpg".format(img_names[i]), img_bgr)

写在最后,matplotlib的方式应该也有解决的办法,也可能是我的环境问题,提供这两种方式大家各取所需,下面这种方式是我从一位博主那里拷贝来稍加改动的,但是我找不到出处了,如有侵权请联系我删除。

----------------------------------------------华丽分割-------------------------------------------------
追加一种类似的写法,这个是宋体,字体可以酌情替换,亲测可用

import cv2
import os
import matplotlib.pyplot as plt
import xml.etree.ElementTree as ET
import numpy as np


# 导入 PIL 库
import PIL.Image
import PIL.ImageDraw
import PIL.ImageFont


data_path = os.path.join("E:\\test\\tianjingulou")
imgs_path = os.path.join(data_path, "img")
anns_path = os.path.join(data_path, "xml")

# 获取图像名称和标注名称
img_names = set(os.path.splitext(i)[0] for i in os.listdir(imgs_path))
ann_names = set(os.path.splitext(i)[0] for i in os.listdir(anns_path))
img_names = list(img_names)
ann_names = list(ann_names)

# 遍历所有图像
for i, img_name in enumerate(img_names):

    # 读取图像
    img_bgr = cv2.imread(os.path.join(imgs_path, img_name + ".jpg"))

    # 读取标注
    xml_path = os.path.join(anns_path, img_name + ".xml")
    xml_inf = open(xml_path, encoding='utf-8')
    tree = ET.parse(xml_inf)
    root = tree.getroot()

    # 画框
    for obj in root.iter('object'):

        # 获取框的类别
        bbox_label = obj.find('name').text

        # 获取框的两点坐标
        bbox_top_left_x = int(obj.find('bndbox').find('xmin').text)
        bbox_top_left_y = int(obj.find('bndbox').find('ymin').text)
        bbox_bottom_right_x = int(obj.find('bndbox').find('xmax').text)
        bbox_bottom_right_y = int(obj.find('bndbox').find('ymax').text)

        # 画矩形
        img_bgr = cv2.rectangle(img_bgr, (bbox_top_left_x, bbox_top_left_y), (bbox_bottom_right_x, bbox_bottom_right_y),
                               (255, 129, 0), 2)

        # 写框类别文字
        # 转换为 PIL 图像
        img_pil = PIL.Image.fromarray(img_bgr)

        # 使用 PIL 绘制文本
        font = PIL.ImageFont.truetype("simsun.ttc", 16)
        draw = PIL.ImageDraw.Draw(img_pil)
        draw.text((bbox_top_left_x, bbox_top_left_y - 18), bbox_label, font=font, fill=(255, 129, 0))

        # 直接使用 PIL 图像
        img_bgr = np.array(img_pil)

    # 保存图像
    cv2.imwrite(data_path + "\\{}.jpg".format(img_name), img_bgr)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1317556.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Sci. Rep. | 一个对任意分子体系实现准确且高效几何深度学习的通用框架

这篇工作是来自纽约城市大学/康奈尔医学院谢磊团队的一篇论文。作者提出了一个通用框架,PAMNet,可以对任意分子体系实现准确且高效的几何深度学习。在小分子性质、RNA三维结构以及蛋白质-配体结合亲和力的预测任务上,PAMNet在准确性和效率方面…

网络编程-认识套接字socket

文章目录 套接字概念端口号网络字节序 套接字类型流套接字数据报套接字 socket常见APIsocket函数bind函数listen函数accept函数connect函数sockaddr结构 套接字概念 socket套接字是进程之间一种通信机制,通过套接字可以在不同进程之间进行数据交流。在TCP/UDP中&…

将html的radio单选框自定义样式为正方形和对号

将html的radio单选框自定义样式为正方形和对号 背景&#xff1a; 如何能把html的<input type"radio" name"option">改成自定义的样式呢&#xff1f;比如想要把他变成正方形&#xff0c;选中的时候是对号。默认的样式太丑了 默认样式&#xff1a; 自…

[数学]三角形的五心之内心

三角形内心的性质 三角形内切圆的圆心称为三角形的内心。内心也是三角形三个角的角平分线的交点 性质1 1.1 设 I I I为 △ A B C △ABC △ABC内一点&#xff0c;则 I I I为 △ A B C △ABC △ABC内心的充要条件是下列条件之一&#xff1a; 1.1.1 I I I到 △ A B C △ABC △…

【C语言】RDMACM、Verbs API与epoll一起使用的示例

一、epoll介绍 epoll是Linux内核为处理大批量文件描述符而作了改进的poll&#xff0c;是Linux下多路复用IO接口select/poll的增强版本&#xff0c;它能显著提高程序在大量并发连接中只有少量活跃的情况下的系统CPU利用率。 以下是epoll的主要使用方法和优点&#xff1a; epo…

代码随想录刷题题Day15

刷题的第十五天&#xff0c;希望自己能够不断坚持下去&#xff0c;迎来蜕变。&#x1f600;&#x1f600;&#x1f600; 刷题语言&#xff1a;C Day15 任务 ● 513.找树左下角的值 ● 112. 路径总和 113.路径总和ii ● 106.从中序与后序遍历序列构造二叉树 105.从前序与中序遍历…

整理了上百个开源中文大语言模型,涵盖模型、应用、数据集、微调、部署、评测

自ChatGPT为代表的大语言模型&#xff08;Large Language Model, LLM&#xff09;出现以后&#xff0c;由于其惊人的类通用人工智能&#xff08;AGI&#xff09;的能力&#xff0c;掀起了新一轮自然语言处理领域的研究和应用的浪潮。 尤其是以ChatGLM、LLaMA等平民玩家都能跑起…

广州华锐互动:汽车电子线束加工VR仿真培训与实际生产场景相结合,提高培训效果

随着科技的不断发展&#xff0c;虚拟现实&#xff08;VR&#xff09;技术已经逐渐渗透到各个领域&#xff0c;为企业和个人带来了前所未有的便利。在汽车制造行业中&#xff0c;线束加工作为一项关键的生产工艺&#xff0c;其质量直接影响到汽车的性能和安全。因此&#xff0c;…

LCR 181. 字符串中的单词反转

解题思路&#xff1a; class Solution {public String reverseMessage(String message) {message message.trim(); // 删除首尾空格int j message.length() - 1, i j;StringBuilder res new StringBuilder();while (i > 0) {while (i >…

局域网环境下的ntp对时

服务端&#xff1a; 此处为v4-sp4服务器 安装ntp&#xff0c;apt-get install ntp -y ,若为离线环境&#xff0c;则安装ntp和libopts25两个包。 配置&#xff1a; 在/etc/ntp.conf的配置文件里 加入 restrict default nomodify notrap noquery restrict 127.0.0.1 rest…

时序预测 | Python实现GRU-XGBoost组合模型电力需求预测

时序预测 | Python实现GRU-XGBoost组合模型电力需求预测 目录 时序预测 | Python实现GRU-XGBoost组合模型电力需求预测预测效果基本描述程序设计参考资料预测效果 基本描述 该数据集因其每小时的用电量数据以及 TSO 对消耗和定价的相应预测而值得注意,从而可以将预期预测与当前…

【IDEA】关于快捷键行注释时会从行首开始注释

前言 每次在使用IDEA写代码时&#xff0c;用快捷键进行行注释的时候&#xff0c;//会处于行首位置 但是我们想要的是这种注释效果 修改 IDEA中打开settings 找到Editor - Code Style- Java - 找到Code Genneration&#xff0c;取消勾选Line comment at first column&#x…

如何批量获取CSDN文章数据并进行持久化

自己去看文章数据的话&#xff0c;比较慢&#xff0c;所以一直想通过程序来批量获取CSDN的文章数据&#xff0c;最近研究了一下&#xff0c;发现还是挺简单的&#xff0c;能够直接通过解析json来获取文章数据&#xff0c;跟大家分享一下。 文章目录 一、步骤1、首先我们到自己的…

VUE学习三、前端项目部署

1.前端项目打包 执行命令 npm run build:prod正常命令结束 , 会在前端项目里面出现dist文件夹 2.nginx下载安装 nginx下载 : http://nginx.org/en/download.html Windows 下载版本 Mainline version&#xff1a;Mainline 是 Nginx 目前主力在做的版本&#xff0c;可以说…

【手撕算法系列】BN

BN的计算公式 BN中均值与方差的计算 所以对于输入x: b,c,h,w 则 mean: 1,c,1,1var: 1,c,1,1代码 class BatchNorm(nn.Module):def __init__(self, num_features, num_dims):# num_features&#xff1a;完全连接层的输出数量或卷积层的输出通道数。# num_dims&#xff1a;2表示…

【JavaEE】多线程(4) -- 单例模式

目录 什么是设计模式? 1.饿汉模式 2.懒汉模式 线程安全问题 什么是设计模式? 设计模式好⽐象棋中的 "棋谱". 红⽅当头炮, ⿊⽅⻢来跳. 针对红⽅的⼀些⾛法, ⿊⽅应招的时候有⼀ 些固定的套路. 按照套路来⾛局势就不会吃亏. 软件开发中也有很多常⻅的 "问题…

接口优先于反射机制

在Java中&#xff0c;使用接口通常比反射机制更为优雅和安全。接口提供了一种声明性的方式来定义类的契约&#xff0c;并且能够在编译时进行类型检查&#xff0c;而反射则是在运行时动态获取和操作类的信息。下面是一个简单的例子&#xff0c;说明为什么在某些情况下接口比反射…

基于Java SSM框架实现体育竞赛运动会成绩裁判管系统项目【项目源码+论文说明】计算机毕业设计

基于java的SSM框架实现体育竞赛运动会成绩裁判管系统演示 摘要 体育竞赛是各种体育体育项目比赛的总称。是在裁判员的主持下&#xff0c;按统一的规则要求&#xff0c;组织与实施的体育员个体或体育队之间的竞技较量&#xff0c;是竞技体育与社会发生关联&#xff0c;并作用于…

鼠标点击展开详情

网页部分&#xff1a; HTML部分&#xff1a; <body><br><div id"nav"><div id"dang"></div><ul id"aaa"><li class"a1"><img src"img/U011.jpg" width"195" heig…

7+PPI+机器学习+实验,非肿瘤结合建模筛选生物标志物,可升级

今天给同学们分享一篇生信文章“Identification of diagnostic biomarkers and therapeutic targets in peripheral immune landscape from coronary artery disease”&#xff0c;这篇文章发表在J Transl Med期刊上&#xff0c;影响因子为7.4。 结果解读&#xff1a; 外周血中…