「Pytorch」roLabelImg 图像异常旋转 bug

news2026/2/11 19:05:12

在进行Yolo-obb 模型训练的时候需要标注旋转框，roLabelImg 是比较推荐的一款旋转框标注工具，既可以标注正常的矩形框，还可以标注旋转框

roLabelImg Github 地址：https://github.com/HumanSignal/labelImg

但是在使用过程中遇到了一个比较难搞的bug。对于手机等拍摄的图像，除了图像内容还会保存很多其他信息，比如下图的旋转，采用不同的方式打开，效果是不一样的，使用常规的图像查看就是正常的，但是使用 roLabelImg 打开就会发现逆时针旋转 90度。由于roLabelImg 开发较早，目测好像没人维护了，bug也没人解决了，对于项目比较急的小伙伴，可以采用本文临时救急使用，后续有时间再修复bug

在这里插入图片描述

原因

先说下造成这种情况的原因。通过 roLabelImg.py 文件可以看出，roLabelImg 在读取图片的时候是先通过read 函数，将图像以二进制的形式读取所有内容，然后再 QImage.fromData 将像素信息提取出来，但是 QImage 读取的时候会根据图片的头信息结合旋转显示，而Yolo-obb模型读取数据的时候直接采用 opencv 的形式将图片读取出来，出入就此产生

def read(filename, default=None):
    try:
        with open(filename, 'rb') as f:
            return f.read()
    except:
        return default

在这里插入图片描述

解决办法

由于比赛时间紧迫，因此当时我们采用的解决方案是，将所有的图片重置一遍，简单点将就是使用 opencv 将图片读取之后，再将所有的像素内容保存一遍，从而去除掉图片中的头信息，在此推荐使用cv2.imdecode 进行读取，不受限于操作系统和中英文路径，而cv2.imread在windows系统下如果路径中有中文，则会跳过且不报错（又是一把辛酸泪(灬ꈍ ꈍ灬)），可以参考我的这篇博客查看细节cv2.imdecode & cv2.imread 的区别

import cv2
import numpy as np


image_data = np.fromfile(pred_image_path, dtype=np.uint8)	# 从文件中读取图像数据
image = cv2.imdecode(image_data, cv2.IMREAD_COLOR)			# 使用cv2.imdecode()解码图像数据

# 简写
image = cv2.imdecode(np.fromfile(pred_image_path, dtype=np.uint8), cv2.IMREAD_COLOR)	# 支持中文，与cv2.imread 读取一致