目标检测数据预处理——部件截图,按一定比例进行外扩

news2025/1/20 6:01:50

本片是截图的篇的升级版本,简单版本的截图请参考根据目标框外扩一定比例进行截图(连带标签)。

对目标框(类别名称)进行分类,将同一类的目标框进行截图并分类保存在不同的文件夹中。

  1. 在本篇当中,我关注的是对人的不同部位的检测,所以我分为4类部件:头部区域(头、帽子、眼睛、眼睛……)、身体区域(各种工服)、手部区域(手、手套)、脚部区域(靴子、雨鞋、没穿鞋)。
  2. 而截图方式也是跟简单篇一样,保留截图区域内的目标框。
    特别说明,每类部件只会截部件范围的大图,例如头部区域内的眼睛、眼镜之类的不会单独截那么小的图,没有太多的意义,只会对头部帽子等的目标框进行截图,保留其内的眼睛、眼镜等。
  3. 这里相对于简单篇升级的不仅是从一类的截图升级到部件的截图,还有外扩范围也从上下左右外扩固定范围到根据图片大小按比例外扩。本篇的升级版是按随机比例外扩。
'''
cut 4 part in [head, body, hand, foot]
generate small pic of some rate extend
and generate corresponding json
'''
from copy import deepcopy
import cv2
import json
import os

img_path = "/data/weardata/images"
json_path = "/data/weardata/json"
save_path = "/data/weardata/save"
head_save = os.path.join(save_path, "head")
body_save = os.path.join(save_path, "body")
hand_save = os.path.join(save_path, "hand")
foot_save = os.path.join(save_path, "foot")

# 4部件分类
head_label = ["head", "hat", "workhat", "helmet"]
body_label = ["blueworkclothes", "cloth", "refvest", "apron", "whiteworkclothes"]
hand_label = ["glove", "inglove", "hand"]
foot_label = ["shoes", "inshoes", "noshoes"]

# 只需要创建好存放图片、json、截图后文件的三个路径即可,其余部件路径自己创建
save_path = [head_save, body_save, hand_save, foot_save]
for s_p in save_path:
    if not os.path.exists(s_p):
        os.mkdir(s_p)

def cut_part(json_data, part_label, save_path, img_file, img_h, img_w, x_e, y_e):
    i = 0
    for shape in json_data["shapes"]:
        [x_extend, y_extend] = [x_e, y_e]
        json_data_1 = deepcopy(json_data)
        if shape["label"] in part_label:
            img_save = os.path.join(save_path, os.path.splitext(os.path.split(img_file)[-1])[0] + ".jpg")
            json_save = save_path + "/" + file
            if os.path.exists(json_save):
                json_save = save_path + "/" + str(i) + file
                img_save = save_path + "/" + str(i) + os.path.splitext(os.path.split(img_file)[-1])[0] + ".jpg"
                json_data_1["imagePath"] = str(i) + os.path.splitext(os.path.split(img_file)[-1])[0] + ".jpg"
                i += 1
            print("-----------------------------")
            p = shape["points"]
            print(p)
            print(x_extend, y_extend)
            x_extend = int(abs(p[1][0] - p[0][0]) * x_e)
            y_extend = int(abs(p[1][1] - p[0][1]) * y_e)
            print(x_extend, y_extend)
            x1 = int(min(p[0][0], p[1][0])) - x_extend
            y1 = int(min(p[0][1], p[1][1])) - y_extend
            x2 = int(max(p[0][0], p[1][0])) + x_extend
            y2 = int(max(p[0][1], p[1][1])) + y_extend
            # 判断截图是否超过范围
            if x1 < 0:
                x1 = 0
            if y1 < 0:
                y1 = 0
            if x2 > img_w:
                x2 = img_w
            if y2 > img_h:
                y2 = img_h
            print(x1, y1, x2, y2, p[0][0], p[0][1], p[1][0], p[1][1])
            print("-----------------------------")
            inpart_label = []
            for shape1 in json_data_1["shapes"]:
                m_p = shape1["points"]
                m_x1 = int(min(m_p[0][0], m_p[1][0]))
                m_y1 = int(min(m_p[0][1], m_p[1][1]))
                m_x2 = int(max(m_p[0][0], m_p[1][0]))
                m_y2 = int(max(m_p[0][1], m_p[1][1]))
                m_p[0][0] = m_x1
                m_p[0][1] = m_y1
                m_p[1][0] = m_x2
                m_p[1][1] = m_y2

                # 过滤哪些目标框留住
                if shape1["label"] == "other" and ((x1 < m_x1 < x2 or x1 < m_x2 < x2)\
                    and (y1 < m_y1 < y2 or y1 < m_y2 < y2)):
                    inpart_label.append(shape1)
                if x1 < (m_x1 + m_x2)/2 < x2 and y1 < (m_y1 + m_y2)/2 <y2:
                    if part_label == hand_label:
                        if shape1["label"] in hand_label:
                            inpart_label.append(shape1)
                    else:
                        inpart_label.append(shape1)
                else:
                    continue
                # print(m_x1, m_y1, m_x2, m_y2)
            img = cv2.imread(img_file)
            try:
                img = img[y1:y2, x1:x2, :]
            except TypeError:
                print(img_file, shape["label"])
                input()
            json_data_1["shapes"] = []
            for p_label in inpart_label:
                m_p = p_label["points"]
                m_p[0][0] = m_p[0][0] - x1
                m_p[0][1] = m_p[0][1] - y1
                m_p[1][0] = m_p[1][0] - x1
                m_p[1][1] = m_p[1][1] - y1
                # 判断目标框是否超出范围
                if m_p[0][0] < 0:
                    m_p[0][0] = 0
                if m_p[0][1] < 0:
                    m_p[0][1] = 0
                if m_p[1][0] > x2 - x1:
                    m_p[1][0] = x2 - x1
                if m_p[1][1] > y2 - y1:
                    m_p[1][1] = y2 - y1
                json_data_1["shapes"].append(p_label)
            json_data_1["imageHeight"] = y2 - y1
            json_data_1["imageWidth"] = x2 -x1
            json.dump(json_data_1, open(json_save, "w"), ensure_ascii=False, indent=2)
            cv2.imwrite(img_save, img)

files = os.listdir(json_path)
for file in files:
    if os.path.splitext(file)[-1] != ".json":
        continue
    
    # 指定各种图片格式,若还有别的格式的图片可以自己添加
    img_file = os.path.join(img_path, file.split(".json")[0] + ".jpg")
    if not os.path.exists(img_file):
        img_file = os.path.join(img_path, file.split(".json")[0] + ".png")
        if not os.path.exists(img_file):
            img_file = os.path.join(img_path, file.split(".json")[0] + ".jpeg")
    json_file = os.path.join(json_path, file)
    json_data = json.load(open(json_file))
    img_h = json_data["imageHeight"]
    img_w = json_data["imageWidth"]

    # 根据一定的比例进行外扩
    cut_part(json_data, head_label, head_save, img_file, img_h, img_w, 0.3, 0.2) # head
    cut_part(json_data, body_label, body_save, img_file, img_h, img_w, 0.25, 0.05) # body
    cut_part(json_data, hand_label, hand_save, img_file, img_h, img_w, 0.3, 0.2) # hand
    cut_part(json_data, foot_label, foot_save, img_file, img_h, img_w, 0.2, 0.2) # foot
  1. 这里的外扩比例是左右一个比例,上下一个比例,可以自己调。比如我的body部件的区域比较长,所以上下的比例会比较小。
  2. 截图后保留的目标框有以下两个过滤条件:
    a.中心点没有落入截图区域内不留(没有超过一般),除了“other”标签(特征有歧义的涂黑标签);
    b.手部区域的非本类部件的类别不留。因为手部区域很大概率在body区域之内,中心点很可能落入其中,若是把body的框保留再根据目标框不超过截图范围,则整个截图的范围都是body框,但手部区域相对body区域小很多所以保留的body框的特征基本上全被破坏。
  3. 这里有两处范围判断:一处是截图时截图范围不能超过原图范围;二是目标框范围不能超过截图范围。都是超过最大按最大、低于最小按最小的方式处理。

截图前:

第1张图片有head、hand、foot这三个部件的目标框。
在这里插入图片描述
第2张图片有head、hand、body这三个部件的目标框。
在这里插入图片描述

截图后:

自己生成4个部件的保存路径。在这里插入图片描述

1.搜索第1张图的截图效果

1)搜索第1张图内的head区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

2)搜索第1张图内的hand区域

a.截取的图片:
在这里插入图片描述

b.选取其中一张labelme打开:
在这里插入图片描述

3)搜索第1张图内的foot区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

2.搜索第2张图的截图效果

1)搜索第2张图内的head区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

2)搜索第2张图内的body区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

3)搜索第2张图内的hand区域

a.截取的图片:
在这里插入图片描述
b.选取其中一张labelme打开:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/554245.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Vue3中响应式Reactive的独特之处:它在哪些场景下胜出Ref?

✅创作者&#xff1a;陈书予 &#x1f389;个人主页&#xff1a;陈书予的个人主页 &#x1f341;陈书予的个人社区&#xff0c;欢迎你的加入: 陈书予的社区 &#x1f31f;专栏地址: 三十天精通 Vue 3 文章目录 一、Vue 3中响应式Reactive的独特之处1.1 引言1.2 Vue 3中的响应式…

算法leetcode|51. N 皇后(rust重拳出击)

文章目录 51. N 皇后&#xff1a;样例 1&#xff1a;样例 2&#xff1a;提示&#xff1a; 分析&#xff1a;题解&#xff1a;rust&#xff1a;go&#xff1a;c&#xff1a;python&#xff1a;java&#xff1a; 51. N 皇后&#xff1a; 按照国际象棋的规则&#xff0c;皇后可以…

详解c++STL—STL常用算法

目录 1、常用遍历算法 1.1、for_each 1.2、transform 2、常用查找算法 2.1、find 2.2、find_if 2.3、adjacent_find 2.4、binary_search 2.5、count 2.6、count_if 3、常用排序算法 3.1、sort 3.2、random_shuffle 3.3、merge 3.4、reverse 4、常用拷贝和替换算…

在MyBatis XML文件中处理特殊符号的方法,如“>”、“<”、“>=”、“<=”这些符号XML会报错如何处理

前言 在MyBatis的XML映射文件中&#xff0c;我们经常需要使用特殊符号&#xff0c;比如"大于"、"小于"、"大于等于"、"小于等于"等比较操作符。然而&#xff0c;这些符号在XML中具有特殊的含义&#xff0c;因此需要进行特殊处理&…

nginx缓存及rsync远程访问控制

nginx缓存功能 http{ proxy_cache_path /data/nginx/cache/levels1:2 keys_zonemy_cache:10m max_size10g inactive60m use_temp_pathoff; path强制参数&#xff0c;指定缓存文件的存放路径。 levels: 定义了缓存目录的层级。每层可以用1(最多16种选择&#xff0c;0-f)或2(最…

2023年认证杯SPSSPRO杯数学建模A题(第一阶段)碳板跑鞋全过程文档及程序

2023年认证杯SPSSPRO杯数学建模 A题 碳板跑鞋 原题再现&#xff1a; 在专业运动鞋上使用的碳板&#xff0c;也可被称为碳纤维增强环氧树脂材料&#xff0c;事实上是将碳纤维织成布&#xff0c;再浸入环氧树脂固化后形成的板材。它以较轻的重量达到了相当好的弹性和刚度。在上…

【jvm系列-13】jvm性能调优篇---参数设置以及日志分析

JVM系列整体栏目 内容链接地址【一】初识虚拟机与java虚拟机https://blog.csdn.net/zhenghuishengq/article/details/129544460【二】jvm的类加载子系统以及jclasslib的基本使用https://blog.csdn.net/zhenghuishengq/article/details/129610963【三】运行时私有区域之虚拟机栈…

【腾讯云FinOps Crane 集训营】让我看看还有谁没用过crane这个降本利器

近几年云原生概念的发展如雨后春笋&#xff0c;势如破竹&#xff0c;而devops和k8s(Kubernetes)两兄弟也搭上云原生的车先后火了起来 devops&#xff1a;如字面意思Development&Operations&#xff0c;它的理念是开发即运维&#xff0c;目的是消除开发者们与运维之间的隔阂…

OpenCV:从 CMake 产生 VS2019 项目和解决方案

CMake 是一个跨平台的自动化编译程序&#xff0c;它用于管理代码的构建过程。使用 CMake 可以简化跨平台项目的构建和移植&#xff0c;提供简单而强大的语法来描述构建过程&#xff0c;并生成多种不同的构建系统&#xff0c;如 GNU Make、Ninja 和 Visual Studio。因为 CMake 具…

shell编程(编写、执行,shell变量、传参、字符串、运算符使用)

来认识一下吧 Shell 是一个用 C 语言编写的程序&#xff0c;通过 Shell 用户可以访问操作系统内核服务。 Shell 既是一种命令语言&#xff0c;又是一种程序设计语言。 Shell script 是一种为 shell 编写的脚本程序。Shell 编程一般指 shell 脚本编程&#xff0c;不是指开发 she…

Python实现ACO蚁群优化算法优化卷积神经网络回归模型(CNN回归算法)项目实战

说明&#xff1a;这是一个机器学习实战项目&#xff08;附带数据代码文档视频讲解&#xff09;&#xff0c;如需数据代码文档视频讲解可以直接到文章最后获取。 1.项目背景 蚁群优化算法(Ant Colony Optimization, ACO)是一种源于大自然生物世界的新的仿生进化算法&#xff0c…

快速部署一套K8s集群-参考阿良老师

1、前置知识点 1.1 生产环境可部署Kubernetes集群的两种方式 目前生产部署Kubernetes集群主要有两种方式&#xff1a; kubeadm Kubeadm是一个K8s部署工具&#xff0c;提供kubeadm init和kubeadm join&#xff0c;用于快速部署Kubernetes集群。 二进制包 从github下载发行…

节省维护成本,提高效率!接口自动化测试框架热加载技术解析

目录 一、简介 二、实现热加载技术的具体操作 1. 借助Java类加载器实现热加载 2. 应用热加载技术动态更新代码 三、封装热加载技术 四、总结 前言 现如今&#xff0c;接口自动化测试已经成为了软件开发过程中不可或缺的一部分&#xff0c;通过使用接口自动化框架可以在效…

cpp 类成员函数delete this 会发生什么?

如题 this 简介: 每个非静态的类成员函数默认参数都会压栈一个this&#xff0c;它指向的是调用改成员函数的对象, 也是就className的object this 被隐含声明为 className* const this&#xff1b; 1.意味着不能改变this的指向2.this是个右值,不能取地址 ,不能&this 那我…

vue实现用户动态权限登录

一、使用vueelementUI搭登录框架&#xff0c;主要就是1、2、3、4 配置&#xff1a; ①vue.config.js use strict const path require(path)function resolve(dir) {return path.join(__dirname, dir) }// All configuration item explanations can be find in https://cli.v…

想自学写个操作系统,有哪些推荐看的书籍?

前言 哈喽&#xff0c;我是子牙&#xff0c;一个很卷的硬核男人。喜欢研究底层&#xff0c;聚焦做那些大家想学没地方学的课程&#xff1a;手写操作系统、手写虚拟机、手写编程语言… 今天我们将站在一个自学者的角度来聊聊如何实现自己的操作系统。并为大家推荐几本能够帮助你…

Ubuntu20.04配置静态IP地址,开启远程连接

本文操作演示为windows系统使用虚拟机安装的ubuntu系统进行&#xff1a;操作系统为ubuntu20.04&#xff0c;VMware15.5.0 build-14665864&#xff0c;内容分为两部分&#xff0c;第一部分为配置ubuntu系统的静态ip地址&#xff0c;第二部分内容为修改配置开启远程连接功能 一、…

第16章_变量、流程控制与游标

第16章_变量、流程控制与游标 1. 变量 在MySQL数据库的存储过程和函数中&#xff0c;可以使用变量来存储查询或计算的中间结果数据&#xff0c;或者输出最终的结果数据。 在 MySQL 数据库中&#xff0c;变量分为系统变量以及用户自定义变量。 1.1 系统变量 1.1.1 系统变量分…

Ansys Lumerical | 对铁电波导调制器进行仿真应用

说明 在本例中&#xff0c;我们仿真了使用BaTiO2的铁电波导调制器&#xff0c;BaTiO2是一种折射率因外加电场而发生变化的材料。该器件的结构基于文献[1]。我们模拟并分析了给定工作频率下波导调制器的有效折射率与电压的关系。 背景 铁电波导由硅层和玻璃衬底上的BiTiO3&#…

《实战大数据》书评

前言 首先感谢 CSDN 社区图书馆 举办的“图书活动第四期”&#xff0c;让我获得了“《实战大数据——分布式大数据分析处理系统开发与应用》”这本书。收到此书之后&#xff0c;对里面的内容非常感兴趣&#xff0c;同时也充满的未知的期待。 当今时代&#xff0c;物联网、大数据…