Python过滤掉特定区域内的矩形框

news2025/1/3 0:54:33

Python过滤掉特定区域内的矩形框

  • 前言
  • 前提条件
  • 相关介绍
  • 实验环境
  • 过滤掉特定区域内的矩形框
    • 方法一:直接法(for循环遍历)
      • 代码实现
      • 输出结果
    • 方法二:列表推导式
      • 代码实现
      • 输出结果

在这里插入图片描述

前言

  • 由于本人水平有限,难免出现错漏,敬请批评改正。
  • 更多精彩内容,可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
  • YOLOv8 Ultralytics:使用Ultralytics框架训练RT-DETR实时目标检测模型
  • 基于DETR的人脸伪装检测
  • YOLOv7训练自己的数据集(口罩检测)
  • YOLOv8训练自己的数据集(足球检测)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
  • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
  • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
  • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
  • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目

前提条件

  • 熟悉Python

相关介绍

  • Python是一种跨平台的计算机程序设计语言。是一个高层次的结合了解释性、编译性、互动性和面向对象的脚本语言。最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越多被用于独立的、大型项目的开发。
  • PyTorch 是一个深度学习框架,封装好了很多网络和深度学习相关的工具方便我们调用,而不用我们一个个去单独写了。它分为 CPU 和 GPU 版本,其他框架还有 TensorFlow、Caffe 等。PyTorch 是由 Facebook 人工智能研究院(FAIR)基于 Torch 推出的,它是一个基于 Python 的可续计算包,提供两个高级功能:1、具有强大的 GPU 加速的张量计算(如 NumPy);2、构建深度神经网络时的自动微分机制。
  • YOLOv5是一种单阶段目标检测算法,该算法在YOLOv4的基础上添加了一些新的改进思路,使其速度与精度都得到了极大的性能提升。它是一个在COCO数据集上预训练的物体检测架构和模型系列,代表了Ultralytics对未来视觉AI方法的开源研究,其中包含了经过数千小时的研究和开发而形成的经验教训和最佳实践。
  • Labelme是一款图像标注工具,由麻省理工(MIT)的计算机科学和人工智能实验室(CSAIL)研发。它是用Python和PyQT编写的,开源且免费。Labelme支持Windows、Linux和Mac等操作系统。
  • 这款工具提供了直观的图形界面,允许用户在图像上标注多种类型的目标,例如矩形框、多边形、线条等,甚至包括更复杂的形状。标注结果以JSON格式保存,便于后续处理和分析。这些标注信息可以用于目标检测、图像分割、图像分类等任务。
  • 总的来说,Labelme是一款强大且易用的图像标注工具,可以满足不同的图像处理需求。
  • Labelme标注json文件是一种用于存储标注信息的文件格式,它包含了以下几个主要的字段:
    • version: Labelme的版本号,例如"4.5.6"。
    • flags: 一些全局的标志,例如是否是分割任务,是否有多边形,等等。
    • shapes: 一个列表,每个元素是一个字典,表示一个标注对象。每个字典包含了以下几个字段:
      • label: 标注对象的类别名称,例如"dog"。
      • points: 一个列表,每个元素是一个坐标对,表示标注对象的边界点,例如[[10, 20], [30, 40]]。
      • group_id: 标注对象的分组编号,用于表示属于同一组的对象,例如1。
      • shape_type: 标注对象的形状类型,例如"polygon",“rectangle”,“circle”,等等。
      • flags: 一些针对该标注对象的标志,例如是否是难例,是否被遮挡,等等。
    • lineColor: 标注对象的边界线颜色,例如[0, 255, 0, 128]。
    • fillColor: 标注对象的填充颜色,例如[255, 0, 0, 128]。
    • imagePath: 图像文件的相对路径,例如"img_001.jpg"。
    • imageData: 图像文件的二进制数据,经过base64编码后的字符串,例如"iVBORw0KGgoAAAANSUhEUgAA…"。
    • imageHeight: 图像的高度,例如600。
    • imageWidth: 图像的宽度,例如800。

以下是一个Labelme标注json文件的示例:

{
  "version": "4.5.6",
  "flags": {},
  "shapes": [
    {
      "label": "dog",
      "points": [
        [
          121.0,
          233.0
        ],
        [
          223.0,
          232.0
        ],
        [
          246.0,
          334.0
        ],
        [
          121.0,
          337.0
        ]
      ],
      "group_id": null,
      "shape_type": "polygon",
      "flags": {}
    }
  ],
  "lineColor": [
    0,
    255,
    0,
    128
  ],
  "fillColor": [
    255,
    0,
    0,
    128
  ],
  "imagePath": "img_001.jpg",
  "imageData": "iVBORw0KGgoAAAANSUhEUgAA...",
  "imageHeight": 600,
  "imageWidth": 800
}

实验环境

  • Python 3.x (面向对象的高级语言)

过滤掉特定区域内的矩形框

  • 背景:将预测出来的矩形框,过滤掉特定区域内(某些不需要的)的矩形框

在这里插入图片描述

方法一:直接法(for循环遍历)

代码实现

import cv2
import copy
import numpy as np

def is_rect_inside(rect, filtered_rects):  
    for filtered_rect in filtered_rects:  
        if (rect[1] >= filtered_rect[1] and rect[1] + rect[3] <= filtered_rect[1] + filtered_rect[3] and  
            rect[2] >= filtered_rect[2] and rect[2] + rect[4] <= filtered_rect[2] + filtered_rect[4]):  
            return True  
    return False  


def filter_rect(rects_list,labels_list,scores_list,filtered_rects,pad_x=50,pad_y=50):
    '''
    合并重叠框 

    输入参数: 
        rects_list :[[占位符,x,y,w,h,占位符],[占位符,x,y,w,h,占位符],...]
        labels_list :[0,1,...]
        scores_list :[0.8,0.15,...]
        filtered_rects: [[占位符,x,y,w,h,占位符],[占位符,x,y,w,h,占位符],...]

    返回:
        过滤后的rects_list : [[占位符,x,y,w,h,占位符],[占位符,x,y,w,h,占位符],...]
        过滤后的labels_list : [0,1,...]
        过滤后的scores_list : [0.8,0.15,...]
    '''
    new_rects_list = []
    new_labels_list = []
    new_scores_list = []

    for index,rect in enumerate(rects_list):
        if not is_rect_inside(rect, filtered_rects):
            new_rects_list.append(rect)
            new_labels_list.append(labels_list[index])
            new_scores_list.append(scores_list[index])
        

    return new_rects_list,new_labels_list,new_scores_list


if __name__=="__main__":
    # 特定区域(蓝色区域)
    filtered_rects = [[2.0,390,390,60,60,0.0],[2.0,90,90,250,250,0.0]]
    # 原始矩形框
    rects_list = [[2.0,10,10,15,15,0.0],[2.0,20,20,10,10,0.0],[2.0,100,100,150,150,0.0],  
                [2.0,200,200,100,100,0.0],[2.0,400,400,15,15,0.0],[2.0,420,420,10,10,0.0]] # [占位符,x,y,w,h,占位符]
    # print("原始的矩形框:",rects_list)
    labels_list = [0,1,2,3,2,1]
    scores_list = [0.8,0.9,0.5,0.6,0.7,0.3]
    
    img = np.ones([512, 512, 3], np.uint8)
    for _,x,y,w,h,_ in rects_list:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (0, 255, 0), 2)
    for _,x,y,w,h,_ in filtered_rects:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (255, 0, 0), 2)
    cv2.imshow('origin', img)
    # cv2.imwrite('origin.jpg', img)


    new_rects_list,new_labels_list,new_scores_list = filter_rect(rects_list,labels_list,scores_list,filtered_rects,pad_x=50,pad_y=50)
    # print("过滤后的矩形框,类别,置信度:",new_rects_list,new_labels_list,new_scores_list)

    img = np.ones([512, 512, 3], np.uint8) 
    for _,x,y,w,h,_ in new_rects_list:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (0, 0, 255), 2)
    for _,x,y,w,h,_ in filtered_rects:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (255, 0, 0), 2)
    cv2.imshow('filtered', img)
    # cv2.imwrite('filtered.jpg', img)
    cv2.waitKey(0)
    cv2.destroyAllWindows()

输出结果

在这里插入图片描述

方法二:列表推导式

代码实现

import cv2
import copy
import numpy as np

def is_rect_inside(rect, filtered_rects):  
    for filtered_rect in filtered_rects:  
        if (rect[1] >= filtered_rect[1] and rect[1] + rect[3] <= filtered_rect[1] + filtered_rect[3] and  
            rect[2] >= filtered_rect[2] and rect[2] + rect[4] <= filtered_rect[2] + filtered_rect[4]):  
            return True  
    return False  


if __name__=="__main__":
    # 特定区域(蓝色区域)
    filtered_rects = [[2.0,390,390,60,60,0.0],[2.0,90,90,250,250,0.0]]
    # 原始矩形框
    rects_list = [[2.0,10,10,15,15,0.0],[2.0,20,20,10,10,0.0],[2.0,100,100,150,150,0.0],  
                [2.0,200,200,100,100,0.0],[2.0,400,400,15,15,0.0],[2.0,420,420,10,10,0.0]] # [占位符,x,y,w,h,占位符] 
    # print("原始的矩形框:",rects_list)
    labels_list = [0,1,2,3,2,1]
    scores_list = [0.8,0.9,0.5,0.6,0.7,0.3] 

    img = np.ones([512, 512, 3], np.uint8)
    for _,x,y,w,h,_ in rects_list:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (0, 255, 0), 2)
    for _,x,y,w,h,_ in filtered_rects:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (255, 0, 0), 2)
    cv2.imshow('origin', img)
    # cv2.imwrite('origin.jpg', img)
    
    print("原始的矩形框:", rects_list)  
    
    filtered_rects_list = [rect for rect in rects_list if not is_rect_inside(rect, filtered_rects)]
    filtered_labels_list = [labels_list[index] for index,rect in enumerate(rects_list) if not is_rect_inside(rect, filtered_rects)]
    filtered_scores_list = [scores_list[index] for index,rect in enumerate(rects_list) if not is_rect_inside(rect, filtered_rects)]
    
    print("过滤后的矩形框,类别,置信度:", filtered_rects_list,filtered_labels_list,filtered_scores_list)

    img = np.ones([512, 512, 3], np.uint8) 
    for _,x,y,w,h,_ in filtered_rects_list:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (0, 0, 255), 2)
    for _,x,y,w,h,_ in filtered_rects:
        img = cv2.rectangle(img, (x,y), (x+w,y+h), (255, 0, 0), 2)
    cv2.imshow('filtered', img)
    # cv2.imwrite('filtered.jpg', img)

    cv2.waitKey(0)
    cv2.destroyAllWindows()

输出结果

在这里插入图片描述

  • 由于本人水平有限,难免出现错漏,敬请批评改正。
  • 更多精彩内容,可点击进入Python日常小操作专栏、OpenCV-Python小应用专栏、YOLO系列专栏、自然语言处理专栏或我的个人主页查看
  • YOLOv8 Ultralytics:使用Ultralytics框架训练RT-DETR实时目标检测模型
  • 基于DETR的人脸伪装检测
  • YOLOv7训练自己的数据集(口罩检测)
  • YOLOv8训练自己的数据集(足球检测)
  • YOLOv5:TensorRT加速YOLOv5模型推理
  • YOLOv5:IoU、GIoU、DIoU、CIoU、EIoU
  • 玩转Jetson Nano(五):TensorRT加速YOLOv5目标检测
  • YOLOv5:添加SE、CBAM、CoordAtt、ECA注意力机制
  • YOLOv5:yolov5s.yaml配置文件解读、增加小目标检测层
  • Python将COCO格式实例分割数据集转换为YOLO格式实例分割数据集
  • YOLOv5:使用7.0版本训练自己的实例分割模型(车辆、行人、路标、车道线等实例分割)
  • 使用Kaggle GPU资源免费体验Stable Diffusion开源项目

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1276859.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

51k+ Star!动画图解、一键运行的数据结构与算法教程!

大家好&#xff0c;我是 Java陈序员。 我们都知道&#xff0c;《数据结构与算法》 —— 是程序员的必修课。 无论是使用什么编程语音&#xff0c;亦或者是前后端开发&#xff0c;都需要修好《数据结构与算法》这门课&#xff01; 在各个互联网大产的面试中&#xff0c;对数据…

RocketMQ事务消息源码解析

RocketMQ提供了事务消息的功能&#xff0c;采用2PC(两阶段协议)补偿机制&#xff08;事务回查&#xff09;的分布式事务功能&#xff0c;通过这种方式能达到分布式事务的最终一致。 一. 概述 半事务消息&#xff1a;指的是发送至broker但是还没被commit的消息&#xff0c;在半…

【Linux】24、文件系统、磁盘 IO

文章目录 一、文件系统1.1 索引节点和目录项1.2 虚拟文件系统 VFS1.3 文件系统 I/O1.5 性能观测1.5.1 容量1.5.2 缓存1.5.3 find 命令的缓存 二、磁盘 I/O2.1 通用块层2.2 I/O 栈2.3 磁盘性能指标2.3.1 磁盘 I/O 观测2.3.2 进程 I/O 观测 2.4 案例&#xff1a;找到打大量日志的…

UiPath学习笔记

文章目录 前言RPA介绍UiPath下载安装组件内容 前言 最近有一个项目的采集调研涉及到了客户端的采集&#xff0c;就取了解了一下RPA和UIPATH&#xff0c;记录一下 RPA介绍 RPA&#xff08;Robotic Process Automation&#xff1a;机器人处理自动化&#xff09;&#xff0c;是…

聊聊什么是IO流

目录 Java IOIO 基础Java IO 流了解吗&#xff1f; IO 设计模式1、装饰器模式2、适配器模式适配器模式和装饰器模式有什么区别呢&#xff1f;3、工厂模式4、观察者模式 IO 模型有哪些常见的 IO 模型&#xff1f;BIO(Blocking I/O)NIO (Non-blocking/New I/O)AIO (Asynchronous …

Java包(package)

1、概念 为了更好的组织类&#xff0c;用于区别类名的命名空间&#xff0c;其实就是基于工程的一个文件路径&#xff0c;如&#xff1a; 2、作用 三个作用&#xff1a; 1&#xff09;区分相同名称的类。 2&#xff09;能够较好地管理大量的类。 3&#xff09;控制访问范围。 在…

网站实现验证码功能

一、验证码 一般来说&#xff0c;网站在登录的时候会生成一个验证码来验证是否是人类还是爬虫&#xff0c;还有一个好处是防止恶意人士对密码进行爆破。 二、流程图 三、详细说明 3.1 后端生成验证码 Override public Result<Map<String, String>> getVerifica…

国内哪个超声波清洗机品牌比较好?质量好超声波清洗机总结

近年来超声波清洗机可以说是非常火爆&#xff0c;可以清洗化妆刷、眼镜、牙套等等一些小物件&#xff0c;大物件物品可以入手大型超声波清洗机&#xff0c;总之现在超声波清洗机已经衍生到可以在家使用&#xff0c;不再是在眼镜店看到它的身影或者是一些工业领域上&#xff0c;…

第二节:服务拆分(案例)

一、服务拆分注意事项 1.1 拆分原则 每个微服务&#xff0c;不要重复开发相同业务&#xff08;例如在单体项目中用到了一个查询&#xff0c;这个查询功能能够查询出订单信息、商品信息、用户信息&#xff0c;那么在拆分微服务时就不要将其写在一起了&#xff0c;订单的微服务只…

1、RocketMQ源码分析(一)

RocketMQ简单介绍 RabbitMQ的底层是使用erlang语言编写的&#xff0c;不便分析其底层&#xff0c;RocketMQ作为原阿里下经历阿里双十一严格考验的中间件&#xff0c;同时也是使用我们熟悉的java语言编写&#xff0c;我们先把入门的基础必备了解透&#xff0c;然后在去分析源码…

基于WebSocket实现客户聊天室

目录 一、实现聊天室原理 二、聊天室前端代码 三、聊天室后端代码&#xff08;重点&#xff09; 四、聊天室实现效果展示 一、实现聊天室原理 1.1 介绍websocket协议 websocket是一种通信协议&#xff0c;再通过websocket实现弹幕聊天室时候&#xff0c;实现原理是客户端首…

使用K-means把人群分类

1.前言 K-mean 是无监督的聚类算法 算法分类&#xff1a; 2.实现步骤 1.数据加工&#xff1a;把数据转为全数字&#xff08;比如性别男女&#xff0c;转换为0 和 1&#xff09; 2.模型训练 fit 3.预测 3.代码 原数据类似这样(source&#xff1a;http:img-blog.csdnimg.cn…

vmware 安装 AlmaLinux OS 8.6

选择系统镜像 选择镜像 选择安装位置和修改名称 可以自定义硬件&#xff0c;也可以不选择&#xff0c;后面可以再设置 自定义硬件可以设置内存和cpu等信息 安装虚拟机系统 密码如果简单的话需要点击两次done 才能保存

集成开发环境PyCharm的使用【侯小啾python领航计划系列(三)】

集成开发环境 PyCharm 的使用【侯小啾python领航计划系列(三)】 大家好,我是博主侯小啾, 🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ🌹꧔ꦿ�…

Stable Diffusion AI绘画系列【10】:AI眼中的美丽清晨

《博主简介》 小伙伴们好&#xff0c;我是阿旭。专注于人工智能、AIGC、python、计算机视觉相关分享研究。 ✌更多学习资源&#xff0c;可关注公-仲-hao:【阿旭算法与机器学习】&#xff0c;共同学习交流~ &#x1f44d;感谢小伙伴们点赞、关注&#xff01; 《------往期经典推…

【数电笔记】卡诺图绘制(逻辑函数的卡诺图化简)

目录 说明&#xff1a; 最小项卡诺图的组成 1. 相邻最小项 2. 卡诺图的组成 2.1 二变量卡诺图 2.2 三表变量卡诺图 2.3 四变量卡诺图 3. 卡诺图中的相邻项&#xff08;几何相邻&#xff09; 说明&#xff1a; 笔记配套视频来源&#xff1a;B站 最小项卡诺图的组成 1. …

算法通关村第十四关-青铜挑战认识堆

大家好我是苏麟 , 今天带大家认识认识堆 . 堆 堆是将一组数据按照完全二叉树的存储顺序&#xff0c;将数据存储在一个一维数组中的结构。 堆有两种结构&#xff0c;一种称为大顶堆&#xff0c;一种称为小顶堆 : 大顶堆 大顶堆的任何一个父节点的值&#xff0c;都大于或等于…

nginx设置用户密码

1.官网 https://nginx.org/en/docs/http/ngx_http_auth_basic_module.html2.语法 3.创建密码 [rootlocalhost ~]# yum install httpd-tools -y4.创建密码文件 完毕&#xff01; [rootlocalhost ~]# htpasswd -b -c /etc/nginx/auth-passwd xp xp666-c 创建passwdfile &#…

免费使用优彩云采集器,3分钟学会优彩云采集器使用【2023最新】

如何高效地采集并聚合原创内容成为了一项关键任务&#xff1f;在这个背景下&#xff0c;本文将深入研究优彩云采集和147SEO采集&#xff0c;实现原创文章采集。 147SEO采集器 对于许多从业者而言&#xff0c;147SEO采集并不陌生。作为一款专注于原创内容采集的工具&#xff0c…

avue页面布局 api 引用

展示 index.vue <template><basic-container><avue-crud :option"option":table-loading"loading":data"data":page"page":permission"permissionList":search.sync"search":before-closebefore…