opencv-利用DeepLabV3+模型进行图像分割去除输入图像的背景

news2024/11/28 10:33:15

分离图像中的人物和背景通常需要一些先进的图像分割技术。GrabCut是一种常见的方法,但是对于更复杂的场景,可能需要使用深度学习模型。以下是使用深度学习模型(如人像分割模型)的示例代码:

#导入相关的库
import cv2
import numpy as np
import torch
import torchvision.transforms as T
from torchvision.models.segmentation import deeplabv3_resnet101

def remove_background_with_deep_learning(image_path):
    # 读取图像
    image = cv2.imread(image_path)

    # 将图像转换为RGB格式
    image_rgb = cv2.cvtColor(image, cv2.COLOR_BGR2RGB) #将图像从BGR格式转换为RGB格式,因为深度学习模型通常使用RGB。

    # 定义图像预处理和转换
    transform = T.Compose([  #定义了图像的预处理和转换步骤,包括将图像转换为PyTorch张量和标准化。
        T.ToTensor(),  # 将图像转换为PyTorch张量
        T.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),  # 标准化图像
    ])

    # 对图像进行预处理和转换
    input_tensor = transform(image_rgb)
    input_batch = input_tensor.unsqueeze(0)  # 添加一个维度,使其成为批处理的一部分

    # 加载预训练的DeepLabV3模型
    model = deeplabv3_resnet101(pretrained=True)
    model.eval()  # 设置为评估模式,不进行梯度更新

    # 运行模型并获取分割掩模
    with torch.no_grad(): #上下文管理器,用于关闭梯度计算,以提高推断速度。
        output = model(input_batch)['out'][0]#运行模型并获取输出。
    output_predictions = output.argmax(0)  # 获取模型输出中预测类别的索引

    # 将分割结果转换为二进制掩模
    mask = (output_predictions == 15).numpy()  # 在DeepLabV3模型中,15是人物的标签

    # 将原始图像与二进制掩模相乘,去除背景
    result = image * mask[:, :, np.newaxis]

    # 显示结果
    cv2.imshow('Original Image', image)
    cv2.imshow('Removed Background', result)
    cv2.waitKey(0)
    cv2.destroyAllWindows()
# 使用示例
remove_background_with_deep_learning(r"C:\Users\mzd\Desktop\opencv\images.jpg")

在这里插入图片描述
代码解释:
理解代码可能需要一些基本的编程和机器学习知识,以下是逐步解释代码的主要部分:

  1. 导入库: 首先,导入了用于图像处理和深度学习的库,包括OpenCV(cv2)、PyTorch和TorchVision。

  2. 定义函数: remove_background_with_deep_learning 是一个用于去除图像背景的函数。它接受一个图像路径作为参数。

  3. 读取和转换图像: 使用OpenCV读取图像,然后将图像转换为RGB格式。机器学习模型通常使用RGB格式。

  4. 图像预处理和转换: 定义了一系列图像预处理和转换步骤,将图像转换为PyTorch张量并进行标准化。

  5. 加载预训练模型: 使用deeplabv3_resnet101 模型,它是一个预训练的深度学习模型,专门用于图像分割任务。

  6. 运行模型并获取分割掩模: 将预处理后的图像输入到模型中,获取模型输出中的分割掩模。在这里,15是代表人物的类别标签。

  7. 将分割结果转换为二进制掩模: 将模型输出的分割结果转换为二进制掩模,其中值为1的像素表示属于人物的区域。

  8. 去除背景: 将原始图像与二进制掩模相乘,实现去除背景效果。

在这个函数中,将原始图像与二进制掩模相乘的目的是将背景部分置零,从而实现去除背景的效果。这是基于掩模的思想,其中掩模是一个与原始图像大小相同的二维数组,其中元素的值为0或1,用于指示哪些像素应该保留(值为1)或去除(值为0)。
具体流程如下:

  1. mask = (output_predictions == 15).numpy():通过模型的输出,生成一个二进制掩模。在这里,假设标签15对应于人物。掩模中值为1的像素表示人物,值为0的像素表示背景。
  2. result = image * mask[:, :, np.newaxis]:通过将原始图像与二进制掩模相乘,实现了以下效果:
    • 当掩模中对应位置的值为1(人物部分),相乘结果保持原始图像的颜色值;
    • 当掩模中对应位置的值为0(背景部分),相乘结果将对应位置的像素值置零。 这样,通过像素级别的相乘操作,将背景部分的像素值置零,达到了去除背景的效果。最终,result就是去除背景后的图像。

这是一种简单而有效的背景去除方法,尤其在利用深度学习模型进行图像分割的场景中得到了广泛应用。

  1. 显示结果: 使用OpenCV的 imshow 函数显示原始图像和去除背景后的图像。

  2. 使用示例: 调用 remove_background_with_deep_learning 函数,传递图像路径,这里的路径是 'path/to/your/image.jpg'。这是整个程序的入口。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1256864.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

什么是网络安全 ?

网络安全已成为我们生活的数字时代最重要的话题之一。随着连接设备数量的增加、互联网的普及和在线数据的指数级增长,网络攻击的风险呈指数级增长。 但网络安全是什么意思? 简而言之,网络安全是一组旨在保护网络、设备和数据免受网络攻击、…

Java多线程并发中部分不并发的问题

写Java实验发现个有意思的问题 三个线程,一个线程打印字符a,一个线程打印字符b,另一个线程打印数字,多次运行结果都是先打印混合输出的ab,完了再打印数字 有图有真相,我运行了10次 完整的代码是这个 clas…

计算机毕业设计 基于SpringBoot的智能停车场计费系统的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍:✌从事软件开发10年之余,专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ 🍅文末获取源码联系🍅 👇🏻 精…

二十七、微服务案例

目录 一、实现输入搜索功能 1、下载代码,在idea上打开 2、新建RequestParams类,用于接收解析请求 3、在启动类中加入客户端地址Bean,以便实现服务 4、编写搜索方法 5、新建返回分页结果类 6、实现搜索方法 7、编写控制类,…

下载网页内容成HTML文件

今天遇到了一个非常好用的、开源的网页下载插件: SingleFile,它可以将当前网页里的文字、图片、超链接等,合并成单一的.html文件,便于保存和浏览查看。下面介绍SingleFile的安装和使用。 1、下载SingleFile插件 SingleFile官网地址&#xff…

解决OSError: [Errno 28] No space left on device报错和搭建AIrtest无线配置手机集群

OSError: [Errno 28] No space left on device和搭建AIrtest无线配置手机集群 做手机无限集群控制时,常常遇到这种错误问题。表示您的设备上没有足够的可用磁盘空间来完成某个操作。我们遇到了还得重新开端口和输入ip,如果有几百台手机是不是中午就不吃…

数据里有{1,2,3,4,5,6,7,8,9},请随机打乱顺序,生成一个新的数组

问题:数据里有{1,2,3,4,5,6,7,8,9},请随机打乱顺序,生成一个新的数组。 思路: 旧数组 nums,新数组 newNums 1、先创建一个新数组,用来存打乱数据后的元素,新旧数组的长度要一致 2、然后遍历数组…

OpenMMlab导出yolox模型并用onnxruntime和tensorrt推理

导出onnx文件 直接使用脚本 import torch from mmdet.apis import init_detector, inference_detectorconfig_file ./configs/yolox/yolox_tiny_8xb8-300e_coco.py checkpoint_file yolox_tiny_8x8_300e_coco_20211124_171234-b4047906.pth model init_detector(config_fi…

【算法】链表-20231127

这里写目录标题 一、面试题 02.02. 返回倒数第 k 个节点二、82. 删除排序链表中的重复元素 II三、141. 环形链表 一、面试题 02.02. 返回倒数第 k 个节点 提示 简单 130 相关企业 实现一种算法,找出单向链表中倒数第 k 个节点。返回该节点的值。 注意:本…

【Vue3+Vite】解决build后空白页的问题

目录 Hash 模式 HTML5 模式(历史模式) 配置Nginx 配置Spring Boot Hash 模式 build后空白页的问题可能是使用的是历史模式,因为Vue是一个单页的客户端应用,如果没有适当的服务器配置,访问会得到一个 404 错误…

通用电气调查网络攻击和数据盗窃指控

通用电气正在调查有关威胁行为者在网络攻击中破坏了公司开发环境并泄露据称被盗数据的指控。 通用电气 (GE) 是一家美国跨国公司,业务涉及电力、可再生能源和航空航天行业。 本月早些时候,一个名为 IntelBroker 的威胁行为者试图在黑客论坛上以 500 美…

linux复习笔记05(小滴课堂)

hell脚本与crontab定时器的运用 查看状态: 关闭服务: 开启服务: 重启服务: crontab定时器的使用: 我们可以看到没有任何任务。 编辑: 我们可以看到这个任务了。 删除所有任务: 这代表着每分钟…

自动驾驶学习笔记(十二)——定位技术

#Apollo开发者# 学习课程的传送门如下,当您也准备学习自动驾驶时,可以和我一同前往: 《自动驾驶新人之旅》免费课程—> 传送门 《Apollo Beta宣讲和线下沙龙》免费报名—>传送门 文章目录 前言 卫星定位 RTK定位 IMU定位 GNSS定…

4面试题--数据库(补充)

隔离性问题 若不考虑隔离性则会出现以下问题 1. 脏读:指⼀个事务在处理数据的过程中,读取到另⼀个 未提交 事务的数据 2. 不可重复读:指对于数据库中的某个数据(同⼀个数据项),⼀个事务内的多次查询却…

yo!这里是异常相关介绍

目录 前言 异常的概念 异常的抛出与捕获 捕获过程 重新抛出 规范 异常体系 自定义 标准库 异常的优缺点 后记 前言 对于程序运行时发生的错误,比如内存错误、除0错误等类型,你会如何处理?是使用assert终止程序或是使用exit返回错误…

Redis 事件轮询

1 Redis 为什么快 数据存在内存中, 直接操作内存中的数据单线程处理业务请求避免了多线的上下文切换, 锁竞争等弊端使用 IO 多路复用支撑更高的网络请求使用事件驱动模型, 通过事件通知模式, 减少不必要的等待… 这些都是 Redis 快的原因。 但是这些到了代码层面是如何实现的呢…

P18 C++ 继承

目录 前言 01 不使用继承会让你多打很多无用的代码 02 继承 最后的话 前言 本期我们学习 C 面向对象编程中的继承。 面向对象程序设计中最重要的一个概念是继承。继承允许我们依据另一个类来定义一个类,这使得创建和维护一个应用程序变得更容易。这样做&#…

【云平台】STM32微信小程序阿里云平台汇总——持续更新

【云平台】STM32微信小程序阿里云平台汇总——持续更新 文章目录 前言总结 前言 提示:以下是本篇文章正文内容,下面案例可供参考 【云平台】STM32微信小程序阿里云平台学习板 【云平台】小白从零开始:小程序阿里云平台控制STM32&#xff08…

Centos 7.9 Install Docker Insecure Registry

文章目录 1. 镜像存储规划2. 安装定制 docker3. 部署 registry4. 验证镜像仓库 1. 镜像存储规划 linux LVM /dev/sdb mount dir /data【linux LVM 磁盘挂载目录】 创建两个目录 一个 docker 数据存储目录 :/data/docker,默认一般为linux为 /var/lib/d…

Java游戏制作——王者荣耀

一.准备工作 首先创建一个新的Java项目命名为“王者荣耀”,并在src下创建两个包分别命名为“com.sxt"、”com.stx.beast",在相应的包中创建所需的类。 创建一个名为“img”的文件夹来储存所需的图片素材。 二.代码呈现 package com.sxt;import javax.sw…