计算机视觉与深度学习-图像分割-视觉识别任务03-实例分割-【北邮鲁鹏】

news2025/1/23 3:16:01

目录

  • 参考
  • 定义
  • Mark R-CNN
    • 结构
    • 思路
    • Mask R-CNN训练阶段使用的Mask样例
    • Mask R-CNN实例分割结果
    • Mask R-CNN检测姿态

参考

论文题目:Mask R-CNN

论文链接:论文下载

论文代码:Facebook代码链接;Tensorflow版本代码链接; Keras and TensorFlow版本代码链接;MxNet版本代码链接

参考:Mask R-CNN详解

定义

将图像中的每个像素与其所属的目标实例进行关联,并为每个像素分配一个特定的标签,以实现像素级别的目标定位和分割。

在这里插入图片描述
与目标检测任务不同,目标检测只关注目标的位置和边界框,而实例分割需要在像素级别对目标进行分割,即将每个像素分配到相应的目标实例中。

Mark R-CNN

是在 Faster R-CNN 框架的基础上进行扩展而来。
在这里插入图片描述
Mask R-CNN 的核心思想是在 Faster R-CNN 的基础上添加一个分支,用于预测每个目标实例的像素级掩膜 (mask)。这使得 Mask R-CNN 不仅可以准确地检测目标的位置和类别,还可以对每个目标实例进行精确的像素级分割。

结构

Mask R-CNN 的主要特点和组成部分如下:

  • 区域建议网络(Region Proposal Network, RPN):与 Faster R-CNN 相同,Mask R-CNN 使用 RPN 来生成候选区域。RPN 在输入图像上滑动窗口,并为每个窗口位置生成候选框(anchors),并预测每个候选框是否包含目标。

  • 区域特征提取:Mask R-CNN 使用共享的卷积网络(如 ResNet)来提取候选区域的特征表示。这些特征被用于分类目标类别和回归目标边界框。

  • 目标分类和边界框回归:Mask R-CNN 在 Faster R-CNN 的基础上添加了目标分类和边界框回归分支,用于对每个候选区域进行目标分类和位置调整。

  • 实例分割分支:Mask R-CNN 的关键创新是添加了一个分支来预测每个目标实例的像素级掩膜。这个分支是在每个候选区域上应用全卷积网络,生成一个二进制掩膜来表示目标的精确分割。

思路

具体来说,对于每个候选区域,Mask R-CNN 的实例分割分支会在目标检测局域上再次应用一系列卷积操作来生成目标实例的像素级掩膜。这个过程通常被称为掩膜生成子网络(Mask Head)。

在这里插入图片描述
一般而言,Mask Head 的设计类似于全卷积网络,它会在目标检测局域上对特征图进行进一步处理。具体的步骤如下:

  • 基于ROIAlign的空间金字塔池化(Spatial Pyramid Pooling, SPP):首先,通过ROIAlign操作将每个候选区域对齐为固定大小的特征图块。然后,对每个特征图块应用空间金字塔池化,生成固定大小的特征向量。

  • 一系列的卷积和上采样操作:使用一系列卷积层对特征向量进行进一步处理,以提取和整合更丰富的语义信息。通常,这些卷积层采用具有小卷积核的窄卷积,以减少参数量和计算复杂度。

  • 最终的卷积层:在最后一个卷积层上使用适当的激活函数(如Sigmoid)来生成目标实例的二进制掩膜。每个像素点的输出值表示该像素属于目标的概率。

Mask R-CNN训练阶段使用的Mask样例

训练阶段的标答
在这里插入图片描述

Mask R-CNN实例分割结果

在这里插入图片描述

Mask R-CNN检测姿态

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1046062.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

51单片机3【单片机的种类】

1.51单片机发展史 1. 发展史 (1)总结:早期是不分单片机和其他CPU的,早期都是一起的,后来应用级别的高端CPU相继推出用于别的行业(PC,手机)其中一支专用与低性能,低价格作…

Java基础简单整理

文章目录 Java语言具有以下特点:Java SE vs Java EEJVM vs JDK vs JRE为什么说 Java 语言编译与解释并存?Java 和 C 的区别?Java注释用法:Java标识符Java基本数据类型链接Java字符串类型链接基本类型和包装类型的区别?静态方法为…

Unity实现设计模式——观察者模式

Unity实现设计模式——观察者模式 观察者设计模式定义了对象间的一种一对多的组合关系,以便一个对象的状态发生变化时,所有依赖于它的对象都得到通知并自动刷新。 简单来说就是某个人需要收到通知只需要订阅这个通知,当通知发送时会发送到每…

自定义热加载:如何不停机实现核心代码更新

文章目录 1. 常见的几种实现代码热更新的几种方式对于开发环境我们可以使用部署环境1. 使用 Arthas 的 redefine 命令来加载新的 class 文件2. 利用 URLClassLoader 动态加载3. 通过Java的Instrumentation API 也是可以实现的 2. 实现1. ClassScanner扫描目录和加载类2. 定时任…

system trace

adb shell stopadb shell start //重启adb 数据会干净点adb shell //也试过在adb shell 外面dump system trace,但是同样的参数dump出来看不到如此详细,比如makeApplication的时长,线程执行被中断等atrace -z -b 40000 am wm view res ss g…

常用接口测试工具

首先,什么是接口呢? 接口一般来说有两种,一种是程序内部的接口,一种是系统对外的接口。 系统对外的接口:比如你要从别的网站或服务器上获取资源或信息,别人肯定不会把数据库共享给你,他只能给你…

如何使用ASO优化来提高应用的安装率

应用程序的成功并非一蹴而就,它需要大量的时间和工作,而这一切都取决于对流程的深入理解、对结果的衡量以及对执行的某些营销活动的有效性进行分析。但哪些优化在App Store或Google Play上取得成功最关键?为了取得成功,我们必须跟…

2023/9/27 -- ARM

【汇编语言相关语法】 1.汇编语言的组成部分 1.伪操作:不参与程序的执行,但是用于告诉编译器程序该怎么编译 .text .global .end .if .else .endif .data2.汇编指令 编译器将一条汇编指令编译成一条机器码,在内存里一条指令占4字节内…

服务断路器_Resilience4j重试机制

重试机制比较简单,当服务端处理客户端请求异常时,服务端将会开启重试机制,重试期间内,服务端将每隔一段时间重试业务逻辑处理。 如果最大重试次数内成功处理业务,则停止重试,视为处理成功。如果在最大重试次…

手动关闭Spring定时任务

一、问题 比如我写了一个这样的定时任务类,该定时任务很简单:每秒打印一行craneing… 那么后期我想中途关闭和开启这个定时任务应该怎么处理? 二、解决 spring定时任务依赖 ThreadPoolTaskScheduler 这个类,我们只需要顶掉这个…

UE蓝图学习(从Unity3D而来)

一、UE组件对比Unity3D,从Unity3D过渡来学的角度出发,可以理解为在 空物体下放置子物体。UE没有U3D那种可以将组件挂在自身空物体上面。 二、UE 蓝图的情境提示,必须先找到相应的类型,对象对象、事件事件,才能找到相应…

案例题概述

案例题概述 考点 考点 新教材的新增考点 第一题必做,之后是4选2 感觉都是记忆的,课件完整一些,之后以看课件为主了,不在做详细笔记了

Scrapy框架Splash渲染

Scrapy框架是一款强大而灵活的Python网络爬虫框架,用于快速、高效地爬取和提取网页数据。然而,对于一些使用动态渲染技术的网站,Scrapy在处理JavaScript生成的内容上可能会有些困难。为了应对这种情况,Scrapy提供了Splash渲染服务…

数码产品数码配件无线键盘等出口欧盟CE-RED认证测试办理

数码产品数码配件无线键盘CE-RED认证测试办理 无线产品CE-RED认证进入东欧市场规定: 在通信终端设备和无线产品在这些/地区合法销售之前,必须按照 RED 指令进行测试,并且还必须提供 CE 标志。无线远程控制产品必须符合 RED 指令的 REDEU 要…

unittest单元测试框架使用

什么是unittest 这里我们将要用的unittest是python的单元测试框架,它的官网是 25.3. unittest — Unit testing framework — Python 2.7.18 documentation,在这里我们可以得到全面的信息。 当我们写的用例越来越多时,我们就需要考虑用例编写…

油猴(篡改猴)学习记录

第一个Hello World 注意点:默认只匹配了http网站,如果需要https网站,需要自己添加match https://*/*代码如下 这样子访问任意网站就可以输出Hello World // UserScript // name 第一个脚本 // namespace http://tampermonkey.net/ // version 0.1 // descri…

2023/9/26 -- ARM

【计算机相关理论】 1.计算机的组成 输入设备、输出设备、存储器、运算器、控制器 1.输入设备:将编写好的软件代码以及相关的数据输送到计算机中。转换成计算机可以识别、存储 和处理的数据。 例如:鼠标、键盘、复印机、传感器 2.输出设备&a…

结构型设计模式——组合模式

摘要 组合模式(composite pattern): 允许你将对象组合成树形结构来表现"整体/部分"层次结构. 组合能让客户以一致的方式处理个别对象以及对象组合。 一、组合模式的意图 将对象组合成树形结构来表示“整体/部分”层次关系,允许用户以相同的方式处理单独…

【Java SE】Lambda表达式

目录 ♫什么是Lambda表达式 ♫Lambda表达式的语法 ♫函数式接口 ♫Lambda表达式的使用 ♫变量捕获 ♫ Lambda表达式在集合中的使用 ♪Collection的foreach(): ♪List的sort(): ♪Map的foreach() ♫什么是Lambda表达式 Lambda 表达式是 Java SE 8中一个…

Socks5代理IP是什么?有什么优点及如何使用?

随着网络威胁和数据泄露的数量不断增加,在浏览互联网时保护个人信息并保持匿名变得至关重要。实现此目的的一种有效方法是使用Socks5代理IP。如今Socks5代理被广泛应用于跨境电商/社媒平台、SEO业务、网络抓取等领域,在这篇文章中,我们将讨论…