图像分割-DeepLab

news2024/11/26 9:50:25

DeepLabV3+源码链接:https://github.com/bubbliiiing/deeplabv3-plus-pytorch(打不开私信我获取)

一、简介

        一般的模型如Unet一般用于医学领域,小目标,如细胞分割。

        为了增大感受野(从而更好的获得全局特征),通常会选择pooling操作(一般就是每隔几层卷积就会进行pooling),但会丢失部分信息。

二、方法

2.1空洞卷积(dilated convolution)

        下图展示了空洞卷积的原理。左图是普通的卷积,这是紧凑的,连在一起的区域(3*3)。右边是空洞卷积,它在传统卷积的区域分割开了(5*5),从而增大感受野

通过设置dilated参数可以得到不同感受野的特征(3*3,7*7,15*15)

        图像分割任务中(除了医学领域小目标分割,其它场景也适用)需要较大感受野来完成任务。同样目标检测领域等等其他计算机视觉领域都能用到。

2.2 SPP-Layer

        假设输入图像经过了卷积层已经得到了256个特征图,第一种对其进行4*4的切分,划分为16个小方格,然后每个小方格进行maxpooling得到4*4=16个特征值,第二种进行对其进行2*2的切分,划分为4个小方格,同样进行maxpooling得到2*2=4个特征值,第三种直接全局提取特征,然后再拼上(16+4+1)*256,这就是SPP层。

        三种不同的策略,得到三种不同的特征,在拼在一起,相当于全局的也有,粗糙的也有,细节的也有,这样的特征就比较好了。保证了输出固定·

2.3 ASPP(atrous convolution SPP)

        这个其实和APP差不多,只不过引入了不同倍率的空洞卷积,如下图

三、DeepLab V3+

结构图如下:

        输入图像,先进行基础网络(这里是ResNet),再进行五种特征提取方法:①1*1卷积;②3*3卷积,并有间隔为6 的空洞卷积;③3*3卷积,并有间隔为12 的空洞卷积;④3*3卷积,并有间隔为18 的空洞卷积;⑤pooling池化;得到了5种不同的特征图,并要保持他们h,w(即长和宽)一样(利用pading进行),五个特征拼接在一起,经过1*1卷积,得到一个融合很多信息的特征。

        并有粗糙提取得到的特征(图中Low-Level Features),经过1*1卷积得到特征图,然后与上一段得到的融合很多信息的特征进行再次融合(为了保证两个特征图大小一样,这里要进行上采样,因为它已经经过多次卷积后特征图变小),再进行3*3卷积,最终再上采样得到和输入大小相同的输出结果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2223216.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux 基础io_理解文件系统_软硬链接_动静态库

一.磁盘 1.磁盘物理结构 盘片 磁盘可以有多个磁片,每个磁片有两个盘面,每个盘面都对应一个磁头,都可以存储数据。 磁道 扇区 磁道是指在盘面上,由磁头读写的数据环形轨道。每个磁道都是由一圈圈的圆形区域组成,数据…

操作系统期末|考研复习知识点汇总 - 持续更新

本文将根据个人学习进度对b站王道408课程以及题目考察的知识点进行整合,视频中详细的导图将会直接复用,并且将会对一些重点知识进行扩展以及一些思维导图的补充,目前第三章内容正在整理中…… 一:计算机系统概述 1.1操作系统概念…

解锁PDF权限密码

目录 背景: 定义与功能: 过程: 主要功能: 使用方式: 使用限制: 注意事项: 总结: 背景: 前段时间自己设置了PDF文件的许可口令,忘了口令导致自己无法编辑内容等,这…

7、Nodes.js包管理工具

四、包管理工具 4.1 npm(Node Package Manager) Node.js官方内置的包管理工具。 命令行下打以下命令: npm -v如果返回版本号,则说明npm可以正常使用 4.1.1npm初始化 #在包所在目录下执行以下命令 npm init #正常初始化,手动…

docker基础使用创建固定硬盘大小为40G的虚拟机

在docker中创建的服务器,匹配出容器id,服务器ip,服务器核数,服务器内存,服务器硬盘空间 for i in $(docker ps | grep -aiE web | awk {print $1});do echo $i; docker inspect $i|grep -aiE ipaddr|tail -1|grep -ai…

Spring Boot 依赖注入为 null 问题

目录 问题 省流 代码复现 TestService TestAspect TestController 源码分析 AbstractAutoProxyCreator CglibAopProxy Enhancer 问题 工作中,在负责的模块里使用 DubboService 注解注册了一个 dubbo 接口,给定时任务模块去调用。在自我调试阶…

使用Bert+BiLSTM+CRF训练 NER任务

使用的数据集在这里E-Commercial NER Dataset / 电商NER数据集_数据集-阿里云天池 针对面向电商的命名实体识别研究,我们通过爬取搜集了淘宝商品文本的标题,并标注了4大类,9小类的实体类别。具体类型及实体数量如下 针对面向电商的命名实体…

解决:如何在opencv中得到与matlab立体标定一样的矫正图?(python版opencv)

目的:采用一样的标定参数,matlab中和opencv中的立体矫正图像是一样的吗?不一样的话怎么让它们一样? 结论:不一样。后文为解决方案。 原因:注意matlab的标定结果在matlab中的用法和在opencv中的用法不一样&a…

OpenCv-01

使用opencv对图像进行一些简单的处理 首先知道自己的工作目录 import os cwdos.getcwd() 命名一张图片 my_imagelenna.png 获得图片路径 image_pathos.path.join(cwd,my_image) import cv2 imagecv2.imread(my_image) #imread()函数将图片转换为ndarray数组 image.sh…

大数据新视界 --大数据大厂之 Snowflake 在大数据云存储和处理中的应用探索

💖💖💖亲爱的朋友们,热烈欢迎你们来到 青云交的博客!能与你们在此邂逅,我满心欢喜,深感无比荣幸。在这个瞬息万变的时代,我们每个人都在苦苦追寻一处能让心灵安然栖息的港湾。而 我的…

探索华为云DataArts Insight:数据智能的新引擎

在快速发展的数字化时代,数据已经成为企业最宝贵的资产。如何有效地管理和利用这些数据,以实现商业价值,是每个企业需要面对的重要挑战。华为云DataArts Insight平台应运而生,作为一款强大的数据智能解决方案,它帮助企…

STANFORD SR570 斯坦福 SR570 前置放大器

斯坦福(Stanford)STANFORD SR570前置放大器,作为音频与电子测量领域的璀璨明珠,以其无与伦比的性能与精湛的工艺,赢得了全球专业人士的广泛赞誉。这款前置放大器不仅是技术的集大成者,更是艺术与科学的完美…

论文学习 | 《电动汽车锂离子电池健康状态估计及寿命预测方法研究》

Hi,大家好,我是半亩花海。本文主要对上述论文《电动汽车锂离子电池健康状态估计及寿命预测方法研究》进行学习与阅读总结,便于后续科研进一步学习(纯小白自读汇总版)。总体感觉这篇有点偏向数理方面,不过后…

【动手学深度学习】8.2. 文本预处理(个人向笔记)

本节将解析文本的常见预处理步骤包括:将文本作为字符串加载到内存中。将字符串拆分为词元(如单词和字符)。建立一个词表,将拆分的词元映射到数字索引。将文本转换为数字索引序列,方便模型操作。 1. 读取数据集 我们下…

leetcode-73-矩阵置零

题解: 1、获取矩阵的行数M与列数N; 2、 代码实现:

yolo目标检测和姿态识别和目标追踪

要检测摄像头画面中有多少人,人一排排坐着,像教室那样。由于摄像头高度和角度的原因,有的人会被遮挡。 yolo v5 首先需要下载yolo v5官方代码,可以克隆或下载主分支的代码,或者下载release中发布的。 简单说一下环境…

【python实战】利用代理ip爬取Alibaba海外版数据

引言 在跨境电商的业务场景中,数据采集是分析市场、了解竞争对手以及优化经营策略的重要环节。然而,随着越来越多企业依赖数据驱动决策,许多跨境电商平台为了保护自身数据,采取了更严格的防护措施。这些平台通过屏蔽大陆IP地址或部…

Idea、VS Code 如何安装Fitten Code插件使用

简介 Fitten Code是由非十大模型驱动的AI编程助手,它可以自动生成代码,提升开发效率,帮您调试Bug,节省您的时间。还可以对话聊天,解决您编程碰到的问题。免费且支持80多种语言:Python、C、Javascript、Typ…

python实战(一)——iris鸢尾花数据集分类

一、任务背景 本文是python实战系列专栏的第一篇文章,我们将从分类开始由浅入深逐步学习如何使用python完成常规的机器学习/深度学习任务。iris数据集是经典的机器学习入门数据集,许多分类任务教程都会以这个数据集作为示例,它的数据量是150条…

No.21 笔记 | WEB安全 - 任意文件绕过详解 part 3

(一)空格绕过 原理 Windows系统将文件名中的空格视为空,但程序检测代码无法自动删除空格,使攻击者可借此绕过黑名单限制。基于黑名单验证的代码分析 代码未对上传文件的文件名进行去空格处理,存在安全隐患。相关代码逻…