【深度学习】语义分割(FCN网络/DeepLabV3网络)学习记录

news2025/1/23 1:10:13

up主学习视频地址

【语义分割前言】 https://www.bilibili.com/video/BV1ev411P7dR/?share_source=copy_web&vd_source=49d7ac1e09d11f99978e8cf36c8bad41

这个up主真的很厉害,宝藏up主呀!!!

常见语义分割评价指标

 转置卷积(Transposed Convolution)

主要是起到上采样的作用

强调:

  • 转置卷积不是卷积的逆运算
  • 专职卷积也是卷积

 先进行填充后再正常进行卷积操作

在Pytorch官方有给出转置卷积的函数ConvTranspose2d — PyTorch 2.2 documentation

groups:是否使用组卷积,默认为1即传统卷积

dilation:是否使用空洞卷积,默认为1即传统卷积

FCN网络

首个端对端的针对像素级预测的全卷积网络

特征层为21个通道,将tunnel为21的层进行上采样后得到和原图一样大小的特征图,对这21个值进行softmax处理就可以得到该像素针对于每个类别的预测概率,取概率最大的类别作为该像素的预测值。     将全连接层转为卷积层

其实在全连接层中展开后使用权重计算最终值的效果与将权重作为卷积核进行卷积层处理是一致的,只是使用卷积层会保留高宽的信息

FCN-32S   ==>  32倍上采样还原至原图大小

FCN-16S   ==>  16倍上采样还原至原图大小

FCN-8S   ==>  8倍上采样还原至原图大小

FCN-32S

在转置卷积层中学习率是冻结的,可能是上采样倍数过大因而作者称是否冻结对结果影影响不大 

FCN-16S

融合了来自VGG16中的MaxPooling4的信息,MaxPooling4是将原图缩放至原来的16倍

FCN-8S

融合了来自VGG16中的MaxPooling3与MaxPooling4的信息,结构中的相加是指对应特征层中的元素进行相加。

膨胀/空洞卷积(Dilated convolution)

作用:

  • 增大感受野
  • 保持原输入特征图的高W宽H

连续堆叠多个膨胀卷积时需要注意的问题:gridding effect(高层膨胀卷积中有部分没有使用到底层中的信息,在感受野内用没有被使用到的元素,当间隔为1时代表都使用到了)

堆叠多个膨胀卷积时膨胀系数的确定:

  •   计算公式
  • 将dilation rates设置为锯齿结构,如[1,2,3,1,2,3]
  • 公约数不能大于1

Pytorch官方实现的FCN网络结构

up主源码解析:

【FCN源码解析(Pytorch)】 https://www.bilibili.com/video/BV19q4y1971Q/?share_source=copy_web&vd_source=49d7ac1e09d11f99978e8cf36c8bad41

up主提供的源码地址:GitHub - WZMIAOMIAO/deep-learning-for-image-processing: deep learning for image processing including classification and object-detection etc.

DeepLabV3网络

相比于DeepLabV2有以下特点:

  • 引入了Multi-grid(针对于膨胀卷积,为Resnet结构中的膨胀系数)
  • 改进ASPP结构(提高获取多尺度上下文的能力)
  • 移除CRFs后处理

在连级模型中multi-grid设置为[1,2,1]

但是对于ASPP结构则设置为[1,2,4]

 根据论文中对于ASPP model的消融实验中可以发现在COCO数据集上进行预训练mIOU会提升大致3个点

Pytorch官方实现的DeepLabV3网络结构

【DeepLabV3源码讲解(Pytorch)】 https://www.bilibili.com/video/BV1TD4y1c7Wx/?share_source=copy_web&vd_source=49d7ac1e09d11f99978e8cf36c8bad41

正在学习语义分割中,如有不当之处欢迎指出!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1549906.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

强化安全防护:升级桌面网管软件提升医院信息系统安全

在当今信息化发展的时代,医院作为重要的医疗服务机构,对终端设备的管理尤为重要。然而,随着国家对医院终端管理的要求日益提高,传统的桌面网管软件已经难以满足现代医院的需求。针对这一现状,升级桌面网管软件已成为当…

喜报|珈和科技入选2023“武汉未来之星TOP100”

近日,由清科创业旗下创业与投资资讯平台——“投资界”发起评选的《2023武汉未来之星TOP100》《2023武汉龙门榜TOP30》两大企业评选结果在武汉市举办的“科创点金汇投融资对接会”上隆重揭晓,珈和科技成功入选“2023武汉未来之星TOP100”榜单。 此次榜…

Unity角色多人同步

1.位置同步和状态同步&#xff1a;需要同步的节点上挂载脚本&#xff1a; gameObject.AddComponent<SyncTransform>(); ; //同步gameObject.GetComponent<SyncTransform>().syncId SyncUtilFunc.GetRoleSyncId(PlayerData.Instance.PlayerId); //同步gameObject.G…

PyTorch----torch.nn.init.kaiming_normal_

神经网络为什么要进行权重初始化&#xff1f; 神经网络进行权重初始化的目的在于促进网络的有效训练和收敛。正确的权重初始化可以帮助缓解梯度消失或梯度爆炸等问题&#xff0c;并且有助于加速训练过程。以下是权重初始化的几个重要原因&#xff1a; 1. **避免梯度消失或梯度…

锂离子电池SOC预测 | python代码实现基于Basisformer时间序列锂离子电池SOC预测研究

概述 基于Basisformer时间序列的锂离子电池SOC(State of Charge,即电池的荷电状态)预测研究,是一项结合深度学习和时间序列分析的前沿技术。该研究的目的是利用Basisformer模型对锂离子电池的SOC进行准确预测,从而提高电池使用效率,延长电池寿命,并优化能源管理系统。 …

unity学习(73)——服务器异常--无法处理 123类型的数据包

服务器发送回的数据包&#xff0c;客户端根本读不出来&#xff0c;type都读不出来&#xff0c;拖了三天&#xff0c;把客户端翻了个底朝天&#xff0c;发现客户端一点问题都没有&#xff01; 所有的问题不是unity的模型问题&#xff0c;就是socket网络通信中断&#xff01; 1…

大文件压缩多个小文件

压缩 压缩后 压缩后&#xff0c;符合上传大小规范

矢量(向量)数据库

矢量(向量)数据库 什么是矢量数据库&#xff1f; 在人工智能领域&#xff0c;大量的数据需要有效的分析和处理。随着我们深入研究更高级的人工智能应用&#xff0c;如图像识别、语音搜索或推荐引擎&#xff0c;数据的性质变得更加复杂。这就是矢量数据库发挥作用的地方。与存…

Kafka详细教程(一)

总体目录 1、什么是消息队列 消息队列&#xff0c;英文名&#xff1a;Message Queue&#xff0c;经常缩写为MQ。从字面上来理解&#xff0c;消息队列是一种用来存储消息的队列 。来看一下下面的代码 // 1.创建一个保存字符串的队列Queue<String> queue new LinkedList&…

ssm小区车库停车系统开发mysql数据库web结构java编程计算机网页源码eclipse项目

一、源码特点 ssm小区车库停车系统是一套完善的信息系统&#xff0c;结合springMVC框架完成本系统&#xff0c;对理解JSP java编程开发语言有帮助系统采用SSM框架&#xff08;MVC模式开发&#xff09;&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模…

开源博客项目Blog .NET Core源码学习(12:App.Application项目结构分析)

开源博客项目Blog的App.Application项目主要定义网站页面使用的数据类&#xff0c;同时定义各类数据的增删改查操作接口和实现类。App.Application项目未安装Nuget包&#xff0c;主要引用App.Core项目的类型。   App.Application项目的顶层文件夹如下图所示&#xff0c;下面逐…

k8s入门到实战(七)—— 回顾:使用yaml文件配置pv、pvc、configmap部署mysql服务

实战&#xff1a;部署 mysql 服务 回顾加深 pv、pvc、configmap 删除所有 deployment、pv、pvc、configmap、StorageClass创建一个 nsf 挂载目录给 mysql mkdir -p /nfs/data/mysql创建 yaml 文件mysql-server.yaml # 创建pv apiVersion: v1 kind: PersistentVolume metadat…

Day22 LeedCode:235.二叉搜索树的最近公共祖先 701.二叉搜索树的插入操作 450.删除二叉搜索树的结点

235. 二叉搜索树的最近公共祖先 给定一个二叉搜索树, 找到该树中两个指定节点的最近公共祖先。 百度百科中最近公共祖先的定义为&#xff1a;“对于有根树 T 的两个结点 p、q&#xff0c;最近公共祖先表示为一个结点 x&#xff0c;满足 x 是 p、q 的祖先且 x 的深度尽可能大&…

基于Arduino IDE 野火ESP8266模块 一键配网 的开发

一、配网介绍 ESP8266 一键配网&#xff08;也称为 SmartConfig 或 FastConfig&#xff09;是一种允许用户通过智能手机上的应用程序快速配置 ESP8266 Wi-Fi 模块的方法&#xff0c;而无需手动输入 SSID 和密码。为了实现这一功能&#xff0c;则需要一个支持 SmartConfig 的智能…

[flask]执行上下文的四个全局变量

flask上下文全局变量&#xff0c;程序上下文、请求上下文、上下文钩子 -- - 夏晓旭 - 博客园 (cnblogs.com) 执行上下文 执行上下文&#xff1a;即语境&#xff0c;语意&#xff0c;在程序中可以理解为在代码执行到某一行时&#xff0c;根据之前代码所做的操作以及下文即将要…

校园app开发流程-uniapp开发-支持APP小程序H5-源码交付-跑腿-二手市场-交友论坛等功能,学校自由选择!

随着科技的不断发展&#xff0c;智慧校园系统和跑腿外卖小程序已经成为当今社会的热门话题。作为未来的重要趋势之一&#xff0c;科技在教育领域中的应用越来越广泛。本文将探讨智慧校园系统和跑腿外卖小程序的开发过程&#xff0c;并阐述如何利用科技“育”见未来 一、智慧校…

基于云计算的前端资源管理系统的设计与实现

hello宝子们...我们是艾斯视觉擅长ui设计和前端开发10年经验&#xff01;希望我的分享能帮助到您&#xff01;如需帮助可以评论关注私信我们一起探讨&#xff01;致敬感谢感恩&#xff01; 随着互联网的快速发展&#xff0c;前端资源管理成为了一个重要的课题。本文旨在设计并实…

elementui日期时间选择框自定义组件

1.需求场景 业务中需要&#xff0c;日期选择框方便客户对日期的选择&#xff08;比如近5天&#xff0c;本周&#xff0c;本月&#xff0c;本年等等&#xff09;&#xff0c;并按小时展示。 2.组件代码MyDateTimeChange.vue <template><el-date-pickerv-model"…

【ESP32S3 Sense接入语音识别+MiniMax模型对话】

1. 前言 围绕ESP32S3 Sense接入语音识别MiniMax模型对话展开&#xff0c;首先串口输入“1”字符&#xff0c;随后麦克风采集2s声音数据&#xff0c;对接百度在线语音识别&#xff0c;将返回文本结果丢入MiniMax模型&#xff0c;进而返回第二次结果文本&#xff0c;实现语言对话…

Linux 系统 docker搭建LNMP环境

1、安装nginx docker pull nginx (默认安装的是最新版本) 2、运行nginx docker run --name nginx -p 80:80 -d nginx:latest 备注&#xff1a;--name nginx 表示容器名为 nginx -d 表示后台运行 -p 80:80 表示把本地80端口绑定到Nginx服务端的 80端口 nginx:lates…