论文笔记:基于并行注意力 UNet的裂缝检测方法

news2024/9/24 3:29:28

0 简介

论文:基于并行注意力 UNet的裂缝检测方法(Parallel Attention Based UNet for Crack Detection);
发表:2021年发表在《计算机研究与发展》上。

1 问题分析

问题:裂缝图像中存在噪声、光线、阴影等因素干扰;
解决方法:比较流行的解决方案是嵌入注意力机制以抑制各种干扰;
缺点:现有的注意力机制大都采用串行结构,能有效抑制大部分干扰,但仍受到明亮噪声的影响,导致效果降低;
本文的方法:设计一种并行注意力机制,从空间和通道2个维度抑制干扰,通过并行结构融合两者特征以获取更具互补性的裂缝特征,有效抑制了各种干扰。

2 具体方案

在这里插入图片描述
三个部分组成:

  • 网络的编码层,由卷积和池化组成;
  • 网络的解码层,由卷 积、反卷积和sigmoid函数组成;
  • 注意力模块。

在这里插入图片描述
并行注意力机制分为三条线来说明。
第一条线:

  • 输入:特征图 F ∈ R H × W × C F \in \mathbb{R}^{H \times W \times C} FRH×W×C
  • 输出:特征图 Q ∈ R H × W × C Q \in \mathbb{R}^{H \times W \times C} QRH×W×C
  • 处理:
    – 利用最大池化提取全局特征 M ∈ R 1 × 1 × C M \in \mathbb{R}^{1 \times 1 \times C} MR1×1×C
    – 利用下面的公式计算得到权重图 N ∈ R 1 × 1 × C N \in \mathbb{R}^{1 \times 1 \times C} NR1×1×C,第 i i i通道的权重值 e i e_i ei为:
    e i = σ ( ∑ j = 1 k w i j z i j ) , z i j ∈ Ω i k e_{i}=\sigma\left(\sum_{j=1}^{k} w_{i}^{j} z_{i}^{j}\right), z_{i}^{j} \in \Omega_{i}^{k} ei=σ(j=1kwijzij),zijΩik
    其中 w i j w_{i}^{j} wij表示第 i i i个通道的第 j ∈ [ 1 , k ] j \in [1, k] j[1,k]个权重参数, Ω i k \Omega_{i}^{k} Ωik表示第 i i i个通道的 k k k个相邻通道全局特征的集合;【这个公式有两个问题:(1) w i j w_{i}^{j} wij是通过学习得到的吗?(2) z i j ∈ Ω i k z_{i}^{j} \in \Omega_{i}^{k} zijΩik是从 Ω i k \Omega_{i}^{k} Ωik中任取一个,还是遍历所有特征点,由于作者没有提供源代码,我们只能猜,如果是遍历,我觉得这个公式还应该有一层循环才对。

第二条线:

  • 输入:特征图 F ∈ R H × W × C F \in \mathbb{R}^{H \times W \times C} FRH×W×C
  • 输出:特征图 P ∈ R H × W × C P \in \mathbb{R}^{H \times W \times C} PRH×W×C
  • 处理:
    – 利用最大池化得到 F m a x s ∈ R H × W × 1 F_{\mathrm{max}}^s \in \mathbb{R}^{H \times W \times 1} FmaxsRH×W×1;
    – 利用平均池化得到 F a v g s ∈ R H × W × 1 F_{\mathrm{avg}}^s \in \mathbb{R}^{H \times W \times 1} FavgsRH×W×1;
    – 权重图 H H H:将这2个单通道的特征图结合,生成一个权重图【具体怎么做的没说?

第三条线:

  • 输入:特征图 P ∈ R H × W × C P \in \mathbb{R}^{H \times W \times C} PRH×W×C和特征图 Q ∈ R H × W × C Q \in \mathbb{R}^{H \times W \times C} QRH×W×C
  • 输出:特征图 G ∈ R H × W × C G \in \mathbb{R}^{H \times W \times C} GRH×W×C
  • 处理:融合。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/452552.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

中睿天下亮相2022电力行业信息化年会

4月14日-15日,以“低碳数字新动力,电力转型新发展”为主题的2022电力行业信息化年会在长沙成功召开。中睿天下作为网络安全企业受邀出席参展,展示多样性网络安全产品、电力行业解决方案及相关应用成果。 作为能源电力领域的行业盛会和学术交流…

垃圾回收器(一)

垃圾回收器概述 垃圾收集器没有在规范中进行过多的规定,可以由不同的厂商、不同版本的JVM来实现。 由于JDK的版本处于高速迭代过程中,因此Java发展至今已经衍生了众多的GC版本。 从不同角度分析垃圾收集器,可以将GC分为不同的类型。 GC分…

设计模式简谈

设计模式是我们软件架构开发中不可缺失的一部分,通过学习设计模式,我们可以更好理解的代码的结构和层次。 设计原则 设计原则是早于设计方法出现的,所以的设计原则都要依赖于设计方法。这里主要有八个设计原则。 推荐一个零声学院免费教程&…

阳光万里,祝你上岸——免统考在职研究生

什么是在职研究生 在职研究生,是国家计划内,以在职人员身份,部分时间在职工作,部分时间在校学习的研究生教育的一种类型。在职攻读硕士方式有三种: 1.双证非全日制研究生:为普通高等教育研究生学历&#x…

QGIS--开发OpenSCENARIO动态场景(三)--制作动态场景

一、添加scenario&#xff0c;carla的环境变量 export CARLA_ROOT/path/to/your/carla/installation export SCENARIO_RUNNER_ROOT/path/to/your/scenario/runner/installation export PYTHONPATH$PYTHONPATH:${CARLA_ROOT}/PythonAPI/carla/dist/carla-<VERSION>.egg ex…

如何利用工时表来帮助项目管理做得更完善?

项目管理是一项复杂的任务&#xff0c;需要协调各种资源以确保项目按时交付。其中一个关键方面是管理各个员工工时。工时表软件是一种可以帮助企业记录各个员工工作时效的工具&#xff0c;而且还可以帮助项目管理者记录和跟踪项目成员的时间。那么如何利用工时表来帮助项目管理…

如何配置静态路由?这个实例详解交换机的静态路由配置

一、什么是静态路由 静态路由是一种路由的方式&#xff0c;它需要通过手动配置。静态路由与动态路由不同&#xff0c;静态路由是固定的&#xff0c;不会改变。一般来说&#xff0c;静态路由是由网络管理员逐项加入路由表&#xff0c;简单来说&#xff0c;就是需要手动添加的。…

相空间相关概念以及轨迹生成

在时间序列分析中&#xff0c;相位轨迹也被广泛应用于提取隐藏在数据中的结构信息。例如&#xff0c;在人类活动识别任务中&#xff0c;通过构建不同活动对应的相位轨迹&#xff0c;可以揭示活动间的相似性和差异性&#xff0c;从而有助于设计有效的分类方法。 相空间&#xff…

Java每日一练(20230420)

目录 1. 罗马数字转整数 &#x1f31f; 2. 电话号码的字母组合 &#x1f31f;&#x1f31f; 3. 排列序列 &#x1f31f;&#x1f31f;&#x1f31f; &#x1f31f; 每日一练刷题专栏 &#x1f31f; Golang每日一练 专栏 Python每日一练 专栏 C/C每日一练 专栏 Java每…

java基础——Map

Map 第一章 Map集合 1.1 概述 Java提供了专门的集合类用来存放键值对关系的对象&#xff0c;即java.util.Map接口。 我们通过查看Map接口描述&#xff0c;发现Map接口下的集合与Collection接口下的集合&#xff0c;它们存储数据的形式不同&#xff0c;如下图。 Collection中…

Java学习之匿名内部类(非常重要)

目录 一、匿名内部类介绍 基本语法 二、举例说明 1.传统方式实现接口 2.使用匿名内部类进行简化 一、匿名内部类介绍 1.匿名内部类也是类 2.匿名内部类也是内部类 3.匿名内部类没有名字&#xff08;名字存在于JVM中&#xff0c;不会显示出来&#xff09; 4.匿名内部类同时…

Pytorch深度学习笔记(八)处理多维度特征的输入

目录 1.概述 2. 处理多维度特征的输入 注&#xff1a;不同的激活函数&#xff08;sigmoid函数&#xff09;&#xff0c; 绘制不同的图表 推荐课程&#xff1a;07.处理多维特征的输入_哔哩哔哩_bilibili 1.概述 一个八维数据集&#xff1a; 数据集&#xff0c;每一行称为一个…

完整搭建 SpringCloud 项目

目录 1、数据库表结构设计 2、项目结构设计搭建 &#xff08;1&#xff09;创建父工程&#xff08;SpringBoot 类型&#xff09; &#xff08;2&#xff09;其他功能模块搭建 &#xff08;3&#xff09;创建 eureka &#xff08;4&#xff09;创建common 模块 &#xff08;5&…

jmeter常用组件1

常用的组件 常用的组件1&#xff0c;配置元件 1.HTTP请求默认值2.HTTP信息头管理器3.HTTP Cookie管理器4.用户自定义变量5.csv数据导入 2&#xff0c;集合点3&#xff0c;后置处理器 1.debug处理器2.json提取器 本文永久更新地址: 1&#xff0c;配置元件 1.HTTP请求默认值 在…

ASP.NET Core MVC 从入门到精通之Razor语法

随着技术的发展&#xff0c;ASP.NET Core MVC也推出了好长时间&#xff0c;经过不断的版本更新迭代&#xff0c;已经越来越完善&#xff0c;本系列文章主要讲解ASP.NET Core MVC开发B/S系统过程中所涉及到的相关内容&#xff0c;适用于初学者&#xff0c;在校毕业生&#xff0c…

PyQt在界面/子界面中添加横线

问题&#xff1a; 自己写个了处理数据的小程序&#xff0c;想要在不同的部分之间做个区域划分&#xff0c;使用实线或者虚线标记。 找了几个界面方法&#xff1a;1.使用画图QPainter,画所需要的线。 2.添加按钮&#xff0c;将按钮设置成线的形式 这两种方式都不适合我这个界…

着色器语言 GLSL (opengl-shader-language)入门大全

GLSL 中文手册 基本类型: 类型说明void空类型,即不返回任何值bool布尔类型 true,falseint带符号的整数 signed integerfloat带符号的浮点数 floating scalarvec2, vec3, vec4n维浮点数向量 n-component floating point vectorbvec2, bvec3, bvec4n维布尔向量 Boolean vectori…

广告投放ROI如何计算?实现广告效果最大化

大家好&#xff01;我是东哥&#xff0c;一个专注于跨境电商的小商家。今天&#xff0c;我要和大家分享一下广告投放中的一个关键指标——ROI&#xff0c;也就是投资回报率。这个指标非常重要&#xff0c;因为它可以帮助我们评估广告的效果&#xff0c;让我们知道我们的广告投放…

SpringCloud消息驱动——Stream

Stream 本专栏学习内容来自尚硅谷周阳老师的视频 有兴趣的小伙伴可以点击视频地址观看 SpringCloud Stream是SpringCloud的消息驱动&#xff0c;之前的微服务学的好好的&#xff0c;为什么会突然冒出一个这么个东西来增加我们的学习量呢&#xff1f; 一听到消息&#xff0c;那…

u盘文件不见但还占用容量文件办法?

将U盘插入电脑的时候为什么会出现“U盘文件突然不见但还占用空间”的提示框呢?遇到这个问题时又该怎么处理呢?别慌&#xff0c;下面小编就来给大家演示一下子解决U盘文件突然不见但还占用空间这个问题的解决方法。 u盘文件不见但还占用容量文件办法&#xff1f; u盘文件不见但…