语义分割新范式：上海 AI Lab 联合北邮、商汤提出StructToken

语义分割新范式：上海 AI Lab 联合北邮、商汤提出StructToken

news2026/2/9 2:43:40

来源：投稿作者：xin
编辑：学姐

Motivation

本文将当前语义分割的方法分为两类，一类是静态逐像素分类方法（static per-pixel classification），另一类为动态逐像素分类方法（dynamic per-pixel classification）。目前基于静态逐像素分类的方法，仅通过探索像素表示的信息融合，扩大每个像素的接受域，使尾部的卷积网络可以更精细的逐像素分类，生成更精细的得分图。然而这类工作侧重于提高逐像素的表示能力，并没有考虑图像中的结构信息。基于动态分类的方法虽然可以通过分类器与特征映射的交互更新可学习标记，提升模型性能。虽然此类方法分类器是动态的，但它仍然作用于每个像素，逐像素分类的性质不会改变，依旧破坏了图像中的结构信息。故本文跳出原有的语义分割框架，从更拟人化的角度考虑语义分割任务。提出了带有结构先验的StructToken。与静态逐像素分类和动态逐像素分类方法不同的是，本文的方法根据结构先验为每个类生成一个粗略的掩码，然后再逐步细化该掩码。（图1展示了三种语义分割方式）

Method

下面介绍本文提出的三种Interaction方法。

Cross-Slice Extraction：本方法是自注意力的一种拓展，将backbone提取的特征F映射为v、k，将可学习结构Token S映射为q。通过交叉注意力机制学习新的结构化Token $S{}'$ 。计算公式如下：

Self-Slice Extraction：本方法与Cross-Slice Extraction类似，只不过先将特征与结构Token S在通道维度上进行拼接，然后采用自注意力机制学习新的结构化Token $S{}'$ 。

Result:

表1、表2、表3展示了提出模型在3个数据集上的结果，可以看出，在3个数据集上都达到了SOTA的结果。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“500”获取AI必读高分论文合集

（包含语义分割等多个细分方向）

码字不易，欢迎大家点赞评论收藏！

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/418264.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Ubuntu备份与恢复

Ubuntu备份与恢复

Ref: create-backup-image-of-running-ubuntu Linux中我们有权访问所有系统文件，因此，最简单且直接的备份方法是将整个根目录打包： sudo su tar -cpzf /path/to/backup.tar.gz --exclude/tmp --one-file-system /其中-cpzf 表示建立压缩归档…

阅读更多...

MQTT 持久会话与 Clean Session

MQTT 持久会话与 Clean Session

1. 会话（session） 我们将从客户端向服务端发起 MQTT 连接请求开始，到连接中断直到会话过期为止的消息收发序列称之为会话。会话是服务端和客户端的一个连接，进行消息交互前必须先建立会话。 2. 会话的生命周期 MQTT v3.1.1会话…

阅读更多...

003_螺旋矩阵

003_螺旋矩阵

力扣54和59题 54.顺时针打印矩阵题目： 思路：将矩阵分为若干层，首先打印最外层的元素，然后一直往里打印对于每层，从左上方开始以顺时针的顺序遍历所有元素。假设当前层的左上角位于(top,left)，右下角位于…

阅读更多...

Axios请求（对于ajax的二次封装）——Axios取消请求、请求体编码

Axios请求（对于ajax的二次封装）——Axios取消请求、请求体编码

Axios请求（对于ajax的二次封装）——Axios取消请求、请求体编码知识回调（不懂就看这儿！）场景复现核心干货axios取消请求AbortControllerCancelToken deprecated请求体编码浏览器qs库编码数据ES6库方法node.jsQuery stri…

阅读更多...

【神经网络】tensorflow实验3--NumPy科学计算库

【神经网络】tensorflow实验3--NumPy科学计算库

目录 1. 实验目的 2. 实验内容 3. 实验过程题目一： ① 代码 ② 实验结果题目二： ① 代码 ② 实验结果题目三： 编辑 ① 代码 ② 实验结果 5. 实验小结 ① 实验过程中遇到了哪些问题，你是如何解决的？ …

阅读更多...

Android引入Apollo(阿波罗)

Android引入Apollo(阿波罗)

程序猿日常记Android项目引入Apollo(阿波罗)上源码 apollo开发分支应用 Apollo(阿波罗)客户端会管理好应用的后台GraphQL数据之前网络请求使用RetrofitOkHttp 改成使用ApolloOkHttp 引入 1.对应的module的build.gradle中添加 id("com.apollographql.apollo3&qu…

阅读更多...

【计算机系统概论Yale.patt】第一章

【计算机系统概论Yale.patt】第一章

文章目录1. 计算机是简单部件的系统组合1.1 计算机组成1.1.1 编码体系1.1.2 晶体管构建微处理器1.1.3 冯诺依曼机1.1.4 LC-3机(冯诺依曼机实现)1.1.5 LC-3编程机器语言编程汇编语言编程输入输出信息问题两个重要机制栈和数据转换示例：计算器1.2 两个重要理念1.2.1 抽…

阅读更多...

Linux基础篇（三）常见指令

Linux基础篇（三）常见指令

目录一、创建文件和目录二、命令详解 0. 命令和选项 1. ls命令 2. cd命令 3. touch命令 4. mkdir命令 5. tree命令 6. rmdir命令 7. rm命令 8. man 9. nano 10. cat命令 11. cp 命令 12. mv 命令 13. echo命令 14. more命令 15. less命令 16. Ctrl C 17. head 命令 18. tail…

阅读更多...

台灯的种类有哪些？国内热门护眼灯品牌推荐

台灯的种类有哪些？国内热门护眼灯品牌推荐

台灯是我们日常生活中常见的电器之一，台灯不仅可以为人们照明，还可以用来家居装饰，根据人们不用的需求，台灯的种类也很多，有书房台灯、读写台灯、工艺台灯。书房台灯：灯光的局部照明效果，以书写…

阅读更多...

禅道OpenAI更新至1.2版本，超多实用功能惊喜上线！

禅道OpenAI更新至1.2版本，超多实用功能惊喜上线！

广受欢迎的禅道OpenAI插件近日成功发布，截至目前已更新至1.2版本。截至本版本发布，禅道OpenAI已经拥有了神奇海螺（ChatGPT聊天）、需求润色、任务润色、Bug润色及本次的需求一键生成用例功能，仍有更多实用的新功能正在…

阅读更多...

Sentinel 工作主流程

Sentinel 工作主流程

Overview 在 Sentinel 里面，所有的资源都对应一个资源名称以及一个 Entry。Entry 可以通过对主流框架的适配自动创建，也可以通过注解的方式或调用 API 显式创建；每一个 Entry 创建的时候，同时也会创建一系列功能插槽（…

阅读更多...

2023年第1季社区Task挑战赛开启，等你来战！

2023年第1季社区Task挑战赛开启，等你来战！

社区Task挑战赛是面向社区开发者开展的代码或教程征集活动。该挑战赛为社区中热爱FISCO BCOS及周边组件的开发者提供了探索区块链技术、挑战技术难题的舞台。该挑战赛去年在社区成功举办了3季，共吸引了数百名开发者报名。前3季都有哪些有趣的作品？ 在…

阅读更多...

【图数据挖掘】— 子图同构问题、单射函数和双射函数、同构（isomorphic）和同态（homomorphism）

【图数据挖掘】— 子图同构问题、单射函数和双射函数、同构（isomorphic）和同态（homomorphism）

子图同构问题子图同构（Subgraph Isomorphism）是指在图论中，两个图之间是否存在一种关系，使得其中一个图的顶点集合和边集合可以通过对应的方式映射到另一个图的顶点集合和边集合上，且保持原来的边和顶点的关系不变。…

阅读更多...

如何设计一个安全的对外接口？

如何设计一个安全的对外接口？

对外接口安全措施的作用主要体现在两个方面，一方面是如何保证数据在传输过程中的安全性，另一方面是数据已经到达服务器端，服务器端如何识别数据。 1. 数据加密数据在传输过程中是很容易被抓包的，如果直接传输，数据可…

阅读更多...

elasticsearch 核心概念

elasticsearch 核心概念

1.近实时（Near Real Time,NRT） elasticsearch 是一个近实时的搜索和分析平台，这意味着从索引文档到可搜索文档都会有一段微小的延迟（通常是1s以内）。这种延迟主要是因为 elasticsearch 需要进行数据刷新和索引更新。 …

阅读更多...

远程代码执行渗透与防御

远程代码执行渗透与防御

远程代码执行渗透与防御1.简介2.PHP RCE常见函数3.靶场练习4.防御姿势1.简介远程代码执行漏洞又叫命令注入漏洞命令注入是一种攻击，其目标是通过易受攻击的应用程序在主机操作系统上执行任意命令。当应用程序将不安全的用户提供的数据（表单、cookie…

阅读更多...

jQuery 基础入门速成上篇

jQuery 基础入门速成上篇

jQuery 是目前使用最广泛的 javascript 函数库。提到 jQuery 你可能知道这句英文 ： ———— Write Less，Do More ( 写的少，做的多 ) 引入jQuery jQuery是一个函数库，一个 js 文件，页面可以使用 script标签引入使用&a…

阅读更多...

JVM 类加载器

JVM 类加载器

文章目录1 类加载器1.1 类加载器介绍1.2 类加载器的加载规则1.2 类加载器类型总结2 双亲委派模型2.1 双亲委派模型介绍2.2 双亲委派模型的执行流程2.3 双亲委派模型的好处回顾一下类加载过程：加载->连接->初始化。其中连接又分为：验证->准备-&…

阅读更多...

指针太难？手把手教你理解指针（传参、函数指针）

指针太难？手把手教你理解指针（传参、函数指针）

目录前言一、数组和指针的参数 1.一维数组传参 2.二维数组传参 3.一级指针传参 4.二级指针传参二、函数指针 1.函数的地址 2.函数指针的形式 3.函数指针的使用三、加深理解，两段有趣的代码前言之前的一篇文章讲到了指针的概念、指针和数组的关系&am…

阅读更多...

【机器学习】随机森林预测泰坦尼克号生还概率

【机器学习】随机森林预测泰坦尼克号生还概率

目录前言： 【一】数据清洗及可视化介绍知识点环境准备数据特征介绍检查数据相关系数缺失值偏态分布数值化和标准化离群点实验总结一【二】分类模型训练及评价介绍环境准备模型评估模型选择性能度量实验总结二【三】随机森…

阅读更多...

推荐文章

最新文章