2024年显著性检测部分论文及代码汇总(3)

news2024/12/23 15:52:55

ICML

Size-invariance Matters: Rethinking Metrics and Losses for Imbalanced Multi-object Salient Object Detection

code
Abstacrt:本文探讨了显著性检测中评价指标的尺寸不变性,尤其是当图像中存在多个大小不同的目标时。作者观察到,当前的指标是尺寸敏感的,较大的对象被关注,较小的对象被忽略。针对此,本文提出一种通用方法,分别评估每个显著对象,有效缓解尺寸的不平衡。此外,作者进一步开发了一个针对这一目标的优化框架。

Spider: A Unified Framework for Context-dependent Concept Segmentation

code
Abstacrt:上下文独立与显著性检测相结合。本文提出一个统一的模型Spider,只有一组参数,训练一次。在图像-掩码组提示符驱动的概念过滤器的帮助下,Spider能理解并区分各种强上下文依赖的概念,从而准确地捕捉提示符的意图。
在这里插入图片描述

TCSVT

Learning Adaptive Fusion Bank for Multi-modal Salient Object Detection

code
Abstacrt:针对多模态显著性检测问题,即MSOD,本文提出adaptive fusion bank,专注于解决MSOD的五个主要挑战,即center biasscale variationimage clutterlow illuminationthermal crossover。为对多模态输入自适应地选择合适的融合方案,引入自适应集成模块,形成自适应融合bank,嵌入到层级中,以充分融合不同的源数据。此外,还设计了一个间接交互引导模块,通过对高层语义信息和底层空间细节的跳跃集成精确检测显著目标。
在这里插入图片描述

TII

MINet: Multi-scale Interactive Network for Real-time Salient Object Detection of Strip Steel Surface Defects

code
Abstacrt:针对目前参数大、计算成本高、推理速度慢等问题,本文提出多尺度交互模块,即MI,采用深度卷积和点卷积分别独立提取并交互融合不同尺度的特征。在此模块基础上,提出轻量级的多尺度交互网络,即MINet,对表面缺陷的工业物件进行实时显著目标检测。
在这里插入图片描述

TMM

Alignment-Free RGBT Salient Object Detection: Semantics-guided Asymmetric Correlation Network and A Unified Benchmark

code
Abstacrt:目前需手动对齐多模态,本文首次在没有手动对齐的情况下训练网络。具体说,提出一个语义引导的非对称关联网络,即SACNet,由两部分组成:1)非对称关联模块,利用语义语义引导注意力建模非对齐显著区域的跨模态相关性;2)关联特征采样模块,根据RGB特征对热力图特征进行采样,进行多模态特征集成。除此之外,作者构建了一个基准数据集,即UVT2000,该数据集包含直接从各种真实场景中获取的2000对RGB和热图像对,无手动对齐,以促进无对齐RGB-T SOD的研究。
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1894584.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Elasticsearch集群部署(上)

目录 前言 一. 环境准备 二. 实施部署 三. 安装配置head监控插件 (只在第一台es部署) 四. Kibana部署(当前还是在第一台es部署) 五. 安装配置Nginx反向代理 六. Logstash部署与测试 下篇:Elasticsearch集群部…

汽配企业MES管理系统的四大应用场景

在当今快速迭代的汽车工业领域,一家位于繁华工业园区的中型汽配制造企业正经历着前所未有的变革。该企业,作为汽车发动机零部件的重要供应商,其客户网络遍布国内外,与多家知名汽车制造商保持着紧密的合作关系。然而,随…

WordPress主题大前端DUX v8.7源码下载

全新:用户注册流程,验证邮箱,设置密码 新增:列表显示小视频和横幅视频 新增:文章内容中的外链全部增加 nofollow 新增:客服功能中的链接添加 nofollow 优化:产品分类的价格显示

JavaScript中的this指向

1. 全局环境下的this 在全局环境中(在浏览器中是window对象,在Node.js中是global对象),this指向全局对象。 console.log(this window); // 在浏览器中为true console.log(this.document ! undefined); // true,因为…

测试引擎模拟接口实战

在上一章的内容中,我简单介绍了整个微服务的各个子模块,还封装了一些工具类。 当然,若还没完成上次内容的也可以点击右侧的传送门------传送门 EngineApplication 在开发测试引擎模拟接口之前,还需要给xxx-engine创建一个Sprin…

盛元广通打造智慧校园实验室安全管理系统

盛元广通智慧校园实验室安全管理系统以安全为重点,构建由学校、二级单位、实验室组成的三级联动的实验室安全多级管理体系、多类用户角色,内置教育部标准检查表,支撑实验室相关业务过程的智慧管理。实现通过PC端/手机移动端开展检查工作、手机…

上位机图像处理和嵌入式模块部署(mcu项目1:实现协议)

【 声明:版权所有,欢迎转载,请勿用于商业用途。 联系信箱:feixiaoxing 163.com】 这种mcu的嵌入式模块理论上都是私有协议,因为上位机和下位机都是自己开发的,所以只需要自己保证上、下位机可以通讯上&…

【SQL】⼀棵 B+树能存储多少条数据

B树的存储容量取决于多个因素,包括树的阶(即每个节点的最大子节点数)、键的大小和每个节点的容量。计算一棵B树能存储多少条数据,通常需要了解以下参数: 节点大小:一般情况下,节点大小等于数据…

2024Datawhale-AI夏令营——机器学习挑战赛——学习笔记

#ai夏令营#datawhale#夏令营 Day1:入门级demo运行 这个其实比较简单,按照操作来做就行了,特征工程和调参暂时都没有做,后续的才是重头戏。 Day2:正式比赛开始 赛题:数据挖掘赛道——利用机器学习方法根据给定的特征判断PROTACs…

选微调、RAG还是微调+RAG?

RAG技术是一种结合了检索与生成的方法。它通常依赖于两个核心组件:一个大型语言模型(如GPT-3)和一个检索系统(如向量数据库)。RAG先使用检索系统从大量数据中检索出相关信息,然后将这些信息提供给语言模型&…

python自动化内存管理

引用 在编程中,引用是指用来标识、访问或操作某个对象的值的标识符或变量。我们可以将引用看作是对象的别名,通过引用可以操作对象,包括读取、修改和传递对象的值。 举例来说,假设我们有一个字符串对象name,我们可以创…

Kafka集群部署(手把手部署图文详细版)

1.1.1 部署zookpeer 在node02下载并解压zookeeper软件包 cd /usr/local wget https://archive.apache.org/dist/zookeeper/zookeeper-3.4.6/zookeeper-3.4.6.tar.gz 或者:scp cat192.168.28.100:/home/cat/zookeeper-3.4.6.tar.gz /tmp(注意目录&#xf…

AI:开发者的超级助手,而非取代者

AI:开发者的超级助手,而非取代者 引言 在这个日新月异的科技时代,人工智能(AI)已悄然渗透到我们生活的方方面面,尤其是在软件开发领域,它正以一种前所未有的方式改变着我们的工作方式。作为一名…

【产品经理】订单处理11-订单修改场景梳理

为了应对订单修改的场景,电商ERP系统应该如何设计相应模块? 电商ERP系统,经常遇到需要修改订单的情况,修改订单主要以下几种场景: 一、修改商品 修改商品,包括对正常商品的换货、以及对赠品的增删改。 1…

《米小圈日记魔法》边看边学,轻松掌握写日记的魔法!

在当今充满数字化娱乐和信息快速变迁的时代,如何创新引导孩子们学习,特别是如何培养他们的写作能力,一直是家长和教育者们关注的焦点。今天就向大家推荐一部寓教于乐的动画片《米小圈日记魔法》,该系列动画通过其独特的故事情节和…

web的学习和开发

这个使同步和异步的区别 今天主要就是学了一些前端,搞了一些前端的页面,之后准备学一下后端。 我写的这个项目使百度贴吧,还没有写er图。 先看一下主界面是什么样子的。 这个是主界面,将来后面的主要功能点基本上全部是放在这个上…

电气-伺服(4)CANopen

一、CAN Controller Area Network ,控制器局域网,80年的德国Bosch的一家公司研发可以测量仪器直接的实时数据交换而开发的一款串行通信协议。 CAN发展历史 二、CAN 的osi 模型 CAN特性: CAN 的数据帧 三、CANopen 什么是CANopen CANopen 的网络模型 …

Python28-7.1降维算法之LDA线性判别分析

线性判别分析(Linear Discriminant Analysis, LDA)是一种用于模式识别和机器学习的分类和降维技术。LDA通过找到能最大化类别间方差和最小化类别内方差的投影方向,实现样本的降维和分类。 LDA的基本思想 LDA的核心思想是通过线性变换将数据…

[数据库原理]事务

如有错误,欢迎指正!!! 期末考了冲突可串行化

qt6 获取百度地图(一)

需求分析: 要获取一个地图, 需要ip 需要根据ip查询经纬度 根据经纬度查询地图 另外一条线是根据输入的地址 查询ip 根据查询到的ip查地图‘ 最后,要渲染地图 上面这这些动作,要进行http查询: 为此要有三个QNet…