从CVPR 2024看域适应、域泛化最新研究进展

news2024/10/5 13:57:58

域适应和域泛化一直以来都是各大顶会的热门研究方向。

域适应指:当我们在源域上训练的模型需要在目标域应用时,如果两域数据分布差异太大,模型性能就有可能降低。这时可以利用目标域的无标签数据,通过设计特定方法减小域间差异,来提升模型在目标域的性能。

域泛化与域适应不同,域泛化让模型学会泛化到多个新测试域,而不仅仅是适应一个特定的目标域。这种方法的核心在于利用多源域信息增强模型泛化能力。

本文盘点了 CVPR 2024 有关域适应、域泛化的研究成果 32 篇,帮助大家了解并掌握最新的进展。

论文原文以及开源代码需要的同学看文末

域适应

Improving the Generalization of Segmentation Foundation Model under Distribution Shift via Weakly Supervised Adaptation

第一个针对「Segment Anything」大模型的域适应策略

方法:本文研究了Segment-Anything模型在多个图像分割任务中的泛化能力,并提出了一种适应性方法,该方法不需要访问源数据集且内存开销低,能够通过弱监督有效改善模型的适应性,通过对10个数据集的广泛评估,表明了该方法的有效性。

创新点:

  • 引入自我训练的自适应框架:作者提出了一种基于自我训练的自适应框架,通过弱监督来建立伪预测之间的对应关系,实现对下游数据的自适应。这种方法能够在没有源领域数据的情况下适应下游任务,从而避免了高计算开销和潜在的隐私问题。

  • 低内存占用的模型权重更新方法:作者介绍了一种低内存占用的模型权重更新方法,通过对编码器网络进行LoRA微调,实现了最佳性能。这种方法能够在大型基础模型上进行适应或微调,而无需重新训练整个模型,从而节省了计算资源。

LEAD: Learning Decomposition for Source-free Universal Domain Adaptation

方法:本文介绍了源无关通用领域自适应(SF-UniDA)问题,并提出了一种LEArning Decomposition(LEAD)框架来解决该问题。LEAD框架通过特征分解将特征分为源已知和源未知两部分,并根据与目标原型和源锚点的距离建立实例级别的决策边界,以识别目标私有未知数据。

创新点:

  • 提出了一种新的方法来处理源自由通用领域适应(SF-UniDA)问题。通过特征分解的方法,LEAD能够识别目标私有数据,减少了对手工调整阈值或依赖不稳定聚类的依赖。LEAD还可以作为现有方法的补充,进一步提高性能。

  • LEAD提出了一种实例级伪标签策略,通过与目标原型和源锚点的距离来建立决策边界。实例级决策边界策略在OPDA场景中能够显著提高性能,它考虑了不同类别之间的协变量漂移的不一致性和相同类别中样本的变异性。

域泛化

PracticalDG: Perturbation Distillation on Vision-Language Models for Hybrid Domain Generalization

方法:从算法、基准和指标的角度提高领域泛化的实用性,首先开发了一种新颖的扰动蒸馏(PD)算法,将视觉-语言模型的零样本能力转移到轻量级视觉模型,从而避免了传统微调范式下的大量计算成本;作者引入了从得分、类别和实例(SCI)中挖掘视觉-语言模型知识的扰动;此外,还提出了一个混合领域泛化(HDG)基准和一种新颖的度量H2 -CV来全面评估模型的鲁棒性

创新点:

  • 提出了一种名为SCI-PD的方法,通过从得分、类别和实例三个角度对轻量级视觉模型进行扰动,从而将知识从视觉-语言模型转移给轻量级视觉模型,解决了开放集域泛化问题。

  • 提出了一种名为HDG的基准和一种新的度量指标H2-CV,用于全面评估模型的鲁棒性。

Single Domain Generalization for Crowd Counting

方法:本文研究了单域泛化(SDG)在人群计数中的应用。作者提出了MPCount方案,该方案包括基于密度回归的注意力记忆库、内容错误掩码和注意一致性损失等。此外,为了应对标签模糊的挑战,还提出了基于补丁分类的方法。研究还引入了单域泛化的概念,该方法可以在只有一个源域可用的情况下进行训练。

创新点:

  • MPCount引入了一个注意力内存库(AMB),用于处理密度回归问题。与以往的方法不同,它只使用一个注意力内存库,而不是多个子域分别对应不同的类别。这种设计使得MPCount在狭窄的源分布下仍然有效,并能够对密度回归进行建模。

  • MPCount通过将图像划分为网格来实现基于块的分类作为辅助任务,以减轻标签的歧义性。这种方法可以解决标签模糊的问题,提供可靠的众数信息,从而提高模型对领域变化的鲁棒性。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“CVPR域”获取全部论文+代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1869747.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深入理解 Dubbo:分布式服务框架的核心原理与实践

目录 Dubbo 概述Dubbo 的架构Dubbo 的关键组件 服务提供者(Provider)服务消费者(Consumer)注册中心(Registry)监控中心(Monitor)调用链追踪(Trace) Dubbo 的…

减压电子陀螺MCU电子方案开发服务

指尖陀螺的功能主要是提供一种旋转的娱乐效果,其玩法包括单手拨转、花式旋转等。 指尖陀螺作为一种流行的小型玩具,其主要功能是利用轴承滚动原理达到旋转效果,为使用者提供视觉和触觉上的娱乐体验。玩指尖陀螺的基本方法是使用拇指和其他手…

网络流-EK算法(保姆级教学)

本文引用董晓算法的部分图片。 一些不能带入纸质资料的竞赛,网络流纳入考纲。 因为需要默写,想来也不会考默写dinic这种算法难倒大家,只需要快速敲对EK算法就行了。 EK算法能在O(n*m^2)的复杂度内解决最大流问题,其中最大流就是…

抖音外卖服务商有哪些,盘点这几家正规服务商!

当前,抖音外卖的关注度不断上涨,抖音外卖服务商也逐渐成为了众多创业者心中的理想创业赛道。在此背景下,抖音外卖服务商的入局途径多次引发创业者热议,以抖音外卖服务商有哪些公司为代表的相关话题更是长期位居创业者问题榜单的前…

WordPress Dokan Pro插件 SQL注入漏洞复现(CVE-2024-3922)

0x01 产品简介 WordPress Dokan Pro插件是一款功能强大的多供应商电子商务市场解决方案,功能全面、易于使用的多供应商电子商务平台解决方案,适合各种规模的电商项目。允许管理员创建一个多卖家平台,卖家可以注册账户并在平台上创建自己的店铺,展示和销售自己的产品。提供…

SecureCRT使用SSH登录服务器报错:Key exchange failed

SecureCRT使用SSH登录Ubuntu服务器报错:Key exchange failed 原因: ssh客户端与服务器的公钥协商失败,SecureCRT客户端所指定的秘钥交换算法(KexAlgorithms ),不在服务端支持范围内。可能是服务端的sshd版…

【代码随想录】【算法训练营】【第51天】 [115]不同的子序列 [583]两个字符串的删除操作 [72]编辑距离

前言 思路及算法思维,指路 代码随想录。 题目来自 LeetCode。 day 51,周四,又是不能坚持的一天~ 题目详情 [115] 不同的子序列 题目描述 115 不同的子序列 解题思路 前提: 思路: 重点: 代码实现 …

微信公众平台扫码登录:Spring Boot与JustAuth的完美结合

欢迎来到我的博客,代码的世界里,每一行都是一个故事 🎏:你只管努力,剩下的交给时间 🏠 :小破站 微信公众平台扫码登录:Spring Boot与JustAuth的完美结合 前言前提什么是JustAuthJust…

kali下安装使用蚁剑(AntSword)

目录 0x00 介绍0x01 安装0x02 使用1. 设置代理2. 请求头配置3. 编码器 0x00 介绍 蚁剑(AntSword)是一个webshell管理工具。 官方文档:https://www.yuque.com/antswordproject/antsword 0x01 安装 在kali中安装蚁剑,分为两部分&am…

python获取快手账号列表数据

快手数据获取相对简单访问地址固定且不需要登录token 列表地址获取的固定接口 https://www.kuaishou.com/graphql 发送post请求注意每个快手账号对应的id import time from datetime import datetime import logging import json import pymysql import requests# 创建一个lo…

vue3 【提效】自动导入框架方法 unplugin-auto-import 实用教程

是否还在为每次都需要导入框架方法而烦恼呢? // 每次都需手动导入框架方法 import { ref } from vuelet num ref(0)用 unplugin-auto-import 来帮你吧,以后只需这样写就行啦! let num ref(0)官方示例如下图 使用流程 1. 安装 unplugin-au…

文物管理技术RFID技术

随着科技的不断发展,科技在各个领域都发挥着重要的作用。其中,在文物管理方面,RFID技术的应用正在逐渐引起人们的关注。RFID(Radio Frequency Identification)技术是一种通过无线电信号进行非接触式识别的技术&#xf…

【深度学习】Error: TensorBoard could not bind to port 6006 问题解决

问题描述 在启动TensorBoard时,遇到了端口冲突,如下图所示: 根据提示,出错原因是因为端口已经被占用了,因此我们要结束占用这个端口的进程。 我的系统是Windows系统,并不是Linux,网上大部分方…

基于springboot时装购物系统

设计技术: 开发语言:Java数据库:MySQL技术:SpringbootMybatisvue 工具:IDEA、Maven、Navicat 主要功能: 管理员:首页、个人中心、用户管理、商品分类管理、颜色管理、商品信息管理、商品评价…

以数治税时代来临,企业如何应对?

全电发票是数字经济时代发票的新形态,顺应了数字经济潮流。现如今,国家正全力推动行业数字化进程,预计,2025年将基本实现发票全领域、全环节、全要素电子化,实现税务执法、服务、监管与大数据智能化应用深度融合、高效…

数据库使用笔记

1.mysql数据库频繁访问导致连接超时 解决办法一: 优化查询:检查并优化SQL查询语句,减少不必要的数据库调用。增加连接池大小:如果应用程序使用连接池,可以考虑增加连接池的最大连接数。(注:不能…

Profibus协议转Modbus协议网关模块在船舶中的应用

一、背景 在当今数字化快速发展的时代,船舶作为重要的交通工具之一,也在不断追赶着科技的步伐,实现自身的智能化升级。而在这个过程中,Profibus转Modbus网关(XD-MDPB100)作为关键的一环,扮演着…

主流先进封装技术介绍

主流先进封装技术介绍 先进封装是指封装集成电路 (IC) 以提高性能的多种创新技术。 本质上,就是将传统封装中被延缓的数据传输速度和被损耗的大量功耗,通过技术和结构的创新极大程度的找回。 1. FO 封装 FO封装包括三大类: 核心扇出型&a…

基于SpringBoot的藏区特产销售平台

你好呀,我是计算机学姐码农小野!如果有相关需求,可以私信联系我。 开发语言: Java 数据库: MySQL 技术: SpringBoot框架 工具: MyEclipse 系统展示 首页 个人中心 特产信息管理 订单管…

CSS基础学习记录(6)

目录 1、从最基本的页面开始 2、添加图像/浮层部分 3、位置调整 4、添加动效 4.1、添加浮层动效 4.2、添加背景动画 根据前面css的学习,本篇来实践下前面学习的知识,主要实现如下这样的效果。 下面我们一步步实现上面的效果。 1、从最基本的页面开…