【提示学习论文】AAPL: Adding Attributes to Prompt Learning for Vision-Language Models

news2024/9/24 19:19:13

AAPL: Adding Attributes to Prompt Learning for Vision-Language Models(2024CVPR)

  • 问题:在unseen class上,性能提升有限
  • 解决:在提示学习中引入对抗性标记嵌入adversarial token embedding, 将低层次视觉增强特征与高层次类别信息解耦,解决传统零样本学习技术中的数据增强问题。
  • AdTriplet损失函数

对比CoCoOp和APPL

在这里插入图片描述
在这里插入图片描述

  • 1、2:类别
  • A、B:不同的随机增强
  • pull:对图像进行不同的随机增强后,即时希望图像有所不同,但它们仍然是同一个类别。因此增量元标记通过将相同类别的增量原标记拉近,来学习相似的属性特征。
  • push:对于不同类别的图像,它们的增量元标记应该学习到不同的属性特征。因此需要embedding中将它们推开来学习。

动机

meta token不能有效的捕捉语义信息
提出 delta meta token

  • 需要两个类别
  • 两种随机增强(从SimCLR提出的14种无重复增强方法种随机选择两种)

对抗性三重损失

在这里插入图片描述

constraints-2

  • Δpai 1A
  • 正对 Δpai 2A:不同类别,相同增强
  • 反对 Δpai 1B:相同类别,不同增强

在这里插入图片描述

constraints-4

![[AAPLg5.png]]

总损失

![[AAPLg6.png]]

实验

base to new 76.01

总结

  • 在CoCoOp上的改进,在原本的meta-net中,增加了Adtriplet loss。通过在两个类别,两种随机增强之间计算,更新meta-net。
  • 然后将meta token加入到Learnable prompt里面,和CoCoOp一样

疑问

为什么这样做能达到解耦的效果?

  • 增量元标记Δmeat tokens:从同一类别不同增强的图像中相减得到,主要捕捉图像增强的变化(低层次特征差异,与类别的高层语义信息无关)
  • 使得增量元标记可以专注于增强引入的低层次特征,而非类别本身的特征

对抗三重损失的作用?

  • 拉近同一类别的不同增强版本
  • 推开不同类别的增量元标记,进一步区分类别之间的特征
  • 帮助低层次的视觉特征(亮度、颜色)与高层次的语义特征(类别)之间,建立清晰的界限
  • 使得模型学会增强特征与类别特征的区分能力,有效将两者解耦

可学习提示?

  • 最后将增量元标记中的属性特定偏差引入到learnable prompt中,此时增量元标记包含低层次增强特征,让提示学习可以专注于高层次类别信息。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2070756.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SOMEIP_ETS_060: SD_Discover_Port_and_IP

测试目的: 验证设备(DUT)能够响应测试器发出的多播FindService消息,并返回一个单播OfferService消息,列出所有必要的IP地址和端口,以满足与DUT的所有可能通信需求。 描述 本测试用例旨在检查DUT是否能够…

清理linux的buff/cache缓存

通过free -m命令,查看内存占用率。 如果buff/cache 占用内存过高的话,执行以下命令 sync && echo 1 > /proc/sys/vm/drop_caches sync && echo 2 > /proc/sys/vm/drop_caches sync && echo 3 > /proc/sys/vm/drop_ca…

文字怎么生成二维码扫码展示?文本活码在线生成的3步操作技巧

现在很多人会将文本信息用生成二维码的方式来展现,通过二维码来分享内容能够有效的提升内容的传播效率,简化其他人获取信息的流程。只需要通过扫码就能在手机上预览内容,更加符合现在人们的生活习惯,而且这种方式可以降低制作者的…

bedtools安装与使用(v2.31.1)生物信息学工具29

01 背景 bedtools:一个用于基因组算术的强大工具集 总体而言,bedtools 工具集是一个多功能的工具包,可用于广泛的基因组分析任务。其中最广泛使用的工具能够进行基因组算术运算,即在基因组上执行集合论操作。例如,be…

前端实现投影坐标和地理坐标系(CGCS2000)转换

前言 地理坐标系和投影坐标系是地理信息系统(GIS)和制图学中用于描述地球表面位置的两种不同的参考系统。它们在使用方式和应用场景上有显著的区别。 1、什么是地理坐标系和投影坐标系? 1.1、地理坐标系 地理坐标系是基于地球的三维球面模…

虚拟机安装centos7-桥接模式

1、打开虚拟机,点击文件,选择新建虚拟机 2、选择典型,点击下一步 3、选择稍后安装操作系统,点击下一步 4、选择系统类型及版本,点击下一步,因centos7是Linux操作系统,且是64位的,所以…

隐藏的艺术:滥用 404 页面的新 Magecart 活动

介绍 一项新的、复杂的、隐蔽的 Magecart 网页窃取活动已针对 Magento 和 WooCommerce 网站展开。该活动的部分受害者与食品和零售行业的大型组织有关。 根据我们发现的证据,该活动已经持续了几周,在某些情况下甚至更长。该活动采用了一种我们以前从未遇到过的高级隐藏技术…

Linux 内核源码分析---组播/策略路由选择

在 Linux 实现中,组播路由选择不像单播路由选择那样可以由内核单独处理,组播守护程序种类繁多,如 mrouted 和 pimd,它们分别基于距离矢量组播路由选择协议(Distance Vector Multicast Routing Protocol,DVM…

《在数字化时代筑牢软件服务的稳定性防线》

📢博客主页:https://blog.csdn.net/2301_779549673 📢欢迎点赞 👍 收藏 ⭐留言 📝 如有错误敬请指正! 📢本文由 JohnKi 原创,首发于 CSDN🙉 📢未来很长&#…

transform解题reserve

1.64位无壳,拖入ida检查。 选中函数按n键可以更改名称,便于分析和利用 。 重点: 2.分析加密过程,理解用于后续脚本编写。 str2以下表对应的元素作为索引遍历flag的每个元素赋值给str1数组,之后与新的str1每个元素异或…

数分基础(02)销售趋势分析

文章目录 销售趋势分析1. 数据集2. 销售趋势3. 步骤3.1 数据读取与预处理:3.2 计算按月、季度、年度的总销售额 4. 分析工具:Python 或 Excel5. Python5.1 Global_Superstore2.xlsx 文件位置5.2 读取数据集并检查其基本信息5.3 绘制趋势图来观察销售额的…

掌握C语言文件操作

1. 什么是文件 磁盘上的文件就是文件。 然而在程序设计中,我们所谈的文件有两种,一种是程序文件,另一种是数据文件(从文件功能的角度来分类的) 文件名 一个文件要有一个唯一的文件标识,以便用户识别和引用…

金蝶云星空开发简单账表《物料年采购入库报表》

文章目录 业务背景业务需求方案设计详细设计测试业务背景 系统现有功能不支持查询过去一年内所有物料的入库数,需要人工导出,然后再汇总。 业务需求 可以查询所有物料的入库数,多个物料,单个物料,多个组织,单个组织的入库数,以及支持查询入库数大于某个阈值。 方案设…

燃气灶行业分析、淘宝平台销售分析

内容:1.燃气灶(不含集成灶)整体行业分析 2.淘宝平台销量分析 3.针对性建议(涉及商业信息就略) 一、基本情况 (一)产品定义: 以液化石油气(液态)、人工煤…

DRF——router路由,parser解析器

文章目录 路由解析器1.JSONParser2.FormParser3.MultiPartParser4.FileUploadParser 路由 在之前进行drf开发时,对于路由我们一般进行两种配置: 视图继承APIView from django.urls import path from app01 import viewsurlpatterns [path(api/users/, …

趣味算法------尾部零的个数(C语言,python双重解法)

目录 题目描述&#xff1a; 解题思路&#xff1a; 具体代码&#xff1a; 注意&#xff1a; 题目描述&#xff1a; 给出数字 n(0<n<1000000)&#xff0c;计算出 n 阶乘尾部零的个数。 输入输出格式 输入格式 一个整数。 输出格式 一个整数。 输入输出样例 输入 11 输…

技术分享-商城篇-用户订单管理(十五)

前言 在前面的文章中&#xff0c;我们详细阐述了商品模块、购物模块、支付模块等B2B2C&#xff08;Business-to-Business-to-Consumer&#xff09;电商中核心基础模块&#xff0c;接下来我们来聊一下基础模块中最后一个环节订单模块&#xff0c;订单模块属于购物体系闭环内容&…

C语言典型例题50

《C程序设计教程&#xff08;第四版&#xff09;——谭浩强》 例题4.2 使用do……while语句循环求1234……100&#xff1b; 代码&#xff1a; //《C程序设计教程&#xff08;第四版&#xff09;——谭浩强》 //例题4.2 使用do……while语句循环求1234……100&#xff1b;#incl…

Axure RP实战:打造高效滑块验证码

Axure RP在验证码设计中的应用(滑块拖动) 前言 在数字化时代&#xff0c;验证码已成为保护用户账户安全和防止恶意攻击的重要工具。 它不仅提高了系统的安全性&#xff0c;还增加了用户对平台的信任度。 然而&#xff0c;验证码的设计并非易事&#xff0c;它需要在安全性和…

适用于 Windows 10 的最佳数据恢复免费软件是什么?

有没有适用于 Windows 10 的真正数据恢复免费软件&#xff1f;这篇文章将讨论这个话题&#xff0c;并分享什么是适用于 Windows 10/11/8.1/8/7/Vista/XP 的最佳数据恢复工具。 有没有适用于 Windows 10 的真正免费的数据恢复软件&#xff1f; 丢失重要数据&#xff0c;无论是由…