Data-Free Generalized Zero-Shot Learning 中文版

news2025/1/16 11:32:24

摘要

深度学习模型具有从大规模数据集中提取丰富知识的能力。然而,由于涉及到数据版权和隐私问题,数据共享变得越来越具有挑战性。因此,这妨碍了从现有数据向新的下游任务和概念有效转移知识。零样本学习(ZSL)方法旨在通过从基类中转移学习的语义知识来识别新类别。然而,传统的生成式ZSL方法通常需要访问基类的真实图像,并依赖手动注释的属性,这在数据限制和模型可扩展性方面存在挑战。为此,本文解决了一个具有挑战性和实践意义的问题,即无数据零样本学习(DFZSL),其中仅有基于 CLIP 预训练分类器的基类数据可用于零样本分类。具体来说,我们提出了一个用于 DFZSL 的通用框架,由三个主要组成部分组成。首先,为了恢复基础数据的虚拟特征,我们将基类图像的 CLIP 特征建模为基于预训练分类器的 von Mises-Fisher(vMF)分布样本。其次,我们利用 CLIP 的文本特征作为低成本的语义信息,并提出了一个特征语言提示调整(FLPT)方法,进一步调整虚拟图像特征和文本特征。第三,我们使用对齐良好的虚拟图像特征和相应的语义文本特征训练条件生成模型,从而实现了对新类别特征的生成,并实现更好的零样本泛化。我们的框架已在通用 ZSL 的五个常用基准数据集以及基类到新类别 ZSL 的 11 个基准数据集上进行了评估。结果表明了我们方法的优越性和有效性。我们的代码可在 https://github.com/ylong4/DFZSL 上找到。

介绍

深度学习模型的强大之处在于它们能够从大规模数据集中提取丰富的知识,包括视觉特征和语义信息。然而,跨不同公司、机构和国家之间的数据共享变得越来越具有挑战性和敏感性。与数据版权和隐私相关的担忧,特别是在健康和安全等敏感领域,给大规模数据集中的知识顺利传输到新的下游任务和概念中造成了重大障碍。这些挑战阻碍了深度学习模型的广泛利用,并限制了它们在各个领域的潜在影响。受到数据和模型隐私问题日益增长的担忧的启发,特别是在将知识转移到新概念的情境中,==本文解决了无数据零样本学习的问题,即在没有访问任何真实数据的情况下进行零样本学习。==零样本学习(ZSL)解决了利用从基类转移的语义知识来识别新类的挑战。尽管零样本学习取得了显著进展,但大多数零样本学习方法通常需要访问基类的标记图像,无论是用于对齐视觉-语义嵌入还是训练条件生成模型。==不幸的是,由于隐私或版权限制,从基类获取真实数据在现实世界的应用中往往是不切实际的。此外,现有方法严重依赖于手动注释的属性,这在可扩展性和注释难度方面存在挑战。==大规模预训练的视觉语言模型(例如 CLIP)等最近取得了显著的零样本泛化能力。这些模型通过在大量图像-标题对上进行广泛训练,而无需手动注释的属性,就实现了这种能力。然而,有效地将这些模型在弱对齐的图像-标题对上训练的知识转移到下游细粒度零样本分类任务仍然具有挑战性和不足。这主要是由于预训练模型和特定分类任务之间的类别粒度差异所致。Prompt 调整通过向输入添加可学习的提示来解决这个问题。然而,最近的 Prompt 调整方法仍然存在单边对齐的问题,并且依赖于对真实图像的访问。

为此,本文解决了一个具有挑战性和实用性的问题,被称为无数据零样本学习(DFZSL)。在这种情况下,用于零样本分类的唯一可用资源是基于 CLIP 特征的预训练基类分类器。值得注意的是,我们没有访问来自基类或新类的任何真实数据,并且不需要手动属性注释。我们的设置与绝对零样本学习密切相关。然而,他们的方法仍然依赖于手动属性注释,并且在传统和泛化 ZSL 中表现不佳。

所提出的框架由三个主要组件组成。首先,为了恢复基类数据,我们将基类图像的 CLIP 特征建模为从 von Mises-Fisher(vMF)分布中取样的样本,其中可学习的均值(μ)和适当的集中(κ)参数基于预训练分类器。这使我们能够通过从分布中采样来恢复基类数据的虚拟特征。需要注意的是,我们的方法并不恢复原始图像。相反,我们的重点是恢复高级图像特征向量,这更有效并避免了隐私和版权问题。其次,为了连接基类和新类,我们利用 CLIP 的文本编码器获取低成本的语义信息,以通用文本特征的形式,消除了对手动属性注释的需求。我们的框架是通用的,任何视觉语言基础模型都有可能使用。为了增强对下游细粒度零样本分类任务的适应能力,我们引入了一种特征语言提示调整方法。该方法旨在通过调整视觉特征和文本输入来进一步将基类的虚拟图像特征与其对应的文本特征对齐。第三,我们使用良好对齐的虚拟图像特征和相应的语义文本特征训练条件生成模型,使我们能够为新类生成标记数据。然后,通过监督学习实现零样本分类。我们的框架已在用于泛化 ZSL 的五个常用基准测试中进行了评估,以及用于基类到新类泛化的 11 个基准测试中进行了评估。结果表明了我们方法的优越性。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1530435.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MNN Session 创建执行器(六)

系列文章目录 MNN createFromBuffer(一) MNN createRuntime(二) MNN createSession 之 Schedule(三) MNN createSession 之创建流水线后端(四) MNN Session::resize 之流水线编码&am…

element-ui出的treeselect下拉树组件基本使用,以及只能选择叶子节点的功能,给节点添加按钮操作

element-ui出的treeselect下拉树组件基本使用:Vue通用下拉树组件riophae/vue-treeselect的使用-CSDN博客 vue-treeselect 问题合集、好用的树形下拉组件(vue-treeselect的使用、相关问题解决方案)-CSDN博客 需求1:treeselect下拉…

数据结构和算法模块——队列(多例子+图文)

一文帮你看懂队列 什么是线性表为什么要学习线性表,它有什么用处和好处?基本概念分类存储结构结构特点 队列为什么要学习队列?基本概念数据结构基本操作 待填坑 什么是线性表 为什么要学习线性表,它有什么用处和好处?…

【测试开发学习流程】MySQL函数运算(中)(下)

前言: 这些天还要搞毕业论文,东西少了点,大家将就看看QWQ 目录 1 MySQL的数据处理函数 1.1 文本处理函数 1.2 日期与时间函数 1.3 数值处理函数 1.4 系统函数 2 聚集运算 2.1 聚集函数 2.2 流程函数 1 MySQL的数据处理函数 MySQL支…

云手机在海外电商中的应用优势

随着海外市场的不断拓展,电商行业对于高效、安全的工具需求日益增长。在这一背景下,云手机作为一种新型服务,为海外电商提供了强大的支持和便利。云手机对传统物理手机起到了非常好的延展和补充作用,拓展了更广泛的应用场景&#…

windows管理github代码

资料 windows SSH下载github

【数字IC/FPGA】书籍推荐(0)----《Verilog 传奇--从电路出发的HDL代码设计》

在下这几年关于数字电路、Verilog、FPGA和IC方面的书前前后后都读了不少,发现了不少好书,也在一些废话书上浪费过时间。接下来会写一系列文章,把一部分读过的书做个测评,根据个人标准按十分制满分来打分并分享给大家。 定位 书名…

游戏反云手机检测方案

游戏风险环境,是指独立于原有设备或破坏设备原有系统的环境。常见的游戏风险环境有:云手机、虚拟机、虚拟框架、iOS越狱、安卓设备root等。 这类风险环境可以为游戏外挂、破解提供所需的高级别设备权限,当游戏处于这些风险环境下&#xff0c…

<深度学习初识>——《深度学习笔记》

深度学习笔记 一、人工智能简介 1.人工智能发展的重要时间节点 1.1人工智能孕育期 1.2人工智能诞生期 1.3人工智能第一次浪潮的发展 1.4人工智能的第一次寒冬 第一次寒冬主要面临的几个问题: 1.5人工智能第二次浪潮的发展 1.6人工智能的第二次寒冬 1.7人工智能第…

FREERTOS队列集和事件标志组

队列集 一个队列只允许任务间传递的消息为同一种数据类型,如果需要在任务间传递不同数据类型的消息时,那么就可以使用队列集! 作用:用于对多个队列或信号量(信号量本质上也是个队列)进行“监听”&#xff…

python(Django)之登录功能实现

1、创建登陆函数 def login(request):if request.POST:username password username request.POST.get(username)password request.POST.get(password)user auth.authenticate(usernameusername, passwordpassword)if user is not None and user.is_active:auth.login(req…

医药工厂5G智能制造数字孪生可视化平台,推进医药企业数字化转型

医药工厂5G智能制造数字孪生可视化平台,推进医药企业数字化转型。随着科技的不断发展,数字化转型已成为医药企业不可或缺的一部分。5G智能制造医药工厂数字孪生可视化平台作为数字化转型的重要工具,正在逐步改变医药企业的生产方式和管理模式…

MATLAB:函数与数值积分

一、数学函数图像的绘制 clc,clear fh (x)2*exp(-x).*sin(x); Xrange [0,8]; gx (x)3*exp(-x)*0.8.*sin(x); fplot(fh,Xrange,r-*,LineWidth,1.5) hold on grid on fplot(gx,Xrange,b-o,LineWidth,1.5) axis([-0.5,8.5,-0.1,0.85]) legend(fh (x)2*exp(-x).*sin(x),gx (x…

QB PHP 多语言配置

1: 下载QBfast .exe 的文件 2: 安装的时候 ,一定点击 仅为我 安装 而不是 所有人 3: 如果提示 更新就 更新 , 安装如2 4: 如果遇到 新增 或者编辑已经 配置的项目时 不起作用 : 右…

【Linux】编译器-gcc/g++的使用(预处理、编译、汇编、连接)

目录 01.预处理(宏替换) 02.编译(生成汇编) 03.汇编(生成机器可识别码) 04.连接(生成可执行文件或库文件) 05.选项 编译器在编译代码时包含以下四个步骤:1.预处理 2…

读算法的陷阱:超级平台、算法垄断与场景欺骗笔记15_虚拟助手

1. 虚拟助手 1.1. 站在全球视角,这些公司是:亚马逊、脸书、谷歌和苹果 1.1.1. 苹果的Siri 1.1.2. 亚马逊的Alexa 1.1.3. 脸书Messenger应用上的M 1.1.4. 谷歌语音助手Assistant 1.2. 借由人工智能技术,虚拟助手将对用户的个人电子档案、…

机器学习 - 选择模型

接着这一篇博客做进一步说明: 机器学习 - 准备数据 PyTorch moduleExplaintorch.nnContains all of the building blocks for computational graphs (essentially a series of computations executed in a particular way). nn 模块为用户提供了丰富的神经网络组件…

【软件】项目管理工具focalboard使用docker部署

github官方网址 使用宝塔进入docker从官方进行镜像仓库拉去mattermost/focalboard 容器》添加容器》容器名》镜像》暴露端口》加号》添加 注意的是原始容器端口号为8000和9092

Vue使用qrcodejs2实现生成二维码

Vue使用qrcodejs2实现生成二维码示例 业务需求 比如说我们需要对下方的列表数据访问地址列进行生成二维码,扫描后跳转对应的地址。 安装qrcodejs2依赖 npm i qrcodejs2引用 在我们需要使用的页面进行引用qrcodejs2 import QRCode from qrcodejs2定义我们的二维…

业务服务:redisson

文章目录 前言一、配置1. 添加依赖2. 配置文件/类3. 注入redission3. 封装工具类 二、应用1. RedisUtils工具类的基本使用 三、队列1. 工具类2. 普通队列2. 有界队列(限制数据量) 前言 redission是一个开源的java redis的客户端,在其基础上进…