每日学术速递2.13

news2025/1/1 23:55:41

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

Subjects: cs.CV、cs.AI、cs.CL

1.Deep Intra-Image Contrastive Learning for Weakly Supervised One-Step Person Search

标题:深度图像内对比学习用于弱监督的单步人物搜索

作者:Jiabei Wang, Yanwei Pang, Jiale Cao, Hanqing Sun, Zhuang Shao, Xuelong Li

文章链接:https://arxiv.org/abs/2302.04607v1

项目代码:https://github.com/jiabeiwangtju/dicl

摘要:

        弱监督人像搜索的目的是在仅有人像边界框注释的情况下进行联合行人检测和重新识别(re-id)。最近,对比学习的理念被初步应用于弱监督人像搜索,其中两种常见的对比策略是基于记忆的对比和图像内对比。我们认为,目前的图像内对比是浅层的,它受到了空间级和遮挡级差异的影响。在本文中,我们提出了一个使用连体网络的新型深度图像内对比学习。两个关键模块是空间不变量对比(SIC)和遮挡不变量对比(OIC)。SIC在暹罗网络的两个分支之间进行多对一的对比,在暹罗网络的一个分支中进行密集预测对比。通过这些多对一和密集的对比,SIC倾向于学习鉴别性的尺度不变量和位置不变量特征,以解决空间层面的差异。OIC通过掩蔽策略加强了特征的一致性,以学习闭塞不变的特征。我们分别在CUHK-SYSU和PRW两个人物搜索数据集上进行了大量的实验。我们的方法在弱监督的一步式人物搜索方法中取得了最先进的性能。我们希望我们简单的图像内对比学习能够为弱监督的人物搜索提供更多的范式。

2.Efficient Attention via Control Variates(ICLR 2023)

标题:通过控制变量实现高效的注意力

作者:Lin Zheng, Jianbo Yuan, Chong Wang, Lingpeng Kong

文章链接:https://arxiv.org/abs/2302.04542v1

项目代码:https://github.com/hkunlp/efficient-attention

摘要:

        基于随机特征的注意力(RFA)是对softmax注意力的有效近似,具有线性运行时间和空间复杂性。然而,RFA与传统的softmax注意力之间的近似差距还没有得到很好的研究。在以往RFA的进展基础上,我们通过控制变量的视角来描述这一差距,并表明RFA可以分解为序列中每个元素的多个控制变量估计的总和。这个新框架显示,通过操纵每个控制变量,可以从RFA中恢复精确的softmax注意力。此外,它允许我们开发一种更灵活的控制变量形式,从而形成一种新的注意力机制,在保持线性复杂度的同时大大降低了近似差距。广泛的实验证明,我们的模型在视觉和语言任务上都优于最先进的高效注意力机制。

3.Reversible Vision Transformers(CVPR 2022)

标题:可逆式视觉变形器

作者:Karttikeya Mangalam, Haoqi Fan, Yanghao Li, Chao-Yuan Wu, Bo Xiong, Christoph Feichtenhofer, Jitendra Malik

文章链接:https://arxiv.org/abs/2302.01660v2

项目代码:https://github.com/facebookresearch/SlowFast

摘要:

        我们提出了可逆视觉变换器,这是一种用于视觉识别的内存高效架构设计。通过将GPU的内存需求与模型的深度解耦,可逆视觉变换器能够以高效的内存使用方式扩大架构的规模。我们将两种流行的模型,即视觉变形器和多尺度视觉变形器,调整为可逆变体,并在模型大小和图像分类、物体检测和视频分类的任务上进行了广泛的基准测试。在模型复杂度、参数和准确度大致相同的情况下,可逆视觉变换器实现了高达15.5倍的内存占用,证明了可逆视觉变换器作为硬件资源有限的训练机制的有效骨干的前景。最后,我们发现重新计算激活的额外计算负担对于更深层次的模型来说是可以克服的,其吞吐量可以比非可逆的对应模型增加2.3倍。完整的代码和训练好的模型可在https://github.com/facebookresearch/slowfast。一个更简单、易于理解和修改的版本也可在https://github.com/karttikeya/minREV。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/343817.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

模型解释性:SHAP包的使用

本篇博客介绍另一种事后可解释性方法:SHAP(SHapley Additive exPlanation)方法。 1. Shapley值理论 Shapley值是博弈论中的一个概念,通过衡量联盟中各成员对联盟总目标的贡献程度,从而根据贡献程度来进行联盟成员的利益分配,避免…

机器学习-特征工程

特征工程是将原始数据转换为更好的代表预测模型的潜在问题的特征的过程,从而提高了对未知数据的预测准确性。特征抽取文本特征抽取,sklearn的API是sklearn.feature_extraction.text.CountVectorizer。(1).英文分词from sklearn.fe…

Smart Finance 热启动创世开启,参与质押瓜分SMART资产

在2023年开年以来,加密市场开始迎来复苏,以BTC、ETH等为代表的主流加密资产迎来普涨,虽然相较于2021年顶峰时期相比仍存在一定的差距,但市场的回暖正在带动加密行业在2023年的复苏。而随着DigiDaigaku登录美国体育盛会“超级碗”&…

手把手教你抢BingChatGPT免费体验名额!

✅作者简介:CSDN内容合伙人、信息安全专业在校大学生🏆 🔥系列专栏 :ChatGPT-Bing 📃新人博主 :欢迎点赞收藏关注,会回访! 💬舞台再大,你不上台,永…

关于docker在CentOS6与CentOS7的安装教程

CentOS 6 安装docker步骤yum install -y epel-releaseyum install -y docker-io安装后的配置文件:/etc/sysconfig/docker启动Docker后台服务:service docker startdocker version验证CentOS 7 安装docker步骤感兴趣的可以看看docker安装文档https://docs…

企业如何解决内容审核的安全风险?

内容审核是什么?随着互联网的快速发展,与之而来的是信息爆炸式增长,而且这些互联网信息良莠不齐,其发布者也鱼龙混杂,常常混入很多不良或者违规违法信息,例如涉政、涉黄、暴恐、违禁、不良价值观、广告等。…

使用FirewallD构建动态防火墙(9)

预备知识 firewalld 是新一 Linux 代防火墙工具,它提供了支持网络 / 防火墙区域 (zone) 定义网络链接以及接口安全等级的动态防火墙管理工具。它也支持允许服务或者应用程序直接添加防火墙规则的接口。在 Linux 历史上已经使用过的防火墙工具包括:ipfwa…

redis命令大量超时 连接数突增

大家好,我是烤鸭: 今天分享一个线上线上redis命令大量超时,连接数突增的问题。由于不是我这边的业务,只能根据事后的一些客观数据进行分析。 配置: ​ redis 4.0 3主3从,总内存36G。 ​ 业务服务7台…

跨平台代码编写工具 Visual Studio Code

随着生产力的提高,生产工具也在不断的提高。 今天就介绍 目前最好用的工具 Visual Studio Code。 1. 入门 Visual Studio Code 是一款轻量级但功能强大的源代码编辑器,可在您的桌面上运行,适用于 Windows、macOS 和 Linux。它内置了对 Java…

蓝库云|制造业转型不可或缺的“PLM”的作用和真正价值

PLM是产品生命周期管理,是一种应用于在单一地点的企业内部、分散在多个地点的企业内部,以及在产品研发领域具有协作关系的企业之间的,支持产品全生命周期的信息的创建、管理、分发和应用的一系列应用解决方案,它能够集成与产品相关…

如何短期通过PMP考试?

PMP考试相比较其他考试,首先就是PMP是不卡通过率的,所以只要你做题的正确率上去了,那是有很大机会能通过考试的!想要短期通过PMP考试,就得每天安排具体的任务,规划好,按计划去做。抓紧时间&…

QFramework框架学习

主要学习内容TypeEventSystemActionKitTimer类1、TypeEventSystem-适用于一个条件触发,多个组件响应的情况例如:动物园系统中,点击肉食动物按钮,动物园中有肉食属性的动物都进行显示。步骤:1、动物自身脚本上进行判断是…

产品的可持续发展

如今,产品的可持续性对于取得商业成功至关重要。越来越多的政府提出了相关的合规性要求,普通消费者也在翘首期待符合可持续性发展理念的产品上市。然而,许多企业面临的首要问题是如何确定他们的产品是否满足可持续性发展的要求。 毕竟&#x…

后量子 KEM 方案:LAC

参考文献: Lyubashevsky V, Peikert C, Regev O. On ideal lattices and learning with errors over rings[J]. Journal of the ACM (JACM), 2013, 60(6): 1-35.Lu X, Liu Y, Zhang Z, et al. LAC: Practical ring-LWE based public-key encryption with byte-leve…

java -数据结构,List相关基础知识,ArrayList的基本使用,泛型的简单、包装类介绍

一、 预备知识-泛型(Generic) 1.1、泛型的引入 比如:我们实现一个简单的顺序表 class MyArrayList{public int[] elem;public int usedSize;public MyArrayList(){this.elem new int[10];}public void add(int key){this.elem[usedSize] key;usedSize;}public …

Ethercat系列(4)Twcat3激活配置过程的协议分析

广播设置ESC的4个端口环路设置从-》主广播读从站状态机实际状态主-》从从-》主广播清除接收错误计数器0x300且读应用层状态从-》主顺序读从站基本信息,链路层配置与状态从-》主广播读从站状态机状态主-》从从-》主顺序写ESC控制模式,广播读从站状态主-》…

一、图机器学习导论【CS224W】(Datawhale组队学习)

开源内容:https://github.com/TommyZihao/zihao_course/tree/main/CS224W 子豪兄B 站视频:https://space.bilibili.com/1900783/channel/collectiondetail?sid915098 斯坦福官方课程主页:https://web.stanford.edu/class/cs224w 文章目录前…

C++中的标准输入和输出

一、 C 输入输出的含义 在C语言中我们的输入和输出都是以printf和scanf进行操作的。他们都是函数。在C中的我们的输入输出都是以终端为对象的,即从键盘输入数据,运行结果输出到显示器屏幕上。从操作系统(Linux)的角度看,每一个与主机相连的输…

RKE2部署高可用Rancher v2.7.1

先决条件 注意修改主机名,不要有冲突 第一个server节点安装 官方文档的描述感觉对于新手来说太不友好了,建议以下链接都看一下。Rancher新老文档都建议看一下,不然刚刚入门很蒙。 RKE2快速开始:https://docs.rke2.io/zh/install…

html+css综合练习一

文章目录一、小米注册页面1、要求2、案例图3、实现效果3.1、index.html3.2、style.css二、下午茶页面1、要求2、案例图3、index.html4、style.css三、法国巴黎页面1、要求2、案例图3、index.html4、style.css一、小米注册页面 1、要求 阅读下列说明、效果图,进行静…