每日学术速递5.10

news2025/1/25 5:04:53

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理  

Subjects: cs.CV

1.ZipIt! Merging Models from Different Tasks without Training

标题:压缩它!无需训练即可合并来自不同任务的模型

作者:George Stoica, Daniel Bolya, Jakob Bjorner, Taylor Hearn, Judy Hoffman

文章链接:https://arxiv.org/abs/2305.03053

摘要:

        典型的深度视觉识别模型能够执行他们接受过训练的一项任务。在这篇论文中,我们解决了一个极其困难的问题,即在没有任何额外训练的情况下,将具有不同初始化的完全不同的模型组合成一个多任务模型,每个模型解决一个单独的任务。模型合并的先前工作将一个模型置换到另一个模型的空间,然后将它们加在一起。虽然这适用于在同一任务上训练的模型,但我们发现这无法解释在不相交任务上训练的模型的差异。因此,我们介绍了“ZipIt!”,这是一种合并两个具有相同架构的任意模型的通用方法,它包含两个简单的策略。首先,为了解决模型之间不共享的特征,我们扩展了模型合并问题,通过定义一个通用的“zip”操作,额外允许在每个模型中合并特征。其次,我们添加了对部分压缩模型直到指定层的支持,自然地创建了一个多头模型。我们发现这两个变化相结合,比之前的工作有了惊人的 20-60% 的改进,使得在不相交任务上训练的模型的合并变得可行。

2.Automatic Prompt Optimization with "Gradient Descent" and Beam Search(CVPR 2023)

标题:使用“梯度下降”和波束搜索进行自动提示优化

作者:Reid Pryzant, Dan Iter, Jerry Li, Yin Tat Lee, Chenguang Zhu, Michael Zeng

文章链接:https://arxiv.org/abs/2305.03495

摘要:

        大型语言模型 (LLM) 作为通用代理已显示出令人印象深刻的性能,但它们的能力仍然高度依赖于通过繁重的试错工作手写的提示。我们针对此问题提出了一个简单且非参数的解决方案,即自动提示优化 (APO),它受数值梯度下降的启发,可以自动改进提示,假设可以访问训练数据和 LLM API。该算法使用小批量数据来形成批评当前提示的自然语言“梯度”。然后通过在梯度的相反语义方向上编辑提示,将梯度“传播”到提示中。这些梯度下降步骤由波束搜索和强盗选择程序引导,可显着提高算法效率。三个基准 NLP 任务和 LLM 越狱检测的新问题的初步结果表明,自动提示优化可以胜过之前的提示编辑技术,并通过使用数据将模糊的任务描述重写为更精确,将初始提示的性能提高多达 31%注释说明。

3.Few-shot In-context Learning for Knowledge Base Question Answering (ACL 2023

标题:用于知识库问答的少样本上下文学习

作者:Tianle Li, Xueguang Ma, Alex Zhuang, Yu Gu, Yu Su, Wenhu Chen

文章链接:https://arxiv.org/abs/2305.01750

摘要:

        由于对各种可能的自然语言问题进行概括的挑战,基于知识库的问答被认为是一个难题。此外,不同知识库之间知识库模式项的异质性通常需要对不同知识库问答 (KBQA) 数据集进行专门培训。为了使用统一的免训练框架处理各种 KBQA 数据集的问题,我们提出了 KB-BINDER,它首次实现了对 KBQA 任务的少样本上下文学习。首先,KB-BINDER利用像Codex这样的大型语言模型,通过模仿一些演示,生成逻辑形式作为特定问题的草稿。其次,KB-BINDER以知识库为基础,将生成的草稿与BM25分数匹配的可执行草稿进行绑定。四个公共异构 KBQA 数据集的实验结果表明,KB-BINDER 仅需少量上下文演示即可实现强大的性能。尤其是在 GraphQA 和 3-hop MetaQA 上,KB-BINDER 甚至可以超越最先进的训练模型。在 GrailQA 和 WebQSP 上,我们的模型也与其他经过全面训练的模型不相上下。我们相信 KB-BINDER 可以作为未来研究的重要基线。我们的代码可在此 https URL 上获得。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/521481.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MLF(中期借贷便利)[Medium-term lending facility],俗称麻辣粉

MLF麻辣粉是什么?简述MLF的作用以及对股市的影响!_哔哩哔哩_bilibili 简述 中期借贷便利(Medium-term lending facility,简称MLF)是中国人民银行提供给商业银行的一种货币政策工具,能够向商业银行提供一…

BFT 最前线 | 谷歌举办 I/O 23 发布会,对标必应,百度搜索小范围公测对话功能,盖茨称AI利大于弊

文 | BFT机器人 01 谷歌举办 I/O 23 发布会,以 AI 为核心发布一系列新工具 北京时间 5 月 11 日凌晨,谷歌举办了今年的 Google I/O 开发者大会。比起去年,强调「整合全球信息,使人人都能从访问中受益」的使命,谷歌 CEO…

xxl-job2.1.2定时任务使用教程

一、配置xxl-job页面调度器 1.先下载2.1.2版本xxl-job的源码,地址:https://github.com/xuxueli/xxl-job/tree/2.1.2 2.下载完,用idea打开,配置jdk1.8、配置maven, 3.导入MySQL数据库xxl-job的一些表,导入的…

点餐小程序实战教程02-店铺数据源设计

我们上一篇分析了点餐小程序的功能点,有了功能就好往下开发了。低代码开发是模型驱动开发,啥是模型驱动呢?就是要求你先设计好表结构,然后再开发页面。 那要如何设计数据源呢?其实就是将信息分门别类的拆分到不同的数据源中。要拆分到哪些数据源是由我们页面上的信息决定…

真题详解(索引查询)-软件设计(七十三)

外观、装饰、策略模式代码详解-软件设计(七十二)https://blog.csdn.net/ke1ying/article/details/130628033 关于一个类的静态成员描述中,不正确的是: 错误:一个类的静态数据成员值不可以被修改。 java语言特性是有________和 垃…

django基础知识详解

1. 安装与介绍 课程特点: 学习难度大,大部分内容需要理解并记忆文件较多易混淆学习阶段注重框架使用,工作阶段注重实现业务逻辑综合应用强,小练习少 1.1 Django框架的介绍 2005年发布,采用Python语言编写的开源web框架早期的时…

JVM垃圾收集器(二)

目录 1、Serial 2、ParNew 3、Parallel Scavenge 4、Serial Old 5、Parallel Old 6、CMS 1、为什么需要两次“stop the world” 2、CMS的并发带来的问题 3、CMS的触发时机 4、CMS的缺陷 5、为什么CMS用清除算法 7、G1 1、Region 2、设计Region的意义 3、G1的三种…

【C++】——类与对象(中)+日期类对象的实现

文章目录 1. 前言2. 类的6个默认成员函数3. 构造函数4. 析构函数5. 拷贝构造函数6. 运算符重载6.1 赋值运算符重载 7. const成员8. 取地址及const取地址操作符重载9. 日期类对象的完整实现9.1 头文件9.2 源文件9.3 测试代码 10. 结尾 1. 前言 今天我们来继续学习C类与对象&…

网安学习路线!史上最详细没有之一

我经常会看到这一类的问题: 学习XXX知识没效果;学习XXX技能没方向;学习XXX没办法入门; 给大家一个忠告,如果你完全没有基础的话,前期最好不要盲目去找资料学习,因为大部分人把资料收集好之后&…

医日健自助售药机

产品概述 医日健智能自助售药机整合了信息化管理技术 、远程监控管理技术 、自动化技术、人脸识别技术等多种先进技术 ,结合药品零售的特点 ,通过在医院、诊所、药店、便利店、社区等场所部署药品自助售药机 ,为用户提供自选购药服务&#x…

深度学习用于医学预后-第二课第三周1-3节-生存模型,生存函数

文章目录 生存模型生存函数有效生存函数 生存模型 本周,我们将讨论生存模式(survival model)。生存模型是一种特殊的模型我们关心事件发生的时间,比如从治疗到复发的时间,或者从诊断到死亡的时间 这是一个常见的问题…

GPT自动理解视频、法律顾问、大模型安全围栏

每天都要浏览大量AI相关新闻,是不是感到信息量爆炸,有效信息少,无从看起? 这么多新产品和新工具,到底哪些是真正是有价值的,哪些只是浮躁的热点? 想参与AI产品和工具的开发,但苦于…

READNE.md 语法

标题列表引用代码块链接图片分割线表格 1. 标题 #一级标题 ##二级标题 ###三级标题 ####四级标题 #####五级标题 ######六级标题 2. 列表 2.1 有序列表 直接在前面写数字序号: 1. a 2. bc 3. 1234 2.2 无序列表 有三种方式:""、"-&q…

操作系统--需要背的概念性知识

第一章 操作系统概述 操作系统的作用:1)控制和管理整个计算机系统的硬件和软件资源,并合理地组织调度计算机的工作和资源的分配;2)提供给用户和其他软件方便的接口和环境;3)实现了对计算机资源…

(GPT3)Language Models are Few-Shot Learners论文阅读

论文地址:https://arxiv.org/pdf/2005.14165v4.pdf 摘要 最近的工作表明,通过对大量文本语料库进行预训练,然后对特定任务进行微调,许多 NLP 任务和基准测试取得了实质性进展。 虽然在体系结构中通常与任务无关,但此方…

4月份公司测试部门来了个卷王之王,让人奔溃...

前段时间公司新来了个同事,听说大学是学的广告专业,因为喜欢IT行业就找了个培训班,后来在一家小公司干了三年,现在跳槽来我们公司。来了之后把现有项目的性能优化了一遍,服务器缩减一半,性能反而提升4倍&am…

【AI面试】Anchor based 、 Anchor free 和 no anchor 的辨析

深度学习的目标检测算法,通常会在输入图像中采样大量的区域,然后判断这些区域中是否包含我们感兴趣的目标,并调整(回归)区域边界,从而更准确地预测目标的真实边界框(ground-truth bounding box&…

【高数+复变函数】傅里叶积分

文章目录 【高数复变函数】傅里叶积分2. 傅里叶积分2.1 复数形式积分公式2.2 三角形式 上一节: 【高数复变函数】傅里叶级数 【高数复变函数】傅里叶积分 2. 傅里叶积分 在上一节中,我们知道了傅里叶级数的基本知识,其中,周期为…

【MATLAB第31期】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理回归问题MATLAB代码实现(持续更新)

【MATLAB第31期】基于MATLAB的降维/全局敏感性分析/特征排序/数据处理回归问题MATLAB代码实现(持续更新) 本文敏感性分析主要分析回归问题,下期分析分类问题(fisher、rf、arf、nca等)。 一、降维方法(回归) 常见的降…

【动态规划】0-1背包问题

概述 0-1背包问题是一种经典的动态规划问题,它的基本形式是:有一个背包,容量为 C C C,有 n n n 个物品 i i i,每个物品 i i i 的重量为 w i w_i wi​,价值为 v i v_i vi​。现在要从这 n n n 个物品…