每日学术速递5.24

news2025/1/9 15:19:40

CV - 计算机视觉 |  ML - 机器学习 |  RL - 强化学习 | NLP 自然语言处理 

Subjects: cs.CV

1.Reprompting: Automated Chain-of-Thought Prompt Inference Through Gibbs Sampling

标题:重新提示:通过 Gibbs 采样的自动思维链提示推理

作者:Weijia Xu, Andrzej Banburski-Fahey, Nebojsa Jojic

文章链接:https://arxiv.org/abs/2305.09993

摘要:

        我们介绍了 Reprompting,这是一种迭代采样算法,无需人工干预即可搜索给定任务的思维链 (CoT) 配方。通过 Gibbs 抽样,我们推断出对一组训练样本始终有效的 CoT 方法。我们的方法使用先前采样的解决方案迭代地对新食谱进行采样,作为父母提示来解决其他训练问题。在五个需要多步推理的 Big-Bench Hard 任务中,Reprompting 的性能始终优于零样本、少样本和人工编写的 CoT 基线。重新提示还可以促进知识从较强模型转移到较弱模型,从而显着提高较弱模型的性能。总体而言,与之前使用人工编写的 CoT 提示的最先进方法相比,Reprompting 带来了高达 +17 点的改进。

2.DoReMi: Optimizing Data Mixtures Speeds Up Language Model Pretraining

标题:DoReMi:优化数据混合加速语言模型预训练

作者:Sang Michael Xie, Hieu Pham, Xuanyi Dong, Nan Du, Hanxiao Liu, Yifeng Lu, Percy Liang, Quoc V. Le, Tengyu Ma, Adams Wei Yu

文章链接:https://arxiv.org/abs/2305.10429

摘要:

        预训练数据域(例如,维基百科、书籍、网络文本)的混合比例极大地影响了语言模型 (LM) 的性能。在本文中,我们提出了使用极小极大优化 (DoReMi) 进行域重加权,它首先使用域上的组分布鲁棒优化 (Group DRO) 训练一个小型代理模型,以在不知道下游任务的情况下生成域权重(混合比例)。然后,我们使用这些域权重对数据集进行重新采样,并训练一个更大的全尺寸模型。在我们的实验中,我们在 280M 参数代理模型上使用 DoReMi 来找到域权重,以便更有效地训练 8B 参数模型(大 30 倍)。在 The Pile 上,DoReMi 提高了所有领域的困惑度,即使它降低了一个领域的权重。与使用 The Pile 的默认域权重训练的基线模型相比,DoReMi 将平均少镜头下游准确度提高了 6.5%,并以减少 2.6 倍的训练步骤达到基线准确度。在 GLaM 数据集上,不了解下游任务的 DoReMi 的性能甚至与使用针对下游任务调整的域权重的性能相当。

3.Seeing is Believing: Brain-Inspired Modular Training for Mechanistic Interpretability

标题:眼见为实:受大脑启发的机械可解释性模块化训练

作者:Ziming Liu, Eric Gan, Max Tegmark

文章链接:https://arxiv.org/abs/2305.08746

摘要:

        我们介绍了 Brain-Inspired Modular Training (BIMT),这是一种使神经网络更加模块化和可解释的方法。受大脑的启发,BIMT 将神经元嵌入几何空间,并以与每个神经元连接的长度成正比的成本来增加损失函数。我们证明 BIMT 为许多简单任务发现了有用的模块化神经网络,揭示了符号公式中的组成结构、可解释的决策边界和分类特征,以及算法数据集中的数学结构。用肉眼直接看到模块的能力可以补充当前的机械可解释性策略,例如探测、干预或盯着所有重量。

更多Ai资讯:公主号AiCharm
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/578984.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《java核心卷Ⅰ》读书笔记

🛫 JDK和JRE傻傻分不清?🛫 HelloWorld的输出都经历了啥?🛫 Java的三个版本都是啥?🛫 关于main方法你都知道啥?main方法被声明为private会怎样?🛫 强制and自动类型转换都…

数据结构基础内容-----第四章 栈与队列

文章目录 栈栈的定义站的抽象数据类型两栈共享空间栈的作用递归的定义 栈运算 队列循环队列队列链式存储结构及实现 栈 栈的定义 栈(Stack)是计算机科学中的一种抽象数据类型,它是一个只能在一端进行插入和删除操作的线性数据结构。栈按照后…

tomcat what

tomcat是什么 对于tomcat是什么有什么作用。曾经看到一个大神是这样解释tomcat的,现在分享给大家 内容大体是: 我家有一台机器,可以把石头变成金子。你快递给我一箱石头,让我把它们变成一箱金子再快递给你。 这个机器就是web项…

【Python从入门到进阶】21、爬虫相关概念介绍

接上篇《20、HTML页面结构的介绍》 上一篇我们正式进入了Python爬虫的实战教程,主要讲解了要爬取的HTML页面的结构。本篇我们来介绍爬虫的相关概念。 一、什么是互联网爬虫 如果我们把互联网比作一张大的蜘蛛网,那一台计算机上的数据便是蜘蛛网上的一个…

如何自己搭建chatgpt镜像网站

前沿 总所周知,访问以及注册chatgpt都是比较困难的,如何能畅游chatgpt而不受魔法的限制呢?还好openai给出了非常不错的api能使我们快速搭建一个镜像网站 准备工作 首先得准备一台服务器 这里推荐使用海外vps来进行搭建,缺点就是…

java基础入门-16-【阶段项目(综合练习doudizhu游戏)】

Java基础入门-16-【阶段项目(综合练习&doudizhu游戏)】 25、阶段项目(综合练习&doudizhu游戏)斗地主小游戏斗地主游戏1(控制台版)步骤一:准备牌步骤二:洗牌步骤三:发牌步骤四:看牌步骤五:给牌进行排序(两种方式排序)方式一:利用序号进行排序方式二:给每一…

阻焊设计~焊盘阻焊开窗、阻焊桥

阻焊设计 焊盘阻焊开窗 阻焊开窗应比焊盘尺寸大6mils以上(单边3mils),见下图: 阻焊桥 a) 相邻的SMD焊盘,SMD焊盘和插件孔、SMD焊盘和过孔、过孔与过孔之间需要保留阻焊桥;最小阻焊桥宽度2mils &#x…

vue3.0与vue2.0

一、生命周期的变化 1.vue2.响应式架构 2.vue3.0 响应式架构图 Vue3.0响应式框架在设计上,将视图渲染和数据响应式完全分离开来。将响应式核心方法effect从原有的Watcher中抽离。这样,当我们只需要监听数据响应某种逻辑回调(例如监听某个text属性的变化…

每日学术速递5.28

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CL 1.Improving Factuality and Reasoning in Language Models through Multiagent Debate 标题:通过多主体辩论改进语言模型中的事实性和推理 作者:Yilun Du,…

创建型设计模式02-工厂方法模式

✨作者:猫十二懿 ❤️‍🔥账号:CSDN 、掘金 、个人博客 、Github 🎉公众号:猫十二懿 工厂方法模式 1、工厂方法模式介绍 工厂方法模式(Factory Method Pattern)是一种常用的对象创建型设计模式…

MAC中文版 FCPX V10.6.6 专属视频剪辑后期工具安装教程

Final Cut Pro X简介 Final Cut Pro X又名FCPX,是MAC上非常不错的视频非线性剪辑软件,它剪辑速度超凡,具有先进的调色功能、HDR 视频支持,以及 ProRes RAW,让剪辑、音轨、图形特效、整片输出,支持主流的摄像机格式,是专业视频剪辑领域的王者…

Java经典笔试题—day14

Java经典笔试题—day14 🔎选择题🔎编程题🍭计算日期到天数转换🍭幸运的袋子 🔎结尾 🔎选择题 (1)定义学生、教师和课程的关系模式 S (S#,Sn,Sd,Dc,SA )(其属性分别为学号、姓名、所…

【数据湖仓架构】数据湖和仓库:范式简介

是时候将数据分析迁移到云端了——您选择数据仓库还是数据湖解决方案?了解这两种方法的优缺点。 数据分析平台正在转向云环境,例如亚马逊网络服务、微软 Azure 和谷歌云。云环境提供了多种好处,例如可扩展性、可用性和可靠性。此外&#xff0…

SpringMVC bean加载控制 -- SpringMVC入门保姆级教程(二)

文章目录 前言二、SpringMVC bean 加载控制1.bean加载控制2.添加Spring开发环境3.SpringMVC bean加载控制4.SpringMVC bean控制相关知识点 总结 前言 为了巩固所学的知识,作者尝试着开始发布一些学习笔记类的博客,方便日后回顾。当然,如果能…

丝印设计~丝印内容、大小、距离、排列,位置

丝印设计 丝印的内容包括: a) PCB的名称/PCB的版本号 b) 元器件外形框 c) 元器件的序号 d) 元器件的极性和方向标志 e) 条码框 f) 插入PCB的名称(母板) g) 插针的位置序号 h) 安装孔位置代号 i) 元器件第1脚的位置代号 j) 过板方向 k) 光纤盘…

分治入门+例题

目录 🥇2.3.2 合并排序 🥇2.3.3 快速排序 🌼P1010 [NOIP1998 普及组] 幂次方 🌳总结 形象点,分治正如“凡治众如治寡,分数是也”,管理少数几个人,即可统领全军 本质&#xff…

js数据类型和六种运算结果为false的情况

数据类型 number:数字(整数、小数、NaN(Not a Number)) string:字符串、单双引皆可 boolean:布尔。true、false null:对象为空 undefined:当声明的变量初始化时,该变量的默认值…

vuex五大核心、辅助函数

一、vuex五大核心 分别为:state、getters、mutations、actions、modules state:用来存放我们的状态,也可以理解数据,类似与data中定义的数据;mutations:可以获取state里面的状态,进行修改,他只…

Hadoop---10、生产调优手册

1、HDFS—核心参数 1.1 NameNode 内存生产配置 1、NameNode内存计算 每个文件块大概占用150byte,一台服务器128G内存为例,能储存多少文件块呢? 12810241024*1024/150Byte ≈ 9.1 亿 G M KB Byte 2、Hadoop2.x系列,配置 NameNode…