6篇 ICML 2023 杰出论文解析,涉及无学习率、LLM水印、域泛化等方向

news2024/11/15 5:57:01

ICML 全称 International Conference on Machine Learning,由国际机器学习学会(IMLS)举办,是计算机人工智能领域的顶级会议。今年的 ICML 大会已是第 40 届,共收到 6538 份投稿,有1827 份被接收,录用率为27.9%。

在今年的杰出论文评选中,共有32篇候选,最终共有6篇论文摘得桂冠,涉及无学习率、为 LLM 加水印、未见过域泛化、不完全信息零和博弈的近优策略、MCMC 和频率顺序学习的贝叶斯设计原则等领域。

下面让我们来看看这6篇杰出论文的具体内容。

杰出论文

1.Learning-Rate-Free Learning by D-Adaptation

标题:基于D-Adaptation的无学习率学习

作者:Aaron Defazio (FAIR), Konstantin Mishchenko (Samsung AI Center)

内容:本文介绍了一种有趣的方法,旨在解决获得非平滑随机凸优化的学习率自由最优边界的挑战。作者提出了一种克服传统学习率选择在优化此类问题时所施加的限制的新方法。这项研究对优化领域做出了有价值和实际的贡献。

2.A Watermark for Large Language Models

标题:大语言模型的数字水印

作者:John Kirchenbauer, Jonas Geiping, Yuxin Wen, Jonathan Katz, Ian Miers, Tom Goldstein (马里兰大学)

内容:本文提出了一种对大型语言模型输出进行水印处理的方法,即将信号嵌入到生成的文本中,这些文本对人类来说是不可见的,但可以通过算法检测到。无需重新训练语言模型即可生成水印,无需访问 API 或参数即可检测到水印。本文还提出了一种用于检测具有可解释p值的水印的统计检验,以及用于分析其敏感性的信息理论框架。该方法简单新颖,理论分析扎实,实验扎实。鉴于在检测和审计LLM生成的合成文本方面出现的关键挑战,本文有可能对社区产生重大影响。

3.Generalization on the Unseen, Logic Reasoning and Degree Curriculum

标题:对未见的泛化,逻辑推理和程度课程

作者:Emmanuel Abbe(EPFL,Apple),Samy Bengio(Apple),Aryo Lotfi(EPFL),Kevin Rizk(EPFL)

内容:这项工作在学习布尔函数方面取得了重大进展,特别是针对看不见的泛化(GOTU)设置,这提出了一个具有挑战性的分布外泛化问题。本文广泛探讨了这一重要主题,提供了一种由理论分析和广泛实验支持的结构化方法。此外,它通过概述深度神经网络领域的一个关键研究方向而脱颖而出。

4.Adapting to game trees in zero-sum imperfect information games

标题:适应零和不完全信息博弈中的博弈树

作者:Côme Fiegel (CREST, ENSAE, IP Paris), Pierre MENARD (ENS Lyon), Tadashi Kozuno (Omron Sinic X), Remi Munos (Deepmind), Vianney Perchet (CREST, ENSAE, IP Paris and CRITEO AI Lab), Michal Valko (Deepmind)

内容:本文介绍了不完全信息零和博弈的近优策略。它严格地建立了一种新的下界,并提出了平衡FTRL和自适应FTRL两种算法。这些贡献极大地推动了不完全信息游戏中的优化领域。实验证实了这些说法,为研究结果提供了充足的支持。

5.Self-Repellent Random Walks on General Graphs - Achieving Minimal Sampling Variance via Nonlinear Markov Chains

标题:在通用图上的自排斥随机游走 - 通过非线性马尔可夫链实现最小采样方差

作者:Vishwaraj Doshi (IQVIA Inc), Jie Hu (北卡罗来纳州立大学), Do Young Eun (北卡罗来纳州立大学)

内容:本文解决了一组具有挑战性的开放问题,即具有自排斥随机游走的MCMC。它超越了传统的非回溯方法,为MCMC采样的新研究方向铺平了道路。作者对马尔可夫链蒙特卡洛文学做出了原创性且非平凡的贡献;值得注意的是,这个过程可以被严格分析和证明。这篇论文写得很好,对主要概念进行了清晰直观的解释。结果令人信服和全面。

6.Bayesian Design Principles for Frequentist Sequential Learning

标题:用于频率学顺序学习的贝叶斯设计原理

作者:徐云北,阿萨夫·泽维(哥伦比亚大学)

内容:本文解决了设计强盗和其他顺序决策策略的非常普遍的问题。它提出了使用称为算法信息比率的新量来界定任何策略的遗憾的方法,并推导出了优化该边界的方法。该界限比类似的早期信息理论量更严格,并且这些方法在随机和对抗性强盗设置中都表现良好,实现了世界上最好的。特别有趣的是,这篇论文可能为一系列全新的勘探开发策略打开了大门,超越了著名的汤普森采样和土匪UCB。这个原则延伸到强化学习的事实是非常有希望的。该文件得到了专家审评员的一致和大力支持。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“ICML杰出”获取全部论文原文+代码合集

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/907500.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

速通蓝桥杯嵌入式省一教程:(七)定时器输入捕获中断与PWM频率占空比测量

前文已经讲述过定时器的两个用法:基本定时中断与PWM输出。本节接着介绍第三种用法:定时器输入捕获中断。 在此之前,需要解释一下前文一直出现过的与定时器有关的概念。 定时器(TIMER):所谓定时器,其基本功能就是定时…

strstr的学习与使用及实现/查找字符串中的字符

在字符串中查找字符或字符串 strstr函数传入两个字符串&#xff0c;并返回查找后的首地址&#xff0c;找不到返回NULL 模拟实现 char* my_strstr( char* str1, const char* str2) {int i, j;assert(str1 && str2);//断言判断一下for ( i 0; i < strlen(str1); i){f…

【G-LAB】网络工程师常用排错命令详细版

网络工程师在日常配置中难免出现各种配置错误&#xff0c;比如接口地址配错、掩码位数配错、接口忘记no shutdown。除去这些基础错误&#xff0c;在配置各种路由选择协议时也会因为网络类型、邻居类型、区域和路由器层级等各种问题使邻居无法建立、路由无法传递进而导致网络不通…

Apipost中自定义接口字段如何配置

Apipost项目设置中可以配置接口文档中的自定义接口字段&#xff0c;创建状态码字典。分享分档时会展示到文档页面 状态码字典 在状态码字典中可以自定义状态码即其含义 自定义的状态码会在分享的API文档中展示 接口属性 接口属性中可以自定义接口和接口文档展示字段&#xf…

使用Python批量将飞书文档转为MD

说明&#xff1a;飞书是在线文档平台&#xff0c;本文介绍如何使用Python程序批量将飞书文档转为MD文档&#xff0c;并下载到本地&#xff1b; 复制地址 首先&#xff0c;把文档的URL都复制下来&#xff0c;这个需要一个一个点&#xff0c;并复制拷贝&#xff0c;但却是工作量…

【HCIP】10.路由策略

&#x1f4ce;13 路由策略与路由控制.pptx 通过修改路由的属性&#xff0c;影响了路由的生成及选路&#xff0c;最终影响了转发流量的路径&#xff1b;控制平面。 ACL IP prefix Filter-Policy Router-Policy 笔记

巴适得很!影驰2023“势在必燃”线下新品体验会成都站精彩回顾

全新一代的RTX 40系显卡早已和大家见面&#xff0c;其全新带来的核心架构、性能动力以及DLSS 3等技术黑科技&#xff0c;都为大家带来了不一样的惊喜。影驰 RTX 40 系显卡如今已经上线了诸多新品&#xff0c;更有DDR5系列的高频内存以及全新技术加持的PCI-E 5.0 SSD强势来袭&am…

Hadoop分布式计算与资源调度:打开专业江湖的魔幻之门

文章目录 版权声明一 分布式计算概述1.1 分布式计算1.2 分布式&#xff08;数据&#xff09;计算模式1.3 小结 二 MapReduce概述2.1 分布式计算框架 - MapReduce2.2 MapReduce执行原理2.3 小结 三 YARN概述3.1 YARN & MapReduce3.2 资源调度3.3 程序的资源调度3.4 YARN的资…

微信怎么添加更多的好友?通过后还能自动打招呼?

近期好多客户来问想把抖音、淘宝等平台的客户引流到自己的微信号里&#xff0c;打造自己的私域流量池&#xff0c;有什么办法能快捷地批量自动添加客户好友的微信呢&#xff1f;怎么规避加太多频繁的问题呢&#xff1f; 今天&#xff0c;我们来一一解决&#xff0c;都知道加好…

Python连接DB2数据库

安装Python DB2驱动 pip install ibm_db待更新

展会动态 | 迪捷软件邀您参加第五届中国嵌入式技术大会

大会简介 第五届中国嵌入式技术大会将于2023年8月23-25日在深圳会展中心&#xff08;福田&#xff09;1号会议室4/5/6举办&#xff0c;本届大会将以“智能、创新、开源”为主题&#xff0c;聚焦智能系统、汽车电子、开源芯片和基础软件四大板块&#xff0c;汇聚优质企业及知名…

批量修改文件名怎么操作?

批量修改文件名怎么操作&#xff1f;不管你使用电脑处理工作还是进行学习&#xff0c;都会在电脑中产生很多的文件&#xff0c;时间一久电脑里的文件更加杂乱无章&#xff0c;这时候如果不对电脑中的文件进行及时的管理&#xff0c;那么很可能出现文件丢失而你自己还发现不了的…

最新出炉!2023年NPS和CSAT行业基准分数一览

根据Forrester的最新调研&#xff0c;美国品牌在2023年难以提供出色的客户体验&#xff0c;导致其客户体验指数得分史无前例地连续第二年下降&#xff0c;大多数行业都在客户体验之旅中“碰壁”。无独有偶&#xff0c;加拿大品牌的整体客户体验水平也刷新了自2016年调研以来的“…

【报错】yarn --version Unrecognized option: --version Error...

文章目录 问题分析解决问题 在使用 npm install -g yarn 全局安装 yarn 后,查看yarn 的版本号,报错如下 PS D:\global-data-display> yarn --version Unrecognized option: --version Error: Could

这所“984.5”保护一志愿!集成学硕爆冷,300分以上全要!考数二英一!

一、学校及专业介绍 南京航空航天大学&#xff08;Nanjing University of Aeronautics and Astronautics&#xff09;&#xff0c;简称南航&#xff08;NUAA&#xff09;。位于江苏省南京市&#xff0c;是一所具有航空航天民航特色、以理工类为主的综合性全国重点大学。国家“…

Redis常用数据类型及常用命令

文章目录 简介下载与安装运行访问服务端运行连接数据库设置数据库密码带端口密码地址连接数据库利用可视化工具连接redis 5种常用数据类型Redis常用命令字符串操作命令哈希操作命令列表操作命令集合操作命令有序集合操作命令通用命令 简介 下载与安装 https://github.com/micro…

idea提示无法访问某个类

一、问题 maven引入某个包后无法访问这个包里面的类 二、原因 这个类用java11编写&#xff0c;而我的项目代码是用java8编译的所以无法访问此类&#xff0c;idea报错。 将项目的Java版本号改为11&#xff0c;重新编译&#xff0c;问题解决 参考文章&#xff1a; https://www…

maven打出jar中动态替换占位符

使用场景&#xff1a; maven打出的jar中pom.xml动态替换占位符 有些时候某些公共工具jar包被项目引用后发现公共jar的pom.xml中的version依然还是占位符&#xff0c;例如下面 <dependency><groupId>org.projectlombok</groupId><artifactId>lombok<…

Python基础教程——实现登录和注册、2048游戏开发(完整版,附源码)

一、登录和注册 1. 案例介绍 本例设计一个用户登录和注册模块&#xff0c;使用 Tkinter 框架构建界面&#xff0c;主要用到画布、文本框、按钮等组件。涉及知识点&#xff1a;Python Tkinter 界面编程、pickle 数据存储。本例实现了基本的用户登录和注册互动界面&#xff0c;…

【Go】Goland项目配置运行教程

Golang项目配置运行教程 1.安装Golang下载安装包安装 2.Goland配置 注意&#xff0c;本项目描述的是git clone下来的Golang项目配置运行教程&#xff0c;并不是从头创建一个Golang项目并运行 作者是在win11系统上使用goland进行的实践&#xff0c;其他操作系统和比编辑器请谨慎…