LeCun、田渊栋参与撰写,70页「自监督学习」大全

news2024/12/28 1:54:06

来源 | 机器之心  微信号:almosthuman2014

「关于自监督学习,你想知道但又不敢问的一切都在这里了。」图灵奖得主、Meta 人工智能首席科学家 Yann LeCun 刚刚发了这样一则推文。

在推文中,LeCun 介绍了他和 Meta 人工智能研究院研究员、研究经理田渊栋等人共同撰写的一份「Cookbook」(非常实用、可操作性强、就像一本菜谱一样的论文)。这本 Cookbook 总共 70 页,涵盖了自监督学习的定义、重要性、起源、家族、训练部署方法、扩展方法等方面知识,是一份不可多得的学习材料。「如果你想研究自监督学习,那最好看看这本书。」田渊栋补充说。

论文链接:https://arxiv.org/pdf/2304.12210v1.pdf

自监督学习可以被看作是机器学习的一种「理想状态」,模型直接从无标签数据中自行学习,无需标注数据。它主要是利用辅助任务(pretext task)从大规模的无监督数据中挖掘自身的监督信息,通过这种构造的监督信息对网络进行训练,从而可以学习到对下游任务有价值的表征。自监督学习的优势在于它能够利用大量的无标签数据进行训练,而不需要人工标注。这样可以节省大量的人力和时间成本,并且可以利用更多的数据进行训练,从而提高模型的性能。

众所周知,Yann LeCun 一直是自监督学习的积极支持者。近几年,Meta 发表了一系列关于自监督学习的论文。LeCun 坚定地认为,自监督学习是 AI 系统的必要前提,它可以帮助 AI 系统构建世界模型,以获得类似人类的能力,如理性、常识,以及将技能和知识从一个环境迁移到另一个环境的能力。GPT-4 的成功有力地证明了自监督学习的有效性。不过,Yann LeCun 并不看好 GPT 家族所采用的自回归方法(预测下一个词),而是更倾向于构建「世界模型」。

这份 Cookbook 在社交媒体上受到了广泛好评。

自监督学习是什么?为什么如此重要?

2021 年,Yann LeCun 等人发布了一篇题为「Self-supervised learning: The dark matter of intelligence」的博客。在博客中,他们把自监督学习(SSL)称为「智能的暗物质」,认为这是推进机器学习的一条有前途的道路。

自监督学习(SSL)是深度学习在自然语言处理领域取得成功的基础,它带来了从自动机器翻译到在网络规模的无标签文本语料库上训练的大型语言模型的进步。在计算机视觉方面,它推动了数据规模的新边界,如在 10 亿张图像上训练的 SEER 模型。用于计算机视觉的 SSL 方法已经能够媲美或在某些情况下超过在标记数据上训练的模型,甚至在 ImageNet 等竞争激烈的基准上也是如此。SSL 也被成功地应用于其他模态,如视频、音频和时间序列。

自监督学习定义了一个基于无标签输入的辅助任务,以产生描述性的、可理解的表示。在自然语言中,一个常见的 SSL 目标是掩盖文本中的一个词并预测周围的词。这种预测一个词周围的上下文的目标鼓励模型捕捉文本中的词之间的关系,而不需要任何标签。同样的 SSL 模型表示可用于一系列下游任务,如跨语言的文本翻译、总结,甚至是生成文本,以及其他许多任务。在计算机视觉中,类似的目标存在于 MAE 或 BYOL 学习等模型中,以预测图像或表征中被遮蔽的内容块。其他 SSL 目标鼓励同一图像的两个视图,例如通过添加颜色或裁剪形成,以映射到类似的表示。

在大量无标签数据上进行训练的能力带来了许多好处。传统的监督学习方法是在一个特定的任务上进行训练,而这个任务通常是基于可用的标记数据而预先知道的,SSL 则是在许多任务中学习有用的通用表征。SSL 在医学等领域特别有用,因为这些领域的标签成本很高,或者具体的任务不能事先知道。也有证据表明,SSL 模型可以学习到对对抗性例子、标签损坏和输入扰动更稳健的表征,而且与有监督的模型相比更公平。因此,SSL 是一个越来越受关注的领域。然而,就像烹饪一样,训练 SSL 的方法是一门精致的艺术,有很高的入门门槛。

为什么要编写自监督学习的 Cookbook

虽然研究人员熟悉 SSL 的许多组件,但成功训练 SSL 的方法涉及从辅助任务到训练超参数的一系列令人眼花缭乱的选择。SSL 研究具有很高的进入门槛,包括:

1、计算成本高;

2、缺乏完全透明的论文来详细说明充分实现 SSL 潜力所需的复杂实现;

3、缺乏统一 SSL 的专业词汇和理论观点。

由于 SSL 建立了与传统的基于重建的无监督学习方法 —— 如(去噪、变分)自编码器 —— 不同的范式,因此我们在统一框架下理解 SSL 的词汇量是有限的。事实上,在单一框架下统一 SSL 方法的尝试直到去年才开始出现 。因为没有一个共同的基础来描述 SSL 方法的不同组成部分,研究人员着手研究 SSL 方法变得更具挑战性。与此同时,SSL 研究迫切需要新的研究人员加入,以将其部署到现实世界中。然而,关于 SSL 泛化性的保证、公平性以及对对抗性攻击甚至自变体的稳健性,仍然存在许多未解之谜。这些问题对于 SSL 方法的可靠性至关重要。

此外,由经验驱动的 SSL 带有许多可变的部分(主要是超参数),它们是可能会影响最终表示的关键属性,而且在已发表的工作中不一定有详细的说明。也就是说,要开始研究 SSL 方法,首先必须详尽地对这些方法进行经验探究,以充分掌握所有这些部件的影响和行为。这种经验盲点有很大的局限性,因为它们需要大量的计算资源和预先存在的实践经验。总而言之,SOTA 的性能来自于看似不同但又重叠的方法,现有的理论研究很少,而这类模型在现实世界中的部署又很广泛。因此,我们需要一本统一这项技术及其有关方法的 cookbook。这对降低 SSL 的研究门槛至关重要。

研究人员的目标是以 cookbook 的形式奠定 SSL 研究的基础,并呈现与 SSL 有关的最新方法,从而降低 SSL 研究的门槛。

比如要成功烹饪,你必须首先学习基本技术:切碎、炒菜等。研究者从第 2 章开始使用通用词汇介绍自监督学习的基本技术。具体来说,他们描述了系统的方法以及理论线索,以统一的视角连接它们的目标。研究者们在概念框中突出显示出关键的概念,例如 loss terms 或 training objectives。

接下来,「厨师们」必须学会熟练地应用这些技术来形成「美味的菜肴」,这需要学习现有的食谱,组合食材并评估菜肴。在第 3 章中,研究人员介绍了成功实现 SSL 方法的实际注意事项,讨论了常见的训练方法,包括超参数选择、如何组装网络架构和优化器等组件,以及如何评估 SSL 的方法。

他们还分享了一些优秀的研究人员关于常见训练配置和躲避陷阱的实用技巧。希望这本 cookbook 能成为大家成功训练和探索自监督学习的实践基础。

更多细节请参见原论文。

参考链接:https://zhuanlan.zhihu.com/p/66063089

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/472591.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据结构学习记录——判断是否为同一颗二叉搜索树(题意理解、求解思路、程序搭建框架、具体函数的实现)

目录 题意理解 问题 描述 输入样例 输出样例 求解思路 建两棵二叉树 不建树 建一棵树 搜索树表示 程序框架搭建 如何建搜索树 如何判别 方法 查找函数 判断函数 其他函数 题意理解 给定一个插入序列就可以唯一确定一颗二叉搜索树。 但是,一颗给定…

libigl添加Viewer Menu时出现imgui相关的错误:无法打开包括文件: “imgui.h”: No such file or directory

libigl添加如下图所示的Viewer Menu时,出现了“无法打开包括文件: “imgui.h”: No such file or directory”的错误 很显然是libigl内嵌的imgui出了问题 从项目路径libigl-example-project-main\out\build\x64-Release\_deps\libigl-src\include\igl\opengl\glfw\…

【谷粒商城之CompletableFuture异步编排】

本笔记内容为尚硅谷谷粒商城CompletableFuture异步编排部分 目录 一、线程回顾 1 、初始化线程的 4 种方式 2.、线程池的七大参数 运行流程: 3、常见的4种线程池 4、开发中为什么使用线程池 二、CompletableFuture 异步编排 业务场景 1、创建异步对象 …

无线化超轻薄,香港城市大学体感反馈贴片WeTac

此前,青亭网曾报道香港城市大学与腾讯Robotics X Lab合作研发的低电压体感方案,原理是通过微电流刺激来模拟触觉,可模拟微小物体的体感。近期,香港城市大学的一组科研人员也公布了一项类似的方案:WeTac,该方…

轻松上手:使用VSCode调试Python模块级代码的完整教程

安装VSCode:请确保已经安装了Visual Studio Code。安装Python插件:在VSCode中,转到Extensions视图 (View -> Extensions) 并搜索"Python"。找到由Microsoft提供的插件并点击安装。重启VSCode以确保插件安装正确。准备项目&#…

边听歌边充电LDR6028+LDR9201既能充电又能OTG方案

随着type-c接口的普及,市面上的手机,平板,笔电逐渐都采用了type-c接口,设备为了不断的追求更轻薄的机身和防水要求慢慢的取消了一些影响手机外观完整性的接口,比如3.5mm耳机孔。 有线耳机用户一般会选择使用C口转3.5m…

资深架构师解读零代码开发平台—如何不写代码实现流程审批

审批节点 “审批节点:” 流程中涉及审批时,需要用到审批节点。审批可通过或者驳回,也可以发送通知。可以多人会签/或签审批。 1. 审批节点 1.1 审批设置 ① 审批方式 审批方式默认为或签方式,只一个人审批即可 当选择会签时&#…

【英语】大学英语CET考试,口语考试介绍与备考1(讲义笔记)

文章目录 1、考试基本信息2、考试题型介绍3.1 短文朗读与回答问题(语音篇)3.1.1 语音篇真题3.1.2 语音篇6项基础知识3.1.3 语音语调练习(名言名句)3.1.4 短文朗读练习材料(真题) 3.2 自我介绍与看图说话&am…

IC面试,你一定要准备好这些(内附大厂面试题目)

大家都知道,面试的表现会对于个人职业发展的重要性,不仅能决定是否录用,还会影响到后期的谈薪,所以面试前一定要做好充分的准备。 怎么准备面试? 这里就建议简历上的表述尽量客观化、专业化,多使用数字和…

目标跟踪综述 (持续更新)

这几天对目标跟踪挺感兴趣的,但是在CSDN和知乎上面找的相关介绍资料都看的一知半解,所以自己找了一篇 2022-04-26 发表的综述文章作下笔记学习下。 目录 一、基于相关滤波的目标跟踪算法 1、相关滤波视频目标跟踪算法的框架 2、相关滤波目标跟踪算法…

GPT-4开源平替miniGPT-4来了,仅需23G显存单机可run,附论文、项目代码地址

来源 | 新智元 微信号:AI-era 先是ChatGPT的发布给世界带来了一点小小的NLP震撼,随后发布的GPT-4更是破圈计算机视觉,展现了非凡的多模态能力。 不光能读懂人类的梗,给个手绘草图甚至可以直接写出网站的代码,彻底颠覆…

百度地图 TypeError: Cannot set properties of undefined (setting ‘Bm‘)

这类问题出现的原因一般是,页面还没有加载完,地图开始加载,或者地图加载在页面加载之前 在项目中,我用isMapLoading控制地图的加载,false–加载,true–不加载,在data()中设置isMapLoadingtrue

矩阵的秩的计算

definition 1 矩阵的秩 矩阵的列空间的维度 矩阵的零空间的秩 矩阵的自由变量的个数 n - r(A) definition 2 这两个证明很好证 第三个证明可以用零空间的秩 example 1 hyperlink

HTTPS建立连接原理、SSL工作原理

HTTPS与HTTP相比有什么区别? HTTPS保证安全的原理是什么? HTTPS是如何建立连接的? 巨人的肩膀 3.1 HTTP 常见面试题 | 小林coding HTTP与HTTPS的区别 HTTP是超文本传输协议,传输的内容是明文(HTTP1.1及之前版本)。HTTPS在TCP与HT…

【LeetCode】27. 移除元素

题目链接:https://leetcode.cn/problems/remove-element/ 📕题目要求: 给你一个数组 nums 和一个值 val,你需要 原地 移除所有数值等于 val 的元素,并返回移除后数组的新长度。 不要使用额外的数组空间,…

【原创】生成文件MD5图像,类似于GitHub的像素风格头像

前言 我想通过文件的md5生成关于这个md5的图像,类似于GitHub的随机像素头像,用处是让这个md5更加直观,也能用于生成各种用户头像,跟GitHub一样。 网上搜了一下,没有现成的方法,只能有一篇类似的文章可以借…

第N2周:中文文本分类-Pytorch实现

目录 一、前言二、准备工作三、数据预处理1.加载数据2.构建词典3.生成数据批次和迭代器 三、模型构建1. 搭建模型2. 初始化模型3. 定义训练与评估函数 四、训练模型1. 拆分数据集并运行模型 一、前言 🍨 本文为🔗365天深度学习训练营 中的学习记录博客 …

运算符重载----赋值运算符重载

运算符重载 本质是函数调用,内置类型编译器直接比,自定义就去找对应类内重载的函数 如果定义在类外,需要访问私有的成员函数,只能将成员函数权限变为Public或者友元(非必须不用) ,所以一般重载…

Linux程序设计之字节序转换

1.在网络通信中,数据的存储方式十分重要,因为它影响到数据的准确性。如今,电脑和网络上数据的存储方式有两种:大端模式和小端模式。大端模式:数据的高位存储在内存的低位,数据的低位存储在内存的高位。小端…

【keil5开发ARM工程时使用STLink调试的技巧分享】

ARM工程开发小技巧系列文章 St link V2驱动安装方法 文章目录 ARM工程开发小技巧系列文章前言一、准备工作1. 硬件连接2. 安装stlink的驱动3. Keil 5配置 二、调试示例1.进入调试状态2. 调试演示2.1 复位,使程序复位到初始位置2.2 单步调试2.3 逐步调试2.4 跳出调…