自监督学习self-supervised learning

news2024/11/15 22:37:35

Tags: #tutorial #machine-leanring #self-supervised

目录

    1. The Importance of Self-Supervised Learning
    1. Popular Learning Methods
    1. Introduction to Self-Supervised Learning

1. The Inportance of Self-Supervised Learning

监督学习(supervised learning)是过去几年深度学习(或者说机器学习)发展的热门方向,但是监督学习如果想取得很好的效果需要:

  1. 大量带标签的数据
  2. 而且给数据打标签是非常耗时,且昂贵的

因此,想要构建能够处理复杂任务模型或者在没有标签的情况下学习新技能的模型,监督学习成为了其发展的瓶颈(“Supervised learning is a bottleneck for building more intelligent generalist models that can do multiple tasks and acquire new skills without massive amounts of labeled data.” Yann LeCun.)。因为给世界上的所有任务都打上标签是不现实的,并且还有一些任务没有足够的带标签数据去训练模型。监督学习在这种情况下就不能发挥出自己的最好性能。

人类可以根据自己对世界的观测到的一些常识建立起一个广义的预测模型,例如物体的连续性和重力等。常识可以帮助人们学习新技能,而无需为每项任务都进行大量的教学。例如,我们给小孩仅展示几张奶牛的图片,他们就能够认出看到的任何奶牛。相比之下,监督学习需要大量带有标签的奶牛图片进行训练,并且还不一定能准确对奶牛进行分类。再比如,人类可以在有少量监督的情况下练习大约20个小时的开车就可以实现驾驶,而AI模型即使经过数千小时训练也无法训练最佳的自动驾驶系统。简而言之,人类依赖于他们先前获得的关于世界如何运作的知识帮助他们快速学习。

我们相信self-supervised learning(自监督学习)是在AI系统中构建此类常识最有前景的一种方法。

自监督学习是一种能够从无标签数据中学习dark matter of intelligence的一种方法。

2. Popular Learning Methods

监督学习(supervised learing)需要大量带标签的数据来训练模型以解决特定的训练任务。
无监督学习(unsupervised learning)无须训练数据带有标签,通过发现数据内部潜在特征来解决各类模式识别任务,例如聚类。
半监督学习(semi-supervised learning)允许数据带有少量的标签,它是监督学习和无监督学习的一种结合方法。
强化学习(reinforcement learning)用于描述和解决智能体(agent)在与环境的交互过程中通过学习策略以达成回报最大化或实现特定目标的问题。
自监督学习(self-supervised learning)从数据本身获得监督信号,不需要任何的手动提取标签和弱标签,通常使用了数据的底层结构。典型的自监督学习技术是从任意可观测的或输入的隐藏部分来预测任意不可观测的或隐藏的部分。例如在NLP中,我们可以隐藏部分单词,让模型从剩下的句子中预测被隐藏的单词。在CV中,我们可以遮挡部分像素,让模型根据可以观测到的像素预测出被遮挡的部分。在视频处理中,我们可以预测过去或未来的视频片段根据现有的视频。此外,自监督学习可以从大量无标注数据中学习可迁移知识,然后用于提高下游任务上的表现。
请添加图片描述
Source: https://www.youtube.com/watch?v=7I0Qt7GALVk

自监督学习VS无监督学习
虽然自监督学习和无监督学习都不需要标签,但是两者有着很大不同。无监督学习不需要任何反馈回路(feedback loops)。相反,自监督学习在训练过程中需要大量监督信号作为反馈。

3. Introduction to Self-Supervised Learning

Self-Supervised Learning (SSL) 可以分为两类: generative learningcontrastive learning。维基百科中把它分成了contrastive和non-constrative两类,不过意思是一样的。
Generative Learning: 利用数据表示重构完整数据,例如GAN, AE, VAE, BERT等;
Contrastive Learning: [[Contrastive learning 对比学习]]包含正例和负例,对比学习目的是为了减小正例样本间的距离,增大负例间样本的距离,例如mutual information maximization, instance discrimination等。

SSL在NLP和CV领域近年来取得了不错的成果,SSL允许我们使用大量无标签的数据训练模型,例如BERT,然后用于解决下游任务。该过程可以分为两个步骤:pre-train和fine-tune。在自监督预训练阶段,常见的pretext task是遮挡住部分的输入,然后让模型还原出输出。这样,模型可以学习到文本或图像的含义,所以才会对空白区域做出正确预测。


参考文献
CS229 Self-supervised Learning - Stanford University
Yann LeCun, Ishan Misra. Self-supervised learning: The dark matter of intelligence. Meta AI.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2054321.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【面试】tomcat类加载机制

目录 1. 说明2. 主要类加载器2.1 Bootstrap类加载器2.2 Common类加载器2.3 Catalina类加载器2.4 Shared类加载器2.5 Web应用类加载器2.5 JSP类加载器 3. 图示4. 特点5. 加载顺序6. 面试题 1. 说明 1.tomcat的类加载机制是违反了双亲委派原则的,对于一些未加载的非基…

初识指针3の学习笔记

目录 1>>前言 2>>冒泡排序 3>>二级指针 4>>指针数组 5>>指针数组模拟二维数组 6>>结语 1>>前言 今天我会继续分享一些我做的笔记,以及我对指针的理解, 后续会持续分享指针几天,毕竟指针的内…

实验室安全分级分类管理系统在高校中的具体应用

盛元广通高校实验室安全分级分类管理系统的构建,旨在通过科学合理的管理手段,提高实验室的安全水平,保障师生的人身安全,防止实验事故的发生。这一系统通常包括实验室安全等级评估、分类管理、风险控制、安全教育与培训、应急响应…

[Qt][绘图][上]详细讲解

目录 0.为什么?1.绘图API核心类2.设置画笔3.设置画刷4.设置画家1.移动画家位置2.保存/加载画家的状态 0.为什么? 虽然Qt已经内置了很多的控件,但是不能保证现有控件就可以应对所有场景,很多时候,需要更强的"定制…

第N8周:使用Word2vec实现文本分类

本文为365天深度学习训练营 中的学习记录博客原作者:K同学啊 一、数据预处理 任务说明: 本次将加入Word2vec使用PyTorch实现中文文本分类,Word2Vec 则是其中的一种词嵌入方法,是一种用于生成词向量的浅层神经网络模型,由Tomas M…

spring boot学习第二十篇:使用minio上传下载文件获取文件路径

先安装好minio&#xff0c;参考&#xff1a;window10安装minio-CSDN博客 1、pom.xml文件添加依赖&#xff1a; <!-- 操作minio的java客户端--><dependency><groupId>io.minio</groupId><artifactId>minio</artifactId><version>8.…

C语言:ifswitch分支语句

目录 前言 一、if语句 1.1 if 1.2 else 1.3 嵌套if 1.4 悬空else问题 二、switch语句 2.1 if语句和switch语句的对比 2.2 switch语句中的default 前言 C语⾔是结构化的程序设计语言&#xff0c;这里的结构指的是顺序结构、选择结构、循环结构&#xff0c;C语言是能够实…

大模型之战-操作数据表-coze

工作流直接操作数据库啦【何时可以直接访问自己的数据库呢】 1&#xff0c;第一步创建一个bot智能体 1.1&#xff0c;bot中创建数据库表&#xff1a; 1.2&#xff0c;智能体可以通过对话&#xff0c;操作表&#xff1b;【增加&#xff0c;筛选查询等】 1.2.1&#xff0c;增加…

视频美颜SDK与直播美颜工具的开发详解与技术优化

本篇文章&#xff0c;小编将为开发者提供一份详细的美颜指南。 一、视频美颜SDK的核心功能 视频美颜SDK是一种嵌入式软件开发工具包&#xff0c;允许开发者在应用中轻松实现实时美颜效果。其核心功能主要包括&#xff1a; 1.实时磨皮 2.美白功能 3.瘦脸与大眼 4.智能滤镜…

链式结构二叉树的应用

一、求二叉树节点的个数 思路1&#xff1a;将一棵二叉树分成根节点和它的左右子树&#xff0c;其左右子树又可以分成根节点和左右子树&#xff0c;运用函数递归的方式统计根节点的数量&#xff0c;将根节点的数量相加。 比如这颗二叉树&#xff0c;1是根节点&#xff0c;size&…

自闭症表现的全方位解读

自闭症&#xff0c;一种神经发育障碍&#xff0c;影响着许多儿童和家庭的生活。了解自闭症的表现对于早期诊断、干预和支持这些孩子至关重要。 自闭症的表现形式多样&#xff0c;且在不同个体之间可能存在较大差异。社交互动障碍是自闭症的核心症状之一。自闭症儿童往往在与人建…

【软件测试面试题】WEB功能测试(持续更新)

Hi&#xff0c;大家好&#xff0c;我是小码哥。最近很多朋友都在说今年的互联网行情不好&#xff0c;面试很难&#xff0c;不知道怎么复习&#xff0c;我最近总结了一份在软件测试面试中比较常见的WEB功能测试面试面试题合集&#xff0c;希望对大家有帮助。 建议点赞收藏再阅读…

《机器学习数据标准化》—— 0~1归一化 和 Z标准化

文章目录 1、为什么要数据标准化2、常用的两种数据标准化1、0~1归一化2、Z标准化 3、注意事项 1、为什么要数据标准化 主要是基于以下几个方面的原因&#xff1a; 消除量纲影响&#xff1a;在机器学习中&#xff0c;不同的特征往往具有不同的量纲和单位。例如&#xff0c;身高…

DHT11温湿度传感器详解(STM32)

目录 一、介绍 二、传感器原理 1.原理图 2.工作时序 3.起始信号与响应信号 4.读数据时序 5.DHT11数据格式 三、程序设计 main.c文件 dht11.h文件 dht11.c文件 四、实验效果展示 五、资料获取 项目分享 一、介绍 DHT11是一款含有已校准数字信号输出的温湿度复合传感器&…

commvault学习(9):备份mysql(linux平台)

1.全备份 1.1创建实例 在centos7上安装完带有mysql组件的cv客户端后&#xff0c;就能在CS上看到客户端的mysql选项 右击图中mysql&#xff0c;点击所有任务-新MySql Server 在弹出的配置框中进行如下设置&#xff1a; *服务器名&#xff1a;类似任务名&#xff0c;自行设置即…

基于SpringBoot的论坛系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言具体实现截图详细视频演示技术栈系统测试为什么选择我官方认证玩家&#xff0c;服务很多代码文档&#xff0c;百分百好评&#xff0c;战绩可查&#xff01;&#xff01;入职于互联网大厂&#xff0c;可以交流&#xff0c;共同进步。有保障的售后 代码参考数据库参…

伊朗通过 ChatGPT 试图影响美国大选, OpenAI 封禁多个账户|TodayAI

OpenAI 近日宣布&#xff0c;他们已经封禁了一系列与伊朗影响行动有关的 ChatGPT 账户&#xff0c;这些账户涉嫌利用该 AI 工具生成并传播与美国总统选举、以色列 – 哈马斯战争以及奥运会等相关的内容。 OpenAI 表示&#xff0c;这些账户与一个名为 “Storm-2035” 的秘密伊朗…

(Arxiv-2023)潜在一致性模型:通过少步推理合成高分辨率图像

潜在一致性模型&#xff1a;通过少步推理合成高分辨率图像 Paper Title: Latent Consistency Models: Synthesizing High-Resolution Images with Few-Step Inference Paper是清华发表在Arxiv 2023的工作 Paper地址 Code地址 ABSTRACT 潜在扩散模型 (LDM) 在合成高分辨率图像方…

寻找峰值(100%用例)C卷(JavaPythonC++Node.jsC语言)

给定一个长度为n的数组nums,请你找到峰值并返回其索引。数组可能包含多个峰值,在这种情况下,返回任何一个所在位置即可。 1. 峰值 元素是指其值严格大于左右相邻值的元素 。严格大于即不能有等于 2.假设 nums[-1] = nums[n] = 3.对于所有有效的 i 都有 nums[i] != nums[…

dockerfile搭建部署LNMP

目录 实验 架构&#xff1a; 实验步骤&#xff1a; nginx部分 mysql部分 php部分 实验 实验&#xff1a;用dockerfile搭建LNMP论坛 架构&#xff1a; 一台docker虚拟机 docker部署nginx 1.22 指定ip地址172.111.0.10 docker部署mysql 8.0.30 指定ip地址…