【无监督学习】0、有监督学习、无监督学习、半监督学习

news2024/11/17 15:27:50

文章目录

    • 一、有监督学习
    • 二、半监督学习
    • 三、无监督学习
      • 3.1 对比式学习

一、有监督学习

有监督学习最大的特点就是数据集是带标签的,如有监督分类任务,就是给每张图都分配一个真实标签,表示这张图是 dog、cat 或者是 bird。

而标签的作用就是指导模型训练,告诉模型这是哪个类别

常见算法:分类、回归

二、半监督学习

在实际应用中,获得大量带高质量标签的数据是费时费力的,且有些稀缺样本是非常昂贵的

于是就出现了半监督学习,就是一部分数据带标签,一部分数据不带标签,通过对带标签数据的训练,然后预测出无标签数据的伪标签来进行有监督训练。

三、无监督学习

深度学习中无监督学习的分类:

  • 生成式学习:由数据生成数据,使之在整体或者高级语义上与训练数据相近
    • GAN
    • VAE
  • 对比式学习:不需要关注实例上繁琐的细节,只需要在抽象语义级别的特征空间上学会对数据的区分即可,因此模型以及其优化变得更加简单,且泛化能力更强。

无监督训练最大的特征就是数据没有标签,顾七学习的目标是通过这些无标签的样本来学习数据内在的特征和规律。

无监督最大的特点就是能从一堆动物中将狗分到一个类别中,但却不知道它们是狗

典型的算法就是聚类,聚类就是将相同的一类距离拉近,将不同类的数据距离拉远。

自监督学习:

自监督学习是一种特殊的无监督学习方法,利用辅助任务(pretask)从大规模的无监督数据中挖掘自身的监督信息,来自动生成标签或者特征,从而进行模型训练,其实主要是预训练,将训练好的模型进行迁移或微调后,能解决特定的任务。

自监督学习主要有如下三类:

  • 基于上下文
  • 基于时序
  • 基于对比

3.1 对比式学习

对比学习是自监督学习/无监督学习中的一种形式

对比学习的核心:

  • 不需要类别标签信息
  • 需要代理任务(人为设置的一些规则,数据增强最常用)来定义那些样本是相似的,也就是提供了一个监督信号来训练模型
  • 需要实现的就是将同类目标距离拉近,将不同类目标的距离拉远

有监督学习流程:

  • 输入 x,通过模型计算输出 y
  • 对模型输出 y 和真实label 计算损失
  • 梯度反传指导模型训练

对比学习的范式:代理任务+目标函数

  • 代理任务:解决没有标签的问题,即使用代理任务来定义对比学习的正负样本,对同一个样本 x,经过两个代理任务分别生成两个样本,一般都使用数据增强,如图片随机裁剪、颜色变换、高斯模糊等,生成的这两个样板就是一组正样本对儿
  • 特征提取编码器 f ( . ) f(.) f(.):对这组样本对儿中的两个样本经过同一个编码器,得到两组特征
  • MLP:MLP 的输出会用来计算孙函数
  • 损失函数:使用 infoNCE loss,分子计算正样本对儿的距离,分母计算负样本对儿的距离,当正样本对儿距离越小,负样本对儿距离越大,损失越小
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/682272.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Git基本操作命令

目录 一、简介 二、基本命令使用 (1) git add ---将该文件添加到暂存区 (2) git status --- 命令用于查看在上次提交之后是否有对文件进行再次修改 (3) git diff -- 比较文件在暂存区和工作区的差异 (4) git commit --- 将暂存区内容添加到本地仓库中 (5) git reset --…

前端实现实时数据更新:EventSource

前言 大看板相信很多人都做过,通常就是用来展示数据的。最初一些同事(包括我自己)都是通过定时器来实现的,每隔多长时间发送一次请求。后来用户说页面不刷新或者是页面卡死了,讨论的解决方案是改成WebSocket实时推送消…

AI绘图软件分享:Midjourney 基础教程(四)参数进阶

大家好,我是权知星球,今天我们继续来学习Midjourney 基础教程(四):Midjourney 参数进阶。 通过前⼏篇⽂章的学习,我们知道了,想要掌握 Midjourney AI 绘画技术,先需要学习掌握常⽤的…

还在烦恼代码写不出来?低代码助力实现“无码”搭建系统平台

摘要:本文由葡萄城技术团队于CSDN原创并首发。葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 据说… 每敲出来一行代码 就有一根头发离我而去… 而每解决掉一个bug 就有一个毛囊开始休养生息… 程序猿,一个让人既爱又…

USR-C216配置客户端模式,手机接收数据

若是不清楚现在模块什么配置可先恢复出厂设置,将nReload拉低3S即可。 此时模块发出热点名字为USR-C216,无密码 电脑连接后在浏览器输入10.10.100.254,进入后密码和用户名为admin

多数人都不会用,有了这些视频APP,再也不担心失效!

阿虚储物间里一大热门下载内容就是影视类APP了 但相信有这类需求的粉丝都知道:这类APP要么你忍受烦人的广告,要么就找去广告版,但去广告版有个最大的问题就是经!常!失!效! 其实阿虚早就介绍过…

窗口层级树的构建

窗口层级树的构建 参考: android 13 WMS/AMS系统开发-窗口层级相关DisplayArea,WindowContainer第二节 在上一节dumpsys activity containers中,层级树中有如下的标识符: WindowedMagnificationHideDisplayCutoutOneHandedHideDisplayCut…

【软考网络管理员】2023年软考网管初级常见知识考点(4)-局域网基本概念

涉及知识点 局域网特点,局域网体系结构,局域网拓扑结构,局域网传输介质,软考网络管理员常考知识点,软考网络管理员网络安全,网络管理员考点汇总。 文章目录 涉及知识点前言一、局域网的特点二、局域网体系…

Apache RocketMQ EventBridge:构建下一代事件驱动引擎

作者:沈林 前言 事件驱动,这个词在部分人印象中,它是一个过时的技术——没什么新意。从时间上看,确实也是这样,上世纪 60 年代,事件驱动就已经被正式提出,经常会被在 GUI 编程中。但是在有些人…

IO总线控制器模块在工业自动化中的关键应用

IO总线控制器模块是工业自动化系统中的关键组件,其功能和特点包括: IO集成:IO总线控制器模块通过支持多种IO接口和协议,实现了各种数字和模拟信号的集成和控制。它能够与各种传感器、执行器和其他设备进行通信和数据交换。 实时性…

TCP协议的滑动窗口具体是怎样控制流量的?

💂 个人网站:【海拥】【游戏大全】【神级源码资源网】🤟 前端学习课程:👉【28个案例趣学前端】【400个JS面试题】💅 寻找学习交流、摸鱼划水的小伙伴,请点击【摸鱼学习交流群】 目录 前言TCP协议概述滑动窗…

小航助学2023年6月GESP_C++四级试卷(含题库答题软件账号)

需要在线模拟训练的题库账号请点击 小航助学编程在线模拟试卷系统(含题库答题软件账号)_程序猿下山的博客-CSDN博客 单选题2.0分 删除编辑附件图文 答案:D 第1题高级语言编写的程序需要经过以下( )操作,可以生成在…

1分钟教你从0-1搭建Monorepo多包项目

1、monorepo是啥 在了解Monorepo之前,先说一下Multirepo Multirepo:指定的是不同项目由不同的仓库来存放管理 每个仓库都维护着各项目的npm包依赖 Monorepo指的是包含多个项目的单个仓库。 各个项目可以单独运行、打包、发布 Multirepo:分散式…

【CV】EfficientNet相比resnet有哪些优点,什么是深度可分离卷积

目录 前言使用深度可分离卷积普通卷积的计算参数量深度可分离卷积分为两个步骤:深度卷积和逐点卷积 使用多个缩放因子使用 Swish 激活函数 前言 高效的神经网络主要通过:1. 减少参数数量;2. 量化参数,减少每个参数占用内存 目前的…

Transformer中的Q,K,V

Query,Key,Value的概念取自于信息检索系统,举个简单的搜索的例子来说。当你在某电商平台搜索某件商品(年轻女士冬季穿的红色薄款羽绒服)时,你在搜索引擎上输入的内容便是Query,然后搜索引擎根据…

【历史上的今天】6 月 25 日:笔记本之父诞生;Windows 98 发布;通用产品代码首次商用

整理 | 王启隆 透过「历史上的今天」,从过去看未来,从现在亦可以改变未来。 今天是 2023 年 6 月 25 日,在 1951 年的这一天,世界上第一部彩色电视节目播出。电视经过了许多年的发展,人类的娱乐途径随着互联网的到来变…

SpringBoot 如何使用 Spring Test 进行集成测试

SpringBoot 如何使用 Spring Test 进行集成测试 简介 在开发过程中,单元测试是不可或缺的,它可以帮助我们及时发现代码的问题并进行修复,从而提高代码的质量和可维护性。但是,单元测试只能测试单个方法或类的功能,无…

HTTP | 深度解析HTTPS比HTTP 更安全的原因

目录 1. 不安全的 HTTP 🌳 为什么 HTTP 协议不安全呢? 容易被窃听 容易被篡改 容易被伪造身份 🌳 HTTPS 是如何解决以上安全性问题的呢? 数据加密 完整性摘要 数字证书 2. 加密算法 (1)对称加密…

Springboot宠物医院管理系统的设计与实现-计算机毕设 附源码84724

Springboot宠物医院管理系统的设计与实现 摘 要 现如今生活质量提高,人们追求精神健康,与家中宠物朝夕相处,感情深厚,宠物渐渐成了我们身边的朋友。因而宠物生病了,需要去看病,自古医院救死扶伤&#xff0c…

LabVIEW开发汽车发动机故障模拟器

LabVIEW开发汽车发动机故障模拟器 汽车发动机故障模拟器是一种电子培训系统,旨在指导初学者了解发动机的各种故障。有一些参数称为发动机故障,例如脏油、压缩不良、冷却液损失、润滑不良、散热器堵塞、火花爆震和火花塞磨损。任何系统在存在时都有一些缺…