【ML】自监督学习 self-supervised Learning

news2024/9/21 11:06:35

【ML】 自监督学习

      • 1. 自监督学习 bert 为例子
        • 1.1 BERT 的特点:
        • 1.2 BERT 的模型结构:
        • 1.3 训练 BERT 的步骤:
      • 2. how to use BERT![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/f8cccb378f844923a057043fadb60758.png)
      • 2. multi-lingual BERT
      • 3. GPTs
      • bert 应用到 图像

在这里插入图片描述
在这里插入图片描述

1. 自监督学习 bert 为例子

BERT(Bidirectional Encoder Representations from Transformers)是一种预训练语言表示的方法,由 Google 在 2018 年提出。它是基于 Transformer 架构的模型,主要用于自然语言处理(NLP)任务。BERT 的核心特点和结构如下:

1.1 BERT 的特点:
  1. 双向编码器

    • BERT 使用 Transformer 的编码器部分,并且是第一个成功应用双向训练的语言模型,即在预训练阶段同时考虑了左右两侧的上下文信息。
  2. 深层和广泛层连接

    • BERT 模型通常包含多层 Transformer 编码器堆叠,每层都包含自注意力机制和前馈网络。
  3. 大规模预训练

    • BERT 在大量文本数据上进行预训练,这些数据可以是书籍、网页等,从而学习到丰富的语言表示。
  4. 任务灵活性

    • 预训练完成后,BERT 可以用于各种下游 NLP 任务,如文本分类、问答、命名实体识别等,通常通过在预训练模型上添加少量任务特定层来实现。
  5. 微调能力

    • BERT 支持微调(Fine-tuning),即在下游任务上进一步训练预训练模型,以学习特定于任务的信息。
1.2 BERT 的模型结构:
  1. 嵌入层

    • 包括词嵌入、位置嵌入和段嵌入,用于将输入文本转换为模型可以处理的数值向量。
  2. 多头自注意力机制

    • 允许模型在编码单词时同时考虑不同位置的上下文信息。
  3. 前馈网络

    • 在每个 Transformer 层中,自注意力层的输出会通过一个前馈网络进一步处理。
  4. 层归一化

    • 在每个子层的输入和输出上应用层归一化,以稳定训练过程。
  5. 残差连接

    • 每个子层的输出通过残差连接与输入相加,以帮助梯度流动。
1.3 训练 BERT 的步骤:
  1. 预训练

    • 使用大量无标签文本数据进行预训练,主要通过以下两个任务:
      • 遮蔽语言模型(Masked Language Model, MLM):随机遮蔽输入句子中的一些单词,然后预测这些单词。
      • 下一句预测(Next Sentence Prediction, NSP):预测两个句子是否是连续的句子。
  2. 微调

    • 在特定的下游任务上进一步训练预训练得到的 BERT 模型。这通常涉及到在模型顶部添加任务特定的层,并使用带标签的数据进行训练。
  3. 数据准备

    • 对于下游任务,准备并预处理数据,包括分词、构建词汇表、编码文本等。
  4. 模型配置

    • 根据任务需求选择合适的 BERT 模型配置,如层数、隐藏层大小等。
  5. 损失函数和优化器

    • 定义适合下游任务的损失函数,并选择合适的优化器进行模型训练。
  6. 训练和验证

    • 执行模型训练,并在验证集上评估性能,调整超参数。
  7. 保存和加载模型

    • 在训练过程中保存模型的检查点,并在需要时加载模型进行进一步的训练或测试。
  8. 评估

    • 在测试集上评估模型的最终性能,使用适当的评估指标。
  9. 部署

    • 将训练好的模型部署到生产环境中,用于实际的 NLP 任务。

BERT 模型由于其强大的语言表示能力,在 NLP 领域取得了显著的成果,并激发了一系列基于 Transformer 的预训练语言模型的发展。

在这里插入图片描述
在这里插入图片描述在这里插入图片描述

在这里插入图片描述

GLUE数据集是一中对机器学习小任务的能力评估模型,这里可以看出随着算法的发展,在多个子任务上机器的能力已经超过人类,部分子任务机器的能力自逼近人类的能力
在这里插入图片描述

2. how to use BERT在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. multi-lingual BERT

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

multi-lingual bert 200k 训练 loss 有点大, 但是当数据量达到1000k 的时候 LOss 在训练一周后 开始下降
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

分别计算训练后 BERT 在不同语言下的中心 在翻译的过程中 减去中心后 就会得到不同语言下的对齐的结果
在这里插入图片描述
在这里插入图片描述

3. GPTs

在这里插入图片描述
在这里插入图片描述

GPT实现一个假新闻: 安第斯山脉发现以恶搞独角兽
在这里插入图片描述
在这里插入图片描述
bert 的模型是基于各种已有问题的训练, 但是GPT的模型作者的脑洞更大,并且实现了,以下三种模式,就是给出要做的事情,给出几个样例,然后给出问题,采用提示词大的方式来与模型交互,可能也是大经历过 非常大的规模的数据训练出来的模型才有的一种“智能”的形式吧,也即探索的本质——压缩
在这里插入图片描述
在这里插入图片描述

bert 应用到 图像

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1990606.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

DL00765-光伏故障检测高分辨率无人机热红外图像细粒度含数据集4000+张

光伏发电作为清洁能源的重要组成部分,近年来得到了广泛应用。然而,随着光伏电站规模的扩大,光伏组件在运行过程中可能会出现各种故障,如热斑、遮挡、接线盒故障等。这些故障不仅会影响光伏电站的发电效率,还可能导致更…

【日常开发】 java返回ECharts数据结构封装

java返回ECharts数据结构封装 一、前端页面示例图如下: 二、准备测试数据: 三、后端 格式封装代码: 四、最终结果: 🎈边走、边悟🎈迟早会好 一、前端页面示例图如下: 二、准备测试数据&am…

4.11.seq2seq 序列到序列学习

序列到序列学习(seq2seq) ​ 使用两个循环神经网络的编码器和解码器&#xff0c;应用于序列到薛烈类的学习任务。 ​ ​ 在图中&#xff0c;特定的"<eos>"表示序列结束词元。一旦输出序列生成此词元&#xff0c;模型就会停止预测。在循环神经网络解码器的初…

Go语言中gin+gorm开发前端端分离博客时遇到的问题,gorm执行查询时如何选中特定字段?

代码获取 本篇文章的代码放在了Github上&#xff0c;可以免费获取。 https://github.com/zhangdapeng520/zdpgo_gin_examples 概述 在查询用户信息的时候&#xff0c;由于密码这个字段比较敏感&#xff0c;需要进行处理&#xff0c;不要返回给前端。 我一开始的解决方案是直…

统计学:条件概率模型

照片由Edge2Edge Media在Unsplash上拍摄 一、介绍 在概率的许多应用中&#xff0c;不可能直接观察实验的结果&#xff1b;而是观察与结果相关的事件。因此&#xff0c;条件概率模型对于考虑和利用从观察到的事件中获得的信息至关重要。此外&#xff0c;条件概率模型与贝叶斯定理…

【vue3】【elementPlus】【黑暗模式】

从创建vue3项目到引入elementPlus组件并设置黑暗模式 1.创建vue3项目&#xff1a; npm init vuelatest1.1 根据需求定制项目插件&#xff1a; 2.引入elementPlus组件&#xff1a; npm install element-plus --save2.1 如图注册全局elementPlus组件&#xff1a; ------------…

充电不再难,高质量充电体系‘智’领绿色出行新时代

充电不再难&#xff0c;高质量充电体系‘智’领绿色出行新时代 国家发展改革委新闻发言人近日在新闻发布会上郑重声明&#xff0c;将持续强化统筹协调&#xff0c;协同各相关部门加速构建高质量充电基础设施体系&#xff0c;以更有效地满足人民群众对绿色出行的需求。 新能源汽…

C语言:文件处理

文件处理 一、文件的类型&#xff08;一&#xff09;文本文件和二进制文件 &#xff08;二&#xff09;程序文件和数据文件数据文件按照二进制储存 二、文件的打开和关闭&#xff08;一&#xff09;文件指针&#xff08;二&#xff09;文件的打开和关闭1、fopen2、fclose &…

webshell管理工具-中国蚁剑

中国蚁剑 版本说明&#xff1a;中国蚁剑 下载地址&#xff1a;GitHub - AntSwordProject/AntSword-Loader: AntSword 加载器AntSword 加载器. Contribute to AntSwordProject/AntSword-Loader development by creating an account on GitHub.https://github.com/AntSwordProj…

数值分析【2】

目录 第三章 求解三角方程组​编辑 高斯消元​编辑 乘除次数&#xff1a;系数阵k^2,每行系数计算1&#xff0c;右边那列1 乘除总次数&#xff1a;​编辑 平方和 公式 列主元消去法 ​编辑 目的&#xff1a;舍入误差不扩散​编辑 直接LU分解​编辑 改进平方…

C#开发常见面试题三(浅复制和深复制的区别)

C#开发常见面试题三(浅复制和深复制的区别) 一.浅复制和深复制定义 &#xff08;1&#xff09;浅复制&#xff1a;复制一个对象的时候&#xff0c;仅仅复制原始对象中所有的非静态类型成员和所有的引用类型成员的引用。&#xff08;新对象和原对象将共享所有引用类型成员的实…

django如何更新数据库字段并与数据库保持同步?

关键步骤&#xff1a; 第一步&#xff1a; 执行&#xff1a;python manage.py makemigrations 你的项目名称第二步&#xff1a;它会提示你选1还是2&#xff0c;这里因为添加字段&#xff0c;所以选1第三步&#xff1a;出现>>>这个&#xff0c;直接输入这个第四步&am…

Win11+docker+vscode配置anomalib并训练自己的数据(3)

在前两篇博文中,我使用Win11+docker配置了anomalib,并成功的调用了GPU运行了示例程序。这次我准备使用anomalib训练我自己的数据集。 数据集是我在工作中收集到的火腿肠缺陷数据,与MVTec等数据不同,我的火腿肠数据来源于多台设备和多个品种,因此,它们表面的纹理与颜色差异…

C语言 | Leetcode C语言题解之第329题矩阵中的最长递增路径

题目&#xff1a; 题解&#xff1a; const int dirs[4][2] {{-1, 0}, {1, 0}, {0, -1}, {0, 1}}; int rows, columns;typedef struct point {int x, y; } point;int longestIncreasingPath(int** matrix, int matrixSize, int* matrixColSize) {if (matrixSize 0 || matrixC…

基于双PI+EKF扩展卡尔曼滤波的PMSM速度控制simulink建模与仿真

目录 1.课题概述 2.系统仿真结果 3.核心程序与模型 4.系统原理简介 4.1 PMSM数学模型 4.2 双PI控制器设计 4.3 扩展卡尔曼滤波器(EKF) 4.4 控制系统实现 5.完整工程文件 1.课题概述 基于双PIEKF扩展卡尔曼滤波的PMSM速度控制simulink建模与仿真。对比基于双PI的扩展卡…

【C/C++笔记】:易错难点3 (二叉树)

选择题 &#x1f308;eg1 一棵有15个节点的完全二叉树和一棵同样有15个节点的普通二叉树&#xff0c;叶子节点的个数最多会差多少个&#xff08;&#xff09;&#xff1f; 正确答案&#xff1a; C A. 3 B. 5 C. 7 D. 9 解析&#xff1a;普通二叉树的叶子节…

Java刷题:轮转数组

目录 题目 解题思路 完整代码 题目 给定一个整数数组 nums&#xff0c;将数组中的元素向右轮转 k 个位置&#xff0c;其中 k 是非负数。 示例: 输入: nums [1,2,3,4,5,6,7], k 3 输出: [5,6,7,1,2,3,4] 解题思路 主要的解题思路是&#xff0c;先把整个数组翻转过来&a…

如何解决.NET8 类库Debug时,Debug文件夹中不包含Packages中引入的文件

最近在开发中使用了.NET8 Razor类库项目&#xff0c;但是惊讶的发现Debug时&#xff0c;Debug文件夹中不包含Packages中引入的文件&#xff0c;本以为是非常小的问题&#xff0c;但是被困住了竟然足足4个小时。 其实它也本就是个非常非常小的问题…… 只需引入<CopyLocalL…

智驭灌区,科技领航—— 高效灌区信息化系统管理平台

在水资源日益珍贵的今天&#xff0c;传统灌区的粗放式管理模式已难以满足现代农业的发展需求。我们自豪地推出——灌区信息化系统管理平台&#xff0c;以科技赋能水利&#xff0c;引领灌溉管理进入智能化、精细化新时代。 【智能决策&#xff0c;精准灌溉】 告别传统灌溉的盲目…

84.WEB渗透测试-信息收集-框架组件识别利用(8)

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 内容参考于&#xff1a; 易锦网校会员专享课 上一个内容&#xff1a;83.WEB渗透测试-信息收集-框架组件识别利用&#xff08;7&#xff09; 识别的作用&#…