Lecture 11：How versatile are self-supervised models

news2026/2/16 2:34:39

目录

Story 1: Cross-lingual

Story 2: Cross-discipline

Story 3: Pre-training with artificial data

（story1和story2的内容在前面课程中有讲过，这里笔记部分不再详述）

Story 1: Cross-lingual

多语言BERT具有跨语言的能力，例如fine-tune在英文上，testing在中文上：

实验结果如下：

multilingual BERT不只是把不同语言同样意思的词汇对应在一起，它还存有语言的资讯

Story 2: Cross-discipline

self-supervised model不只有跨语言的能力，它还有跨学科的能力：

例如，用pre-train在英语上的BERT做DNA分类：

下图结果表明，在人类语言上pre-train，对于DNA的任务，在optimization和generalization上都有帮助：

跨学科的能力的应用举例——speech question answering：

上图中的model把speech question answering做起来，可以得到54 percent的F1 score。下图表格中绿色的线，代表先做语言辨识（把声音讯号转成文字），再在文字上面做question answering，它的正确率显然受到语音辨识正确率的影响。当语言辨识错误率为25%以上的时候，绿色线的F1 score就低于54 percent：

Story 3: Pre-training with artificial data

——在人造的资料上训练出BERT：

Pre-training on Artificial Data:

实验结果如下：

Pre-training on random tokens yields the same performance as training from scratch.——说明Data plays the role.

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/500753.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Linux-Day01

Linux-Day01

Linux-Day01 课程内容 Linux简介Linux安装Linux常用命令 1. 前言 1.1 什么是Linux Linux是一套免费使用和自由传播的操作系统。说到操作系统，大家比较熟知的应该就是Windows和MacOS操作系统，我们今天所学习的Linux也是一款操作系统。 1.2 为什么要学…

阅读更多...

12.IO流

12.IO流

1.字符流 1.1为什么会出现字符流【理解】字符流的介绍由于字节流操作中文不是特别的方便，所以Java就提供字符流字符流字节流编码表中文的字节存储方式用字节流复制文本文件时，文本文件也会有中文，但是没有问题，原因是最…

阅读更多...

消息队列中的事务消息

消息队列中的事务消息

大家好，我是易安！今天我们谈一谈消息队列中的事务消息这个话题。一说起事务，你可能自然会联想到数据库。我们日常使用事务的场景，绝大部分都是在操作数据库的时候。像MySQL、Oracle这些主流的关系型数据库，也都提供了…

阅读更多...

Java --- springboot2之异常处理

Java --- springboot2之异常处理

仅供参考目录一、异常处理二、异常处理自动配置原理三、异常处理流程四、定制错误处理逻辑 4.1、自定义错误页 4.2、ControllerAdviceExceptionHandler处理全局异常 4.3、ResponseStatus自定义异常 4.4、Spring底层的异常，如参数类型转换异常 4.5、自定义…

阅读更多...

7种常见网络并发模型介绍

7种常见网络并发模型介绍

概述对于网络服务器后端开发，为满足不同并发场景的需要，一般来说，不外乎几种常见的并发模型，除了一些教学场景常用的单线程、多进程（线程）的服务器实现外，生产用的服务器，一般都会…

阅读更多...

Linux多路IO复用：epoll

Linux多路IO复用：epoll

1. epoll epoll是为克服select、poll每次监听都需要在用户、内核空间反复拷贝，以及需要用户程序自己遍历发现有变化的文件描述符的缺点的多路IO复用技术。 epoll原理创建内核空间的红黑树； 将需要监听的文件描述符上树； 内核监听红黑树上…

阅读更多...

实验室设备管理系统

实验室设备管理系统

访问【WRITE-BUG数字空间】_[内附完整源码和文档] 应用背景为方便实验室进行设备管理，某大学拟开发实验室设备管理系统来管理所有实验室里的各种设备。系统可实现管理员登录，查看现有的所有设备， 增加设备等功能。开发环境 Mac OS PyCha…

阅读更多...

JAVA：Springboot 装配数据库Hikari和Druid连接池

JAVA：Springboot 装配数据库Hikari和Druid连接池

1、JDBC Java数据库连接（Java Database Connectivity，简称JDBC）是Java语言中用来规范客户端程序如何来访问数据库的应用程序接口，提供了诸如查询和更新数据库中数据的方法。 JDBC API主要位于JDK中的java.sql包中（之后…

阅读更多...

出现小红书点赞多粉丝少的情况，原因在哪里

出现小红书点赞多粉丝少的情况，原因在哪里

刚开始运营自己账号的小伙伴们有时发现明明笔记点赞数量不少，但偏偏账号粉丝数量就是一直不怎么涨，像这样小红书点赞多粉丝少是怎么回事呢?今天就来说说，小红书该如何吸引用户关注。一、小红书点赞多粉丝少是怎么回事一般来说，…

阅读更多...

从MIMIC学习组织自己的数据

从MIMIC学习组织自己的数据

从MIMIC学习组织自己的数据相对于SEER数据库（我们得到的是几乎可以直接进行分析的数据），MIMIC 数据库在数据采集后虽然经过了一定的处理，但是保留了数据库原始的样貌，所以我们除了对MIMIC数据进行分析外，…

阅读更多...

推荐算法之DeepFM

推荐算法之DeepFM

论文：DeepFM: A Factorization-Machine based Neural Network for CTR Prediction Github：https://github.com/ChenglongChen/tensorflow-DeepFM https://github.com/shenweichen/DeepCTR IJCAI2017 本文将深度神经网络dnn和因式分解机Factorization-M…

阅读更多...

程序中各种异常报错，对于JVM调优记录

程序中各种异常报错，对于JVM调优记录

一：GC overhead limit exceeded 数据量过大：当应用程序处理大量的数据时，会占用大量的内存和计算资源。如果内存资源不足，则可能会在垃圾回收过程中出现 GC overhead limit exceeded 错误程序代码有问题：如果应用程…

阅读更多...

Vmware虚拟机问题解决方案

Vmware虚拟机问题解决方案

Vmware虚拟机问题解决方案 1. 运行虚拟机系统蓝屏可能的原因有两个: 1). 虚拟机所在磁盘的空间不足 ; -------> 清理磁盘空间。 2). 操作系统版本高, 需要适配新版本的Vmware ; ------> 卸载Vmware15版本, 安装Vmware16版本。 2. 卸载Vmware步骤 1). 卸载已经安…

阅读更多...

商用密码产品认证中的随机数（一）

商用密码产品认证中的随机数（一）

1 商密认证中的随机数介绍如果说密钥的安全是密码产品的基石，那随机数的安全就是密钥安全的基石。密码产品设计和商用密码产品认证中，随机数的合规性也是需要重点关注的环节。随机数的合规性主要包括： 随机数的来源合规。如果是自行设计的…

阅读更多...

一点通路由模拟实验8

一点通路由模拟实验8

首先先设置hostA和hostB和hostC的ip 其次设置路由接口的各个ip 路由A 像这样的，再设置路由B 唯一要记住的是，时钟只要设置一个就行就是clock rate 6400，之后开启路由：ip routing 然后就是查看路由表了（路由A&#…

阅读更多...

Lecture 12(Preparation)：Reinforcement Learning

Lecture 12(Preparation)：Reinforcement Learning

目录 What is RL? (Three steps in ML) Policy Gradient Actor-Critic Reward Shaping No Reward: Learning from Demonstration It is challenging to label data in some tasks. 例如下围棋时，下一步下在哪个位置最好是不太好确定的，此时可以考虑…

阅读更多...

无线传感器网络路由优化中的能量均衡LEACH改进算法（Matlab代码实现）

无线传感器网络路由优化中的能量均衡LEACH改进算法（Matlab代码实现）

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述由于簇的规模和簇头选择对WSN总能耗影响较大：一方面，当簇的规模较小时，易导致WSN能量消耗不…

阅读更多...

2021年NOC大赛编程马拉松赛道图形化中高组模拟卷,包含答案

2021年NOC大赛编程马拉松赛道图形化中高组模拟卷,包含答案

目录单选题：判断题：下载文档打印做题： 2021年NOC大赛编程马拉松赛道图形化中高组模拟卷单选题： 1.雪球不小心误入了图灵学院旁边山林中的一个洞穴，一直都没有出来，禾木、桃子和小核桃打算进去找她，洞穴里漆黑一片，三人走着走着，不知怎么也走散了。如下图所示，…

阅读更多...

加速开放计算产业化，OCTC五大原则瞄准需求痛点

加速开放计算产业化，OCTC五大原则瞄准需求痛点

回顾计算产业过去十余载的历程，开放计算始终是一个绕不开的核心焦点。始于2011年Facebook发起的数据中心硬件开源项目--开放计算项目（简称：OCP），开放计算犹如星星之火，不仅迅速形成燎原之势，更…

阅读更多...

windows安装GO语言环境

windows安装GO语言环境

GO语言版本 Windows 平台和 Mac 平台推荐下载可执行文件版，Linux 平台下载压缩文件版。版本：1.16.8 出现上面这个界面就说明已经安装好了查看GO版本可以打开终端窗口，输入go version命令，查看安装的 Go 版本 C:\Users\8617…

阅读更多...

推荐文章

最新文章