各种预训练模型的理论和调用方式大全

各种预训练模型的理论和调用方式大全

news2025/4/12 23:59:41

诸神缄默不语-个人CSDN博文目录

本文主要以模型被提出的时间为顺序，系统性介绍各种预训练模型的理论（尤其是相比之前工作的创新点）、调用方法和表现效果。

最近更新时间：2023.5.10
最早更新时间：2023.5.10

Bert
Roberta
XLNet
Longformer
序列长度必须是512的整数倍¹
1. 中文版：ValkyriaLenneth/Longformer_ZH
  tokenizer必须要用BertTokenizer²
UniLM
【论文解读】UniLM:一种既能阅读又能自动生成的预训练模型
SciBert
RPT
NEZHA
ERNIE-百度
ERNIE-清华
DistilledBert
Bart
CPT
Pegasus
GPT-2
GPT-3
GPT-3.5
ChatGPT
1. InstructGPT
2. CodeX
  1. ChatGPT技术解析系列之：赋予GPT写代码能力的Codex - 知乎
  2. pass@k
文心一言
Bard

见https://github.com/huggingface/transformers/blob/main/src/transformers/models/longformer/modeling_longformer.py：
↩︎
参考我在该项目下提出的issue：如直接使用LongformerTokenizer会报此错，是否需要使用BertTokenizer？ · Issue #2 · ValkyriaLenneth/Longformer_ZH ↩︎

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/510105.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

上海亚商投顾：沪指缩量调整跌超1% 新能源车产业链掀涨停潮

上海亚商投顾：沪指缩量调整跌超1% 新能源车产业链掀涨停潮

上海亚商投顾前言：无惧大盘涨跌，解密龙虎榜资金，跟踪一线游资和机构资金动向，识别短期热点和强势个股。市场情绪大小指数今日再度分化，沪指低开低走，午后一度跌超1.5%，创业板指则拉升涨超1%&a…

阅读更多...

nodejs安装和环境配置-Windows

nodejs安装和环境配置-Windows

0.安装过程中遇到的常见问题访问：https://blog.csdn.net/weixin_52799373/article/details/125718587?spm1001.2014.3001.5502 1.下载node.js 下载地址: https://nodejs.org/en/ 2.安装 2.1 安装其实就是无脑下一步，第三步的时候可以选择自定义目…

阅读更多...

springboot配置文件加载顺序, java启动参数优先级

springboot配置文件加载顺序, java启动参数优先级

搜索: "spring boot 外化配置" Spring Boot Reference Guide Spring Boot 中文文档参考手册中文版 SpringBoot中配置文件加载位置与优先级_apllication 配置文件项目启动时加载参数_流烟默的博客-CSDN博客 SpringBoot的外部化配置最全解析!_广州建站小戴BOTAO博…

阅读更多...

k8s之HPA（Pod水平自动伸缩）

k8s之HPA（Pod水平自动伸缩）

1.hpa介绍 HPA是根据指标来进行自动伸缩的，目前HPA有两个版本–v1和v2beta HPA的API有三个版本，通过kubectl api-versions | grep autoscal可看到 kubectl api-versions | grep autosca autoscaling/v1 autoscaling/v2beta1 autoscaling/v2beta2 查看使…

阅读更多...

Uboot源码目录分析

Uboot源码目录分析

在分析uboot源码之前一定要在Ubuntu中编译一下uboot源码，因为编译过程会生成一些文件，而生成的这些恰恰是分析uboot源码不可或缺的文件。 arch文件夹存放和架构有关的文件，我们现在用的是ARM芯片，所以只需要关系arm文件夹即可 …

阅读更多...

2.是人就能学会的Spring源码教学-Spring的简单使用

2.是人就能学会的Spring源码教学-Spring的简单使用

是人就能学会的Spring源码教学-Spring的简单使用 Spring的最简单入门使用第一步创建项目第二步配置项目第三步启动项目 Spring的最简单入门使用各位道友且跟我一道来学习Spring的最简单的入门使用，为了方便和简单，我使用了Spring Boot项目&#xff…

阅读更多...

linux CentOs 安装 mysql8.0.30

linux CentOs 安装 mysql8.0.30

心酸历程。。。网上的各种教程都有各种bug，安了三个小时终于安好。现在奉上我的宝典秘籍。第一步，去mysql官网下载，然后将下载的tar包放到linux里面，最好专门创建一个目录来存放，我放到了/usr/local/src的mysql目录下…

阅读更多...

基于51单片机的简易电子秤

基于51单片机的简易电子秤

首先看看题目要求： 1.方案论证 （1）压力传感器的论证与选择方案一：采用惠更斯电桥，当电阻应变片承受载荷产生变形时，其阻值将发生变化。从而使电桥失去平衡，产生相应的差动信号，但…

阅读更多...

Jenkins入门系列之Gitlab账号登录

Jenkins入门系列之Gitlab账号登录

目录背景步骤1. 安装插件2. Gitlab 配置3. Jenkins 配置4. 验证背景版本 Jenkins Version：Jenkins 2.403Gitlab Version: Gitlab 15.6部署环境：群晖NAS Docker 部署JenkinsGitlab Jenkins 默认使用的是自带的数据库，支持LDAP&#xff0…

阅读更多...

【C++】-类和对象之初始化列表（explicit的简单介绍）（下）

【C++】-类和对象之初始化列表（explicit的简单介绍）（下）

💖作者：小树苗渴望变成参天大树 ❤️‍🩹作者宣言：认真写好每一篇博客 💨作者gitee:gitee 💞作者专栏：C语言,数据结构初阶,Linux,C 文章目录前言前言经过前面的好几篇博客，大家应…

阅读更多...

SpringSecurity自定义实现手机短信登录

SpringSecurity自定义实现手机短信登录

SpringSecurity自定义登录验证-手机验证码登录其实实现原理上跟账号密码登录一样的 1、自定义短信验证Token 定义一个仅使用手机号验证权限的鉴权Token，SpringSecurity原生的UsernamePasswordAuthenticationToken是使用username和password，如下图 pr…

阅读更多...

向量时钟算法

向量时钟算法

向量时钟不仅同步本进程的时钟值，而且还同步已知的其他进程时钟值分布式系统中每个进程Pi保存一个本地逻辑时钟向量值VCi，VCi(j)代表进程Pi知道的进程Pj的本地逻辑时钟值初始化VCi向量为[0,…]进程Pi每发生一次事件，VCi[i]加一进程Pi给进…

阅读更多...

应付模块无法关账问题 APP-AR-11332 您必须在关闭此期之前过账其中的所有事务处理

应付模块无法关账问题 APP-AR-11332 您必须在关闭此期之前过账其中的所有事务处理

问题描述 AR关账时遇到了这个问题，根本原因是，因为用户录入另一个贷项的发票，做过核销，后来又取消了核销，未创建会计分类，未传送总，不想要这个贷项发票了，前台删除不了，…

阅读更多...

经验分享，api 接口设计原则有这几条

经验分享，api 接口设计原则有这几条

结合我多年在 API 行业摸爬滚打的经验，我总结了一下，API 接口设计原则有这几条： 接口设计应该简单易用，易于理解和使用； 接口设计应该支持多种格式，如JSON、XML等； 接口设计应该支持多种请求方…

阅读更多...

渲染速度慢，使用云渲染会快多少？

渲染速度慢，使用云渲染会快多少？

设计师在使用软件制作效果图和动画师在制作动画时，其中有一个比较关键的环节就是渲染成像，渲染的效率主要跟使用的电脑显卡或CPU性能有关，如果性能太低，渲染的速度会很慢，拉长了项目整体的交付周期，云渲染速…

阅读更多...

Vite + Vue3 实现前端项目工程化

Vite + Vue3 实现前端项目工程化

Vue3 发布至今，周边的生态、技术方案已足够成熟，个人认为新项目是时候切换到 Vite Vue3 了。今天就给大家操作一下这种技术方案实现前端工程化。 1. 初始化项目通过官方脚手架初始化项目第一种方式，这是使用vite命令创建，这种…

阅读更多...

FM33A048B SPI1/2

FM33A048B SPI1/2

概述芯片的2 个SPI 接口模块SPI1 和SPI2，可配置为主设备或从设备，实现与外部的SPI 通信。特点： ⚫ 全双工3线串行同步收发 ⚫ 2路独立通道 ⚫ 主从模式 ⚫ 可编程时钟极性和相位 ⚫ 可编程比特速率 ⚫ 从模式最大频率为FAHBCLK/2 ⚫ 传输结…

阅读更多...

Hello算法——笔记

Hello算法——笔记

文章目录 1 引言算法数据结构算法和数据结构的关系 2 复杂度分析时间复杂度空间复杂度 3 数据结构数据与内存数据结构分类 4 数组与链表参考资料 1 引言算法算法是一组用于解决特定问题或执行特定任务的明确定义的计算步骤或指令集合。算法可以被视为一种解决问题的方法或…

阅读更多...

【iOS】--手势操作

【iOS】--手势操作

文章目录 UIGestureRecognizer 的继承关系： 使用手势步骤UIPanGestureRecognizer（拖动）UIPinchGestureRecognizer(拖动）UIRotationGestureRecognizer（旋转）UITapGestureRecognizer（点按&#xf…

阅读更多...

浅谈造纸配电室环境监控系统的应用案例

浅谈造纸配电室环境监控系统的应用案例

摘要：智能配电室环境监控系统可实现自动巡检、自动预警等功能，减少人员到现场巡视次数，能及早发现设备的潜在风险，迅速检测故障，节约维护保养时长，为配电生产检修、运行、各业务的标准化、规范化管理提供有…

阅读更多...

推荐文章

最新文章