【生成式预训练语言模型】

【生成式预训练语言模型】

news2024/9/9 5:06:40

生成式预训练语言模型

一、图灵测试到自然语言处理( Natural Language Processing, NLP)发展简史
- 1.语言模型的引入
- 2.语言模型的进化
- - 2.3 基于统计的语言模型
  - 2.4 基于深度学习的语言模型
  - 2.5 语言模型发展的里程碑
  - 2.6 预训练模型
- 3.问题
总结

一、图灵测试到自然语言处理( Natural Language Processing, NLP)发展简史

1.语言模型的引入

语言是信息的载体
通信模型
NLP

语言模型的定义：
计算和预测自然语言序列概率分布的模型
分析语言数据来推断和预测语言现象
可以判断一个语言序列是否是正常句子
可以根据给定的上下文，预测接下来会出现的单词

2.语言模型的进化

起源图灵测试
——
基于规则（太过复杂，容错率低）
——
基于统计（判断哪个更像句子——判断哪个句子的概率大。是“写了”“本书”的概率高，哈斯hi“写了”“学生”的概率高）
——
深度学习大数据驱动
贾利尼克的假设：一个句子是否合理，取决于出现在自然语言种的可能性的大小

2.3 基于统计的语言模型

句子出现的可能性——每个词按照特定顺序出现的可能性
条件概率

2.4 基于深度学习的语言模型

2003年，Bengio团队发表论文“A Neural Probabilistic language Model”首次提出了将神经网络应用于语言模型的概念

2.5 语言模型发展的里程碑

1948 N-gram model：基于钱n-1个词来预测序列的下一个词
1954 Bag-of-words 词袋模型，统计词频，转换为概率问题
2003 Probabilistic language Model
2013 word2vec简单高效的分布式单词表示方法
2018 pre-trained language model 预训练模型

2.6 预训练模型

目前所用的

编码器家族——都是基于BERT的模型
BERT:Bi-direction Encoder Representation Transformer——双向编码表示transformer
其他都是BERT的改装

解码器家族——GPT
generative pretrain transformer——生成（单向）预训练transformer

3.问题

总结

输入输出

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1961475.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Spring boot tomcat 读写超时时间设置

Spring boot tomcat 读写超时时间设置

yaml配置 connection-timeout: 20000 server:port: 9898servlet:context-path: /testtomcat:connection-timeout: 20000max-connections: 250accept-count: 300 spring源码设置自定义tomcat参数 customizeConnector(connector); Overridepublic WebServer getWebServer(Serv…

阅读更多...

【MySQL】表的约束{ 常见约束空属性默认值列描述comment zerofill 主键复合主键自增长唯一键外键 }

【MySQL】表的约束{ 常见约束空属性默认值列描述comment zerofill 主键复合主键自增长唯一键外键 }

文章目录常见约束空属性默认值列描述commentzerofill主键复合主键自增长唯一键外键 2.总结真正约束字段的是数据类型，但是数据类型约束很单一，需要有一些额外的约束，更好的保证数据的合法性，从业务逻辑角度保证数据的正确性。比…

阅读更多...

MySQL基础练习题12-使用唯一标识码替换员工ID

MySQL基础练习题12-使用唯一标识码替换员工ID

题目：展示每位用户的唯一标识码（unique ID ）；如果某位员工没有唯一标识码，使用 null 填充即可。准备数据分析数据题目：展示每位用户的唯一标识码（unique ID ）；如果…

阅读更多...

一，创建工程，引入依赖

一，创建工程，引入依赖

一， 创建工程，引入依赖文章目录一， 创建工程，引入依赖创建工程工程间的关系的建立配置各个工程当中的 pow 配置信息，相关的依赖父工程(也就是总项目工程)的 pow 配置demo-module06-generate 模块中pow 配置&#xff…

阅读更多...

基于IEC61499标准的在线工业编程平台open61499

基于IEC61499标准的在线工业编程平台open61499

基于IEC61499标准的在线工业编程平台open61499是一个专为工业自动化领域设计的编程环境，它遵循IEC 61499标准，为开发者提供了一种高效、灵活的方式来创建、配置和管理分布式控制系统（DCS）的应用程序。以下是对open61499的详细解析…

阅读更多...

LeetCode热题翻转二叉树、二叉树最大深度、二叉树中序遍历

LeetCode热题翻转二叉树、二叉树最大深度、二叉树中序遍历

目录一、翻转二叉树 1.1 题目链接 1.2 题目描述 1.3 解题思路二、二叉树最大深度 2.1 题目链接 2.2 题目描述 2.3 解题思路三、二叉树中序遍历 3.1 题目链接 3.2 题目描述 3.3 解题思路一、翻转二叉树 1.1 题目链接翻转二叉树 1.2 题目描述 1.3 解题思路根…

阅读更多...

【多模态大模型】 BLIP in ICML 2022

【多模态大模型】 BLIP in ICML 2022

一、引言论文： BLIP: Bootstrapping Language-Image Pre-training for Unified Vision-Language Understanding and Generation 作者： Salesforce Research 代码： BLIP 特点： 该方法分别使用ViT和BERT进行图像和文本特征提取&am…

阅读更多...

【changchain-community安装失败】‘EntryPoints‘ object has no attribute ‘get‘报错解决

【changchain-community安装失败】‘EntryPoints‘ object has no attribute ‘get‘报错解决

在安装changchain-community时报错信息如下： WARNING: Keyring is skipped due to an exception: EntryPoints object has no attribute get ERROR: Could not find a version that satisfies the requirement changchain-community ERROR: No matching distributio…

阅读更多...

进程间通信与线程间通信的方法汇总

进程间通信与线程间通信的方法汇总

目录一、进程间通信机制管道(pipe)： 命名管道(FIFO)： 消息队列(MQ)： 信号量(semaphore)： 共享内存(shared memory)： 信号(signal)： 内存映射(mapped memory)： 内存映射和共享内存的区…

阅读更多...

华杉研发九学习日记20 LinkedHashMap TreeMap Arrays 函数式接口方法引用

华杉研发九学习日记20 LinkedHashMap TreeMap Arrays 函数式接口方法引用

华杉研发九学习日记20 一，LinkedHashMap 与HashMap相比，key是有序的 Map<Integer,String> map new LinkedHashMap<Integer,String>(); map.put(1, "one"); map.put(2, "two"); map.put(3, "three"); map.…

阅读更多...

GitHub Desktop commit文件到repository

GitHub Desktop commit文件到repository

1. Clone a repository到本地 2. 在本地仓库修改/添加需要提交的文件或者文档 3. 添加comments并commit 4. 提交完成，点击Push origin提交代码到Github远程仓库上传成功后，刷新Github网站页面就会出现上传的项目

阅读更多...

鸿蒙应用框架开发【自绘编辑框】输入法框架

鸿蒙应用框架开发【自绘编辑框】输入法框架

自绘编辑框介绍本示例通过输入法框架实现自会编辑框，可以绑定输入法应用，从输入法应用输入内容，显示和隐藏输入法。效果预览使用说明 1.点击编辑框可以绑定并拉起输入法，可以从输入法键盘输入内容到编辑框。 2.可以点击a…

阅读更多...

SSM老人服务管理系统小程序-计算机毕业设计源码91022

SSM老人服务管理系统小程序-计算机毕业设计源码91022

摘要 21世纪的今天，随着社会的不断发展与进步，人们对于信息科学化的认识，已由低层次向高层次发展，由原来的感性认识向理性认识提高，管理工作的重要性已逐渐被人们所认识，科学化的管理，使信息存…

阅读更多...

跨网段 IP 地址通信故障分析

跨网段 IP 地址通信故障分析

现如今计算机网络的规模和复杂性不断增加，跨网段通信成为网络运行中的常见需求。但如果设备处于不同网段且路由设置出现偏差时就会导致通信故障，严重影响网络的正常运行和数据传输。 1.跨网段通信的基本原理跨网段通信依赖于路由器的路由功能。路由器根…

阅读更多...

vue3.0 入门基础知识汇总【1】全面精简推荐

vue3.0 入门基础知识汇总【1】全面精简推荐

这篇博文主要对一些刚入门vue框架的同学，以及对vue基本知识进行巩固的，最后就是精简一下基本知识，以方便自己查看，感谢参考，有问题评论区交流，谢谢。目录 1.component组件的基本结构和使用 2.method方法…

阅读更多...

全网最适合入门的面向对象编程教程：28 类和对象的Python实现-Python编程原则、哲学和规范大汇总

全网最适合入门的面向对象编程教程：28 类和对象的Python实现-Python编程原则、哲学和规范大汇总

全网最适合入门的面向对象编程教程：28 类和对象的 Python 实现-Python 编程原则、哲学和规范大汇总摘要： 本文主要介绍了在使用 Python 进行面向对象编程时，Python 异常处理的原则-“请求谅解，而非许可”，以及软件设…

阅读更多...

什么是安全编程？

什么是安全编程？

安全编程（Secure Programming）是一种编程方法论，旨在通过编写安全可靠的代码来保护计算机系统和数据的安全性。它涵盖了软件设计、开发、测试和维护的整个生命周期，旨在最大程度地降低软件漏洞和安全缺陷的风险。以下是对安全编程…

阅读更多...

【前端 20】Element-UI快速入门

【前端 20】Element-UI快速入门

探索Element UI组件库：快速搭建Vue应用的必备工具在现代Web开发中，Vue.js以其轻量级和灵活性赢得了广泛的关注。而Element UI，作为Vue.js的一个UI组件库，更是为开发者们提供了丰富、易用的前端组件，极大地加速了开发过…

阅读更多...

Spring源码(八)--Spring实例化的策略

Spring源码(八)--Spring实例化的策略

Spring实例化的策略有几种 ，可以看一下 InstantiationStrategy 相关的类。 UML 结构图 InstantiationStrategy的实现类有 SimpleInstantiationStrategy。 CglibSubclassingInstantiationStrategy 又继承了SimpleInstantiationStrategy。 InstantiationStrategy I…

阅读更多...

Java----反射

Java----反射

什么是反射？ 反射就是允许对成员变量、成员方法和构造方法的信息进行编程访问。换句话来讲，就是通过反射，我们可以在不需要创建其对象的情况下就可以获取其定义的各种属性值以及方法。常见的应用就是IDEA中的提示功能，当我…

阅读更多...

推荐文章

最新文章