跟李沐学AI：语言模型

跟李沐学AI：语言模型

news2026/2/13 22:48:14

语言模型定义

假设在给定长度为T的文本序列中的词元依次为 $x_1,x_2,\dots ,x_t$ ， $x_t$ 可被人做文本序列在时间步t处的观测或标签。在给定这样的文本序列是，语言模型的目标是估计序列的联合概率 $P(x_1,x_2,\dots ,x_t)$ 。

一个理想的与语言模型能够在一次抽取一个词元 $x_t\sim P(x_t \mid x_{t-1},\dots ,x_1)$ 的情况下基于模型本身生成自然文本。

学习语言模型

基于语言模型的基本规则，一个包含了四个单词的文本序列的概率是：

为了训练语言模型，我们需要计算单词的概率，以及给定前面几个单词后出现某个单词的条件概率。这些概率本质上就是语言模型的参数。

马尔可夫模型与n元语法

当文本序列很长、文本量不够时，使用计数方法进行建模可能效果不佳。因此，可以在语言模型中引入马尔可夫模型以缓解这个问题。

涉及一个、两个和三个变量的概率公式分别被称为 一元语法（unigram）、二元语法（bigram）和三元语法（trigram）模型。

n元语法对应马尔可夫模型中的tau=n。一元语法认为每个token都是独立的。二、三元语法认为每个token与当前token的前两个token相关。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2106675.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

力扣343-整数拆分（Java详细题解）

力扣343-整数拆分（Java详细题解）

题目链接：343. 整数拆分 - 力扣（LeetCode） 前情提要： 因为本人最近都来刷dp类的题目所以该题就默认用dp方法来做。 dp五部曲。 1.确定dp数组和i下标的含义。 2.确定递推公式。 3.dp初始化。 4.确定dp的遍历顺序。 5.如果没…

阅读更多...

vue项目 / 资产管理

vue项目 / 资产管理

参考： https://blog.csdn.net/A_Common_Man/article/details/124601367 App.vue <template><div id"app"><div class container><h4 style"text-align: center; margin-top: 20px">资产管理</h4> <table …

阅读更多...

【C语言进阶】C语言进阶教程：利用结构体、联合体和枚举自定义数据类型

【C语言进阶】C语言进阶教程：利用结构体、联合体和枚举自定义数据类型

📝个人主页🌹：Eternity._ ⏩收录专栏⏪：C语言 “ 登神长阶 ” 🤡往期回顾🤡：C语言内存管理函数 🌹🌹期待您的关注 🌹🌹 ❀C语言自定义类型 &#…

阅读更多...

编译 ffmpeg 以支持AVS格式视频解码与解码

编译 ffmpeg 以支持AVS格式视频解码与解码

前言当前文章介绍如何在Linux下使用FFmpeg转码其他视频格式到AVS格式的指南，包括编译FFmpeg以支持XAVS编码和如何使用FFmpeg进行转码。 AVS (Audio Video Coding Standard) 格式是一种由中国主导制定的视频编码标准，全称为“中国数字音视频编解码技术…

阅读更多...

将星 x17 安装ubuntu 20.04 双系统

将星 x17 安装ubuntu 20.04 双系统

准备工作，包含关闭快速启动，关闭Secret Boot 1.进入控制面板选择小图标，找到电源选项 2.点击更改当前不可用的设置，关闭快速启动 3.开机启动时快速按F2，进入BIOS 4.选择Setup Utiltity，选择Security&#…

阅读更多...

鲁大师8月新机性能/流畅/AI/久用榜：新机节奏放缓，但不乏小惊喜

鲁大师8月新机性能/流畅/AI/久用榜：新机节奏放缓，但不乏小惊喜

虽说8月紧邻开学季，但机圈发布新机的节奏相较7月，明显放缓不少，或许是华为和苹果将在9月10日这天再次正面硬刚，让其他厂商感觉“亚历山大”，不冒险当出头鸟；亦或是各手机厂商正为骁龙8 Gen4和天玑9400新旗舰…

阅读更多...

C++入门9——list的使用

C++入门9——list的使用

目录 1.什么是list？ 2.list的构造 3.list迭代器的使用（list iterator） 4.list capacity 5.list modifiers 6.list的其他操作 1.什么是list？ 在官网中，对list有这样的介绍： Lists are sequence co…

阅读更多...

如何在VSCODE中查看西门子PLC的SCL程序？

如何在VSCODE中查看西门子PLC的SCL程序？

如何在VSCODE中查看西门子PLC的SCL程序？首先，下载并安装VSCODE，安装完成后，默认为英文界面，点击左侧扩展栏，搜索中文语言包，并点击安装，安装完成后会提示重启，重启之后就会显示中文，同样，在扩展中搜索SCL插件包，并点击安装，安装完成之后，可以新建一个文本文件…

阅读更多...

在 Elastic 8.15 中使用最少的代码快速构建 RAG

在 Elastic 8.15 中使用最少的代码快速构建 RAG

作者：来自 Elastic Han Xiang Choong Elastic 8.15 已经发布，语义搜索比以往任何时候都更容易实现。我们将介绍如何在 15 分钟内完成所有这些任务： 将你的文档存储在某些数据存储服务中，例如 AWS S3 Bucket设置 Elastic Search…

阅读更多...

java项目docker部署时进行热部署

java项目docker部署时进行热部署

本文需要pontwiner进行配合操作 1.上传文件到对应服务器，可以通过xftp等文件上传工具进行文件上传 2.获取docker imagId XX为项目部署名称例如：test-server docker ps -a |grep XX 3.复制文件到docker容器的/tmp目录下 docker cp XXXX.class im…

阅读更多...

做seo要注意的各种细节，你都注意到了吗

做seo要注意的各种细节，你都注意到了吗

在实施seo时，关注各种细节是至关重要的。这些细节始于网站的初始设计，包括选择合适的主机、规划网站结构、优化网站内容，以及建立内部和外部链接的策略等。此外，确保网站对搜索引擎友好，涵盖从URL的设计到内容的优化…

阅读更多...

kafka的安装和启动

kafka的安装和启动

一、kafka介绍 1，kafka简单介绍 kafka是一款分布式、支持分区的、多副本，基于zookeeper协调的分布式消息系统。最大的特性就是可以实时处理大量数据来满足需求。 2，kafka使用场景 1，日志收集：可以用kafka收集各种服务…

阅读更多...

使用 Docker 部署和运行 RabbitMQ

使用 Docker 部署和运行 RabbitMQ

使用 Docker 部署和运行 RabbitMQ 在本篇博客中，我将介绍如何通过 Docker 来运行 RabbitMQ 并使用其管理界面。还会讨论我在操作过程中遇到的常见问题及其解决方案。RabbitMQ 是一个开源的消息代理，用于跨应用程序发送、接收消息。在容器化环境中运行 R…

阅读更多...

使用sysbench 简单测试io

使用sysbench 简单测试io

sysbench最新版本地址 GitHub - akopytov/sysbench: Scriptable database and system performance benchmark centos在线安装 curl -s https://packagecloud.io/install/repositories/akopytov/sysbench/script.rpm.sh | sudo bash sudo yum -y install sysbench 查看sysben…

阅读更多...

vue3+ts封装类似于微信消息的组件

vue3+ts封装类似于微信消息的组件

组件代码如下：  <template><div:class"[voice-message, { sent: isSent, received: !isSent }]":style"{ backgroundColor: backgroundColor }"click"togglePlayback"><!-- isSen…

阅读更多...

解析查看elf文件的构成

解析查看elf文件的构成

x86下用clang编译一段c代码，编译成elf文件，读elf文件，dump出里面的所有段，并打印出段中的数据和含义以及汇编的内容编写C代码首先，编写一个简单的C程序，例如命名为example.c： 使用Clang编…

阅读更多...

【YOLOv5模型部署】——TensorRT推理引擎安装与使用基于Flask的项目部署

声明：笔记是做项目时根据B站博主视频学习时自己编写，请勿随意转载！ 温馨提示：对于我的电脑没有Nvidia的独显，只有Intel的集显，最后导出时无法识别Nvidia显卡设备！！就没成功&#xf…

阅读更多...

Java小白一文讲清Java中集合相关的知识点（四）

Java小白一文讲清Java中集合相关的知识点（四）

LinkedList底层结构 LinkedList底层实现了双向链表和双向队列特点可以添加任意元素，包括null,元素可以重复线程不安全，没有实现同步 LinkedList底层操作机制 LinkedList底层维护了一个双向链表LinkedList中维护了两个属性first和last分别指向首结点和…

阅读更多...

如何启动vue ui，快速创建vue项目

如何启动vue ui，快速创建vue项目

1.查看自己是否已经安装了vue3.0脚手架版本，打开cmd命令框输入vue -V(大写为查看，此处查看的是脚手架的版本)。如果没有提示版本，而是命令不存在...则要进行下面的1.1操作 1.1安装Vue CIL，如果已安装，此步忽略。安装完…

阅读更多...

计算机毕业设计选题推荐-中华诗词文化交流平台-Java/Python项目实战

计算机毕业设计选题推荐-中华诗词文化交流平台-Java/Python项目实战

✨作者主页：IT研究室✨ 个人简介：曾从事计算机专业培训教学，擅长Java、Python、微信小程序、Golang、安卓Android等项目实战。接项目定制开发、代码讲解、答辩教学、文档编写、降重等。 ☑文末获取源码☑ 精彩专栏推荐⬇⬇⬇ Java项目 Python…

阅读更多...

推荐文章

最新文章