CRF条件随机场

news2025/2/27 23:17:48

文章目录

  • 定义
  • 转移概率 & 发射概率
  • 损失函数
    • 单条路径的求解
    • viterbi解码
      • 贪婪算法
      • 维特比算法

参考解读

定义

CRF:condition random field
解决序列预测问题。比如TTS的前端分词,实体命名识别等。

转移概率 & 发射概率

在这里插入图片描述

  • 发射分数:将输入预测到不同的tag上,对应不同的分数。如下图所示, t 02 t02 t02表示输入 x 0 x_0 x0预测为tag2。
    在这里插入图片描述

  • 转移分数:表示一个标签向另一个标签转移的分数,分数越高,转移概率就越大。

损失函数

CRF的建模过程可以表示为 ( y ∣ x ) = p ( y n , . . . , y 2 , y 1 ∣ x n , . . . , x 2 , x 1 ) (y|x) = p(y_n,...,y_2,y_1|x_n,...,x_2,x_1) (yx)=p(yn,...,y2,y1xn,...,x2,x1)
CRF的解码策略就是在所有可能的路径中,找出一条概率最大、分数最大的路径。假设标签数量是 k k k,文本长度为 n n n,则会有 N = k n N=k^n N=kn条路径。则第 i i i条路径出现的概率为,其中 S i S_i Si表示第 i i i条路径的分数。
在这里插入图片描述

S r e a l S_{real} Sreal为真实最优路径的分数。对应的损失函数( S r e a l S_{real} Sreal越大,loss越小)
在这里插入图片描述
放到对数域内求解,得到
在这里插入图片描述

单条路径的求解

在这里插入图片描述
S = E 00 + E 11 + E 24 + T 10 + T 42 S=E_{00}+E_{11}+E_{24}+T_{10}+T_{42} S=E00+E11+E24+T10+T42

在这里插入图片描述

viterbi解码

最优路径算法:贪婪/集束/维特比/动态规划
在这里插入图片描述
如上图所示,要找到S-E之间分数最大的路径。

贪婪算法

每一步选取最大,路径是S-B1-A2-D3-E。分数为3+2+4+1
缺点:容易陷入局部最优。

维特比算法

思路:每一步均保留到达当前每一个节点最大的路径(每个状态的最大似然)。

step1: 路径list:【S-A1, S-B1, S-C1】,sum(1,3,2)
step2: 到节点A2分数最大的路径是【S-B1-A2】=6,到节点B2分数最大的路径是【S-A1-B2】=6;
在这里插入图片描述

step3:到节点A3最大的路径(只能从上一步选),上一步A2的sum=3,A3_sum = Max(5+3, 6+1),因此对应的最优路径为【S-B1-A2-A3】。其他节点亦然。
最后的最优路径是
在这里插入图片描述
总结:维特比译码依靠这动态规划的思想,保留了每个状态的最优路径,故一定能达到全局最优。
复杂度对比:每一步有K个状态,全局路径长度为N
全局搜索: O ( K N ) O(K^N) O(KN)
贪婪搜索: O ( M + M + M . . . ) = O ( M ∗ N ) O(M+M+M...)=O(M*N) O(M+M+M...)=O(MN)
集束搜索: O ( M ∗ N ∗ D ) O(M*N*D) O(MND),每步选取topD
维特比搜索: O ( N ∗ M 2 ) O(N*M^2) O(NM2)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/24583.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

PPT 最后一页写什么结束语既得体又能瞬间提升格调?

谢邀!我只分享一个现下最流行的方法,绝对让尾页逼格满满!罗永浩雷军都在用的「金句法」。 提到这份方法,你可能会觉得很陌生,但你一定见过这样的页面: 这样的页面还有很多,多是以一句话收尾&…

LeetCode刷题(python版)——Topic81. 搜索旋转排序数组 II

一、题设 已知存在一个按非降序排列的整数数组 nums &#xff0c;数组中的值不必互不相同。 在传递给函数之前&#xff0c;nums 在预先未知的某个下标 k&#xff08;0 < k < nums.length&#xff09;上进行了 旋转 &#xff0c;使数组变为 [nums[k], nums[k1], ..., nu…

简单网络管理协议SNMP

SNMP一、 网络管理基本概念网络管理主要构件管理站被管设备网络管理协议SNMP&#xff08;简单网络管理协议&#xff09;协议组成二、管理信息结构SMI功能被管对象的命名被管对象的数据类型编码方法三、管理信息库MIB定义要点四、SNMP基于UDP服务两种基本管理功能机制探询trap五…

期末复习 C语言再学习

作者&#xff1a;小萌新 专栏&#xff1a;期末复习 作者简介&#xff1a; 大二学生 希望能和大家一起进步 本篇博客介绍&#xff1a; 考试周临近 没时间学新知识了 回顾C语言知识 一. 常量和字符串 1. 常量的四种表示方式 字面常量 这个很简单 字面意义上的常量就是了 比如…

跳表和散列表

一、跳表 复杂度&#xff1a;O(logn)&#xff1b; 跳表的更新&#xff1a;插入数据时&#xff0c;可以选择将这个数据插入到部分索引中&#xff0c;可以选择一个随机函数&#xff0c;产生随机数K&#xff0c;边将索引添加到第一到第K级索引中。 Redis为何选择跳表来实现有序集…

冯·诺依曼体系概括总结

文章目录我们常见的计算机&#xff0c;如笔记本。我们不常见的计算机&#xff0c;如服务器&#xff0c;大部分都遵守冯诺依曼体系。 截至目前&#xff0c;我们所认识的计算机&#xff0c;都是由一个个的硬件组件组成 输入单元&#xff1a;包括键盘, 鼠标&#xff0c;扫描仪, …

Java笔记(JUnit、反射、注解)

一、JUnit单元测试 1. JUnit的介绍 JUnit是一个Java语言的单元测试工具。有了它我们在开发阶段就可以对自己编写的功能模块进行单元测试&#xff08;就是一块一块去测试&#xff09;&#xff0c;看看是否达到具体预期&#xff08;这样小Bug我们自己就能解决&#xff09;。 黑盒…

敏感词检测库ToolGood.Words中 WordsHelper类使用简介

C#开源敏感词检测库ToolGood.Words中的类WordsHelper为文本辅助操作类&#xff0c;支持繁体简体互换、全角半角互换、数字转成中文大写、拼音操作等功能&#xff0c;本文对照参考文献1&#xff0c;对该类的用法进行简要介绍。   WordsHelper类中主要的辅助函数如下表所示&…

基于SVM的航空发动机故障诊断系统设计

目录 第1关&#xff1a;准备实验数据 任务描述&#xff1a; 相关知识&#xff1a; 一、获取数据&#xff1a; 二、读取数据集&#xff1a; 三、如何找出对应的数据列&#xff1a; 编程要求&#xff1a; 测试说明&#xff1a; 第二关&#xff1a;数据预处理 任务描述&…

python习题002--字符串处理

目录 一&#xff0c;题目展示&#xff1a; 二&#xff0c;题目解答 a&#xff09;判断两个字符串是否相等 b)忽略大小写判断两个字符串是否相等 c,d)判断字符串是否以指定的字符串开始或者是结尾 e&#xff09; 获取字符串的长度 f&#xff09; 字符串切片&#xff0c…

认定省级专精特新的条件

之前报省级专精特新的一个条件是先认定市级专精特新&#xff0c;但是打算2023年申报省级专精特新的企业就不需要先申请市级的专精特新了&#xff0c;那是可以直接申请省级专精特新吗&#xff1f;并不是&#xff01; 接下来打算申请2023年省级专精特新的企业需要先认定山东省创…

18.5.4 分布式恢复

文章目录18.5.4 分布式恢复18.5.4.1 分布式恢复的连接18.5.4.1.1 为分布式恢复端点选择地址18.5.4.1.2 分布式恢复的压缩18.5.4.1.3 用于分布式恢复的复制用户18.5.4.1.4 分布式恢复的 SSL 和身份验证18.5.4.2 分布式恢复的克隆18.5.4.2.1 克隆的先决条件18.5.4.2.2 克隆的阈值…

VsCode配置Kotlin运行环境

目录 需求 前置条件 步骤 问题 一 二 结果 需求 设备上有一个 Android Studio 但是太大了, 于是就想着用 VS Code 配置一个轻量级的,而且 VS Code里面好多插件我用着也比较舒服. 前置条件 Java JDK1.8 或者 11 别的版本没试过 有基于Android Studio 的 Kotlinc的环…

c++ - 第12节 - 模板进阶

1.非类型模板参数 模板参数分为类型形参与非类型形参类型形参&#xff08;可以认为是虚拟类型&#xff09;&#xff1a;出现在模板参数列表中&#xff0c;跟在class或者typename之类的参数类型名称。非类型形参&#xff08;可以认为是常量&#xff09;&#xff1a;用一个常量作…

带命名空间的arxml读取

一、前言 读取带命名空间的arxml,最好的方式是创建一个字典来存放你自己的前缀并在搜索函数中使用它们: 二、解读如下ns.xml文件: <?xml version"1.0" encoding"UTF-8"?> <AUTOSAR xmlns"http://autosar.org/schema/r4.0" xmlns:xsi…

365天深度学习训练营-第7周:咖啡豆识别

目录 一、前言 二、我的环境 三、代码实现 四、VGG-16框架 五、LeNet5模型 六、模型改进 一、前言 >- **&#x1f368; 本文为[&#x1f517;365天深度学习训练营](https://mp.weixin.qq.com/s/xLjALoOD8HPZcH563En8bQ) 中的学习记录博客** >- **&#x1f366; 参考…

基于STM32G431嵌入式学习笔记——四、LED+KEY+LCD综合练习(基于第12届蓝桥杯显示部分题目)

在学习了前三节LED、LCD、KEY基本操作后&#xff0c;我们就已经成功掌握蓝桥杯必考的三大样内容了&#xff0c;本节以第12届蓝桥杯显示部分内容进行综合练习&#xff1a; 一、真题引入 1.功能概述 2.LCD显示界面 &#xff08;1&#xff09;车位显示界面 &#xff08;2&#…

PostgreSQL数据库缓冲区管理器——本地缓冲区管理

本地缓冲区管理器(local buffer manager)为temporary表&#xff08;无需WAL-logged或checkpointed&#xff09;进行快速缓冲区管理&#xff0c;API定义在src/backend/storage/buffer/localbuf.c中。 获取LocalBuffer 初始化 首先解释temp_buffers GUC参数&#xff0c;其用于…

Servlet学习日志

Hello Web Web World Wide Web 全球广域网->也称为万维网 是一种基于超文本和HTTP协议的分布式应用架构 HTML&#xff08;HyperText Mark-up Language&#xff09;:用于链接网络上的信息 HTTP协议&#xff08;HyperText Transfer Protocol&#xff09;:规定了服务端与客户…

国际海运流程有哪些,国际海运物流哪家比较好

国际海运的优点是运输费划算&#xff0c;并且可以走的货物类目多&#xff0c;合适大物件、大批的长距离运送。进出境运输工具的负责人、进出境物品的所有人或者他们的代理人向海关办理货物、物品或运输工具进出境手续及相关海关事务的过程&#xff0c;包括向海关申报、交验单据…