(done) NLP+HMM 协作，还有维特比算法

(done) NLP+HMM 协作，还有维特比算法

news2026/3/27 19:19:39

参考视频：https://www.bilibili.com/video/BV1aP4y147gA/?p=2&spm_id_from=pageDriver&vd_source=7a1a0bc74158c6993c7355c5490fc600

（这实际上是 “序列标注任务”）
HMM 的训练和预测如下图
训练过程：我们首先先给出一个语料文本，这个语料文本每个词组都分配了一个“词性”。在训练过程中，我们会得到三个矩阵，分别是，1.初始概率矩阵 2.转移概率矩阵 3.发射矩阵
预测过程：给出 “今天的天气不错” 作为输入，发给三个矩阵，这三个矩阵最终输出一个标注序列
在这里插入图片描述

我们先来看看三个矩阵是怎么训练/计算出来的
首先是初始矩阵，我们会统计每篇文章第一个字的词性
语料库一共三句话，分别是：
1.今天天气真不错。 B E B E S B E S
2.麻辣肥牛好吃！ B M M E B E S
3.我喜欢吃好吃的！ S B E S BE S S
经过统计，有两个 B 和一个 S，经过正则化，概率分别是 0.667 和 0.333
在这里插入图片描述

接下来我们看转移矩阵，我们统计每一个词性的 next property，随后画出转移矩阵
在这里插入图片描述

最后是发射矩阵，我们统计每一个词性对应的单词（字）概率，如下图
在这里插入图片描述

接下来，我们再看看得到这三个矩阵后，如何使用
这里长度为 7，一共有 4^7 条路径，我们选择其中一条最优路径作为最终结果
但这种选最优的方法的计算复杂度是随着文本长度呈指数增长的，我们需要更好的算法，比如维特比算法
在这里插入图片描述

维特比算法：其实就是不断剪枝，每一个全连接层只保留最优的四条路径，直到最后。这样最终得到的路径只有四条。
最后在这四条里选择最优的路径
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1677471.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

【leetcode面试经典150题】-27. 移除元素

【leetcode面试经典150题】-27. 移除元素

88.合并两个有序数组 1 题目介绍1 个人解题思路1.1 解题代码1.2 思路解析 2、分析官方题解2.1 单侧双指针2.2 双侧双指针 1 题目介绍给你一个数组 nums 和一个值 val，你需要原地移除所有数值等于 val 的元素，并返回移除后数组的新长度。不要使用额外…

阅读更多...

【Segment Anything Model】十四：原始SAM模型如何传入多框

【Segment Anything Model】十四：原始SAM模型如何传入多框

之前第二三篇有更新过单点，多点，单框。本篇加上多框输入。先确定一下目录新建test_boxes.py文件，复制以下代码 import sys import torch import numpy as np from datetime import datetime import matplotlib.pyplot as plt from Net.se…

阅读更多...

mysql 行转列 case when 和聚合函数实现

mysql 行转列 case when 和聚合函数实现

一、原始数据## 二、行转列第一步 SELECTCASE WHEN SUBSTRING( aaa.cost_code, 1, 3 ) 100 THEN aaa.budget_cost_budget ELSE 0 END b1,CASE WHEN SUBSTRING( aaa.cost_code, 1, 3 ) 300 THEN aaa.budget_cost_budget ELSE 0 END b2,CASE WHEN SUBSTRING( aaa.cost_cod…

阅读更多...

JeeSite Vue3：前端开发页面如何动态设置菜单展示模式？

JeeSite Vue3：前端开发页面如何动态设置菜单展示模式？

推荐阅读： JeeSite Vue3：前端开发的未来之路(更新版) 随着技术的飞速发展，前端开发技术日新月异。在这个背景下，JeeSite Vue3 作为一个基于 Vue3、Vite、Ant-Design-Vue、TypeScript 和 Vue Vben Admin 的前端框架，引…

阅读更多...

掌握未来的数字设计：深入浅出FPGA学习笔记，从新手到专家的全面指南！

掌握未来的数字设计：深入浅出FPGA学习笔记，从新手到专家的全面指南！

在数字电路设计领域，现场可编程门阵列（Field-Programmable Gate Array, FPGA）是一种非常灵活且功能强大的技术。它允许设计师通过编程来自定义硬件逻辑，以适应不同的应用需求。本文将全面详细地介绍FPGA的学习笔记，包括…

阅读更多...

软件3班20240515

软件3班20240515

阅读更多...

CKA-Ubuntu18.04安装Kubernetes集群

CKA-Ubuntu18.04安装Kubernetes集群

文档整理参考：虫之教育唐老师文章目录 K8S是什么修改静态ip环境准备修改更新源安装Docker安装K8S-master1.安装kubeadm, kubelet, kubectl2.初始化3.创建kubeadm-config.yaml4.查看是否安装成功运行集群环境报错排查问题安装网络安装K8S-node1,2步参考master3.查看是否安装成…

阅读更多...

Java线程生命周期：Java线程生命周期全景解读

Java线程生命周期：Java线程生命周期全景解读

1. 线程生命周期概述：不仅仅是状态转换在多线程编程中，理解线程的生命周期对于编写有效、高效的代码至关重要。线程生命周期通常描述了线程从创建到死亡的一系列状态变化过程，但其实不仅仅局限于这些状态的简单转换。线程生命周期的理解应该…

阅读更多...

PHP黑魔法之strcmp与is_numeric绕过

PHP黑魔法之strcmp与is_numeric绕过

1、strcmp绕过 PHP手册： int strcmp ( string $str1 , string $str2 )Return ValuesReturns < 0 if str1 is less than str2; > 0 if str1 is greater than str2, and 0 if they are equal 当输入的两个值为不是字符串时就会产生不预期的返回值 strcmp()在比较字符串和…

阅读更多...

PyQt5编写的一个简易图像处理软件

PyQt5编写的一个简易图像处理软件

文章目录 1. 简介2. 准备工作3. 主界面设计4. 功能构建5. 总结 1. 简介通过编写简易图像处理软件，你可以学习如何使用 PyQt5 构建用户界面，以及如何与用户交互。同时，你还可以学习图像处理技术，如图像读取、傅里叶变换、滤波、增…

阅读更多...

三、安装node_exporter

三、安装node_exporter

目录一、简介二、下载安装一、简介 Exporter是Prometheus的指标数据收集组件。它负责从目标Jobs收集数据，并把收集到的数据转换为Prometheus支持的时序数据格式。和传统的指标数据收集组件不同的是，他只负责收集，并不向Server端发送数据…

阅读更多...

百度文心一言 java 支持流式输出，Springboot+ sse的demo

百度文心一言 java 支持流式输出，Springboot+ sse的demo

参考：GitHub - mmciel/wenxin-api-java: 百度文心一言Java库，支持问答和对话，支持流式输出和同步输出。提供SpringBoot调用样例。提供拓展能力。 1、依赖 <dependency> <groupId>com.baidu.aip</groupId> <artifactId…

阅读更多...

Vue3使用datav3报错的三个问题解决

Vue3使用datav3报错的三个问题解决

我这里写的是按需引入报错问题Cannot find module dataview/datav-vue3 修改datav源码中的package.json文件修改为 "module": "./es/index.mjs", 然就就会遇见新的报错问题报错问题TypeError: Cannot read properties of null (reading $el) 然后修改…

阅读更多...

Day 46 139.单词拆分

Day 46 139.单词拆分

单词拆分给定一个非空字符串 s 和一个包含非空单词的列表 wordDict，判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词。说明： 拆分时可以重复使用字典中的单词。你可以假设字典中没有重复的单词。示例 1： 输入: s “leet…

阅读更多...

智能监控与安全管理：安全帽检测算法的实践与应用

智能监控与安全管理：安全帽检测算法的实践与应用

在工地、煤矿等高危工作环境中，安全帽的佩戴至关重要。安全帽能够有效防止因坠落物体或碰撞等引起的头部伤害，从而保护工作人员的生命安全。然而，传统的检查人员佩戴安全帽的方式主要依赖于现场监督和巡查，这种方法不仅耗费大量人…

阅读更多...

PDF编辑阅读器PDF Expert for Mac v3.10.1中文激活版

PDF编辑阅读器PDF Expert for Mac v3.10.1中文激活版

PDF Expert for Mac是一款易于使用的 PDF 编辑器和注释器，专为 Mac 设备设计。它允许用户轻松查看、编辑、签名、注释和共享 PDF。该软件使用户能够向他们的 PDF 添加文本、图像、链接和形状，突出显示和标记文本，填写表格以及签署数字文档。它…

阅读更多...

更高、更快、更强，受管文件传输应该注意的三个要素

更高、更快、更强，受管文件传输应该注意的三个要素

受管文件在很多公司内部都存在这个分类，受管文件不是特定的某一文件，而是指的是在一个组织或企业内，被正式管理和控制的文件。这些文件通常包含重要的信息，如技术规格、标准操作程序（SOPs）、质量手册、设计…

阅读更多...

SDN 实现 vxlan隧道

SDN 实现 vxlan隧道

SDN vxlan隧道官方介绍： VXLAN（Virtual eXtensible Local Area Network，虚拟扩展局域网），是由IETF定义的NVO3（Network Virtualization over Layer 3）标准技术之一，是对传统VLAN协议…

阅读更多...

社交媒体数据恢复：如流

社交媒体数据恢复：如流

如流，原名百度Hi，是百度公司开发的一款即时通讯软体。百度Hi具备文字消息、视讯、通话、文件传输等功能。查找备份：如果您之前有备份如流中的数据，您可以尝试从备份中恢复。如流支持备份至云端，如百度网盘等。联系客…

阅读更多...

C++auto关键字、范围for循环

C++auto关键字、范围for循环

一、auto关键字 1.1auto简介在早期C/C中auto的含义是：使用auto修饰的变量，是具有自动存储器的局部变量。 C11中，标准委员会赋予了auto全新的含义即：auto不再是一个存储类型指示符，而是作为一个新的类型指示符来指示编…

阅读更多...

推荐文章

最新文章