李宏毅结构化学习 03

news2024/11/16 13:40:40

文章目录

  • 一、Sequence Labeling 问题概述
  • 二、Hidden Markov Model(HMM)
  • 三、Conditional Random Field(CRF)
  • 四、Structured Perceptron/SVM
  • 五、Towards Deep Learning

一、Sequence Labeling 问题概述

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


二、Hidden Markov Model(HMM)

在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
上图 training data 中的黑色字为x,即文字序列。红色字为 y ^ \hat y y^,即词性序列。


在这里插入图片描述
c o u n t ( s ) count(s) count(s)为训练数据中所有 s s s的个数。
c o u n t ( s → s ′ ) count(s \to s') count(ss)为训练数据中所有 s 后面接 s ′ s后面接s' s后面接s的个数。
c o u n t ( s → t ) count(s \to t) count(st)为训练数据中所有word t t t的标签为 s s s的个数。
P ( y 1 ∣ s t a r t ) P(y_1|start) P(y1start)为标签 y 1 y_1 y1在句首出现的个数,除以句子总个数。
P ( e n d ∣ y L ) P(end|y_L) P(endyL)为标签 y L y_L yL在句尾出现的个数,除以 y L y_L yL总个数。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
这里 N → V → a N \to V \to a NVa并没有在训练数据中出现过,但是计算的概率反而比训练数据中出现过一次的 N → D → a N \to D \to a NDa高。所以HMM会脑补一些没有出现过的数据。


HMM产生这种脑补的情况是因为转移概率和发射概率是相互独立的。解决这个问题的方法是用一个更复杂的模型去处理这个问题。用CRF也可以处理这个问题。
在这里插入图片描述

三、Conditional Random Field(CRF)

在这里插入图片描述
因为 exp ⁡ ( w ⋅ ϕ ( x , y ) ) \exp (w \cdot \phi (x,y)) exp(wϕ(x,y))可能大于1,所以无法把它当成概率,只能说 P ( x , y ) P(x,y) P(x,y)正比于它。
因为 ∑ y ′ ∈ Y exp ⁡ ( w ⋅ ϕ ( x , y ′ ) ) \sum_{y' \in \mathbb{Y}} \exp(w \cdot \phi(x,y')) yYexp(wϕ(x,y))由于和变量 y ′ y' y没有关系,只和 x x x有关系,所以简记为 Z ( x ) Z(x) Z(x)


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
红色的向量中的每一维都依赖于 ( x , y ) (x,y) (x,y),所以可以认为它是这个向量所形成的特征,记为 ϕ ( x , y ) \phi(x,y) ϕ(x,y)


在这里插入图片描述
由于w的元素可正可负,当为正数的时候,求EXP,就会大于1。并且例如,给定s,求和所有的t,我们也无法保证等于1。所以我们说 P ( x , y ) \text P(x,y) P(x,y)正比于 exp ⁡ ( w ⋅ ϕ ( x , y ) ) \exp(w \cdot \phi (x,y)) exp(wϕ(x,y)),而不说等于。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述
Part 2 的维度大小:|S|个tag中的每个tag后面都能再接|S|个tag,所以是|S| × \times ×|S|。然后start后面能接|S|个tag,end前面能接|S|个tag,所以是2|S|。
CRF比HMM强的点在于,可以自己定义 ϕ ( x , y ) \phi(x,y) ϕ(x,y)


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


横轴表示HMM犯错的百分比,纵轴表示CRF犯错的百分比。如果点在 45 ° 45 \degree 45°对角线左侧,表示HMM表现比较好;在 45 ° 45 \degree 45°对角线右侧,表示CRF表现比较好。
在这里插入图片描述


在这里插入图片描述


四、Structured Perceptron/SVM

在这里插入图片描述


在这里插入图片描述
如果CRF中,另学习率为1,那么两者参数迭代的公式是相近的。其中Strucured Perceptron参数迭代公式中,减掉的最后一项 ϕ ( x n , y ~ n ) \phi (x^n, \widetilde y^n) ϕ(xn,y n)是其概率最大的一项。而CRF减掉的最后一项,则是所有 ϕ ( x n , y ′ ) \phi(x^n,y') ϕ(xn,y)与其概率的加权之和。


在这里插入图片描述


在这里插入图片描述


在这里插入图片描述


五、Towards Deep Learning

在这里插入图片描述


在这里插入图片描述


可以将 P ( x l , y l ) \text P(x_l,y_l) P(xl,yl)用神经网络,例如RNN的输出进行替换。
在这里插入图片描述
因为用HMM做inference的时候是给定x,看哪一个y可以让这个概率最大。所以x是给定的,不管 P ( x l ) \text P(x_l) P(xl)是多少,都不会影响最后得到的y了。故,不用管 P ( x l ) \text P(x_l) P(xl)了。


也有如下应用:
在这里插入图片描述
上图中的x不再是input的,而是RNN的output。


在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2155757.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

如何备份SqlServer数据库

第一步:登录你要备份的服务器数据库ssms 第二步:选择你要备份的数据库 此处已PZ-SJCS 数据库为例 右键该数据库-->任务-->备份 第三步:选择你备份的类型备份组件等,目标磁盘 ,点击添加选择将你备份的文件备份那…

全面详尽的 PHP 环境搭建教程

目录 目录 PHP 环境搭建概述 在 Windows 上搭建 PHP 环境 使用集成环境 XAMPP 安装步骤 配置和测试 常用配置 手动安装 Apache、PHP 和 MySQL 安装 Apache 安装 PHP 安装 MySQL 配置 PHP 连接 MySQL 在 Linux 上搭建 PHP 环境 使用 LAMP 方案 安装 Apache 安装 …

【25.6】C++智能交友系统

常见错误总结 const-1 如下代码会报错 原因如下: man是一个const修饰的对象,即man不能修改任何内容,但是man所调用的play函数只是一个普通的函数,所以出现了报错。我们需要在play函数中加上const修饰,或者删除man对…

《论分布式存储系统架构设计》写作框架,软考高级系统架构设计师

论文真题 分布式存储系统(Distributed Storage System)通常将数据分散存储在多台独立的设备上。传统的网络存储系统采用集中的存储服务器存放所有数据,存储服务器成为系统性能的瓶颈,也是可靠性和安全性的焦点,不能满…

FreeRTOS-时间片调度

FreeRTOS-时间片调度 一、时间片调度简介二、时间片调度实验 一、时间片调度简介 同等优先级任务轮流的享有相同的CPU时间(可设置),叫时间片,在FreeRTOS中,一个时间片就等于SysTick中断周期,所以说时间片大小取决于滴答定时器中断…

windows安装Anaconda教程

一、简介 Anaconda 是一个开源的 Python 和 R 语言的分发平台,专为科学计算和数据分析设计。它包含了包管理器 Conda,可以方便地安装和管理库、环境和依赖项。此外,Anaconda 还附带了许多数据科学工具和库,如 Jupyter Notebook 和…

【HTTPS】中间人攻击和证书的验证

中间人攻击 服务器可以创建出一堆公钥和私钥,黑客也可以按照同样的方式,创建一对公钥和私钥,冒充自己是服务器(搅屎棍) 黑客自己也能生成一对公钥和私钥。生成公钥和私钥的算法是开放的,服务器能生产&…

iOS17找不到developer mode

iOS17找不到开发者模式 developer mode 下载过app之后、弹窗Developer Mode Required之后,这个菜单就出现了(之前死活找不到)。 背景:用蒲公英分发测试app,有个同事买了新机(iphone 15 pro max),添加了白名…

双虚拟机部署php项目

前言 经过前面的学习,我们对分布式部署有了一定的了解,这次我们尝试做些东西 准备 我打算用虚拟机部署一个外联网盘 一台虚拟机安装php另一台安装MySQL,但是之前已经安装过 MariaDB 了,就不打算改了。 通常MariaDB与MySQL兼容性很好,可以作为替代使用。彩虹外链网盘项目…

OpenAI的O1模型达到AGI二级,类人推理能力被提示危险,细思极恐!

大家好,我是Shelly,一个专注于输出AI工具和科技前沿内容的AI应用教练,体验过300款以上的AI应用工具。关注科技及大模型领域对社会的影响10年。关注我一起驾驭AI工具,拥抱AI时代的到来。 今天让我们一起来聊聊最近科技圈的大新闻—…

Java笔试面试题AI答之设计模式(4)

文章目录 16. 简述什么是观察者模式?基本概念主要特点实现方式应用场景优缺点 17. 请列举观察者模式应用场景 ?18. 请用Java代码实现观察者模式的案例 ?19. 什么是装饰模式?定义与特点结构与角色工作原理优点应用场景示例 20. 请用…

队列的各种接口的实现(C)

队列的概念 队列:只允许在一端进行插入数据操作,在另一端进行删除数据操作的特殊线性表,队列具有先进先出FIFO(First In First Out) 入队列:进行插入操作的一端称为队尾 出队列:进行删除操作的一端称为队头 队列的实…

【GlobalMapper精品教程】088:按点线面空间位置选择案例

按点线面空间位置选择的原则为:点线面的排列组合。 文章目录 一、选择线要素附近的点二、选择相交或触碰所选线的区和线三、选择包含点的区要素四、选择选定区域内的点要素一、选择线要素附近的点 启动该工具之前,首先要选择线,例如,选择某一段铁路5km范围之内的县城驻地。…

nacos适配人大金仓的数据库

前言 在微服务架构中,服务发现和配置管理是关键组件。Nacos作为一个动态服务发现和配置管理平台,支持多种数据库作为其后端存储。本文将探讨如何在Nacos中适配人大金仓数据库,以及在此过程中的最佳实践。 Nacos简介 Nacos(Nami…

安装 depot_tools 和 Windows 10 SDK 为在Windows下构建基于 chromium 的浏览器(103.0.5060.68 之二)

本文已首发于: 秋码记录 为何要安装depot_tools 虽然我们在上一篇 Windows构建基于 Chromium 的浏览器之环境准备篇安装 Visual Studio(103.0.5060.68 之一) ,已经在Windows系统安装好了Visual Studio 2019 Community版本。 然…

第十二周:机器学习

目录 摘要 Abstract 一、非监督学习 二、word embedding 三、transformer 1、应用 2、encoder 3、decoder 四、各类attention 1、最常见的类别 2、其余种类 3、小结 总结 摘要 本周继续学习机器学习的相关课程,首先了解了监督学习和非监督学习的概…

数据结构与算法——Java实现 9.习题——删除链表倒数节点

目录 19. 删除链表的倒数第 N 个结点 方法1 通过链表长度直接删除 方法2 递归加入哨兵节点 ListNode 方法3 快慢指针法 苦难,区区挫折罢了,而我必定站在幸福的塔尖 —— 24.9.22 19. 删除链表的倒数第 N 个结点 给你一个链表,删除链表的倒数第…

【LeetCode】146. LRU缓存

1.题目 2.思想 3.代码 3.1 代码1 下面这是一版错误的代码。错误的原因在于逻辑不正确导致最后的代码也是不正确的。 class LRUCache:def __init__(self, capacity: int):self.time 0 # 用于全局记录访问的时间self.num2time {} # 数字到时间的映射self.key2val {} # 数字…

第十四章:html和css做一个心在跳动,为你而动的表白动画

💖 让心跳加速,传递爱意 💖 在这个特别的时刻,让爱在跳动中绽放!🌟 无论是初次相遇的心动,还是陪伴多年的默契,我们的心总在为彼此跳动。就像这颗炙热的爱心,随着每一次的跳动,传递着满满的温暖与期待。 在这个浪漫的季节,让我们一同感受爱的律动!无论你是在…

Linux文件IO(七)-复制文件描述符

在 Linux 系统中,open 返回得到的文件描述符 fd 可以进行复制,复制成功之后可以得到一个新的文件描述符,使用新的文件描述符和旧的文件描述符都可以对文件进行 IO 操作,复制得到的文件描述符和旧的文件描述符拥有相同的权限&#…