CRF条件随机场的原理、例子、公式推导和应用

news2025/2/13 14:43:08

转子:https://zhuanlan.zhihu.com/p/148813079
在这里插入图片描述
条件随机场(Conditional Random Field,CRF)是自然语言处理的基础模型,广泛应用于中文分词、命名实体识别、词性标注等标注场景。

条件随机场CRF与深度学习结合,产生了BiLSTM-CRF、BiLSTM-CNN-CRF等模型,在中文分词、命名实体识别、词性标注也取得不错的效果。

条件随机场CRF与Attention机制结合,又发展成了Transformer-CRF、BERT-BiLSTM-CRF等模型,使中文分词、命名实体识别、词性标注效果又有显著提高。

本文先引出条件随机场CRF的场、随机场、团、最大团等相关基础概念;接着介绍CRF的原理,重点阐述了线性链条件随机场的原理;然后介绍CRF在中文分词、命名实体识别、词性标注的具体应用;最后对CRF进行总结,指出图模型之间的演化关系,及CRF模型的发展简史。

本文结构如下:

一、CRF基础
1、无向图
2、马尔可夫随机场
3、最大团
4、无向图的因子分解

二、CRF原理
1、条件随机场
2、线性链条件随机场
3、线性链条件随机场公式
4、条件随机场例子

三、CRF应用
1、中文分词
2、命名实体识别
3、词性标注

四、CRF总结
1、CRF的概括总结
2、图模型之间的关系
3、CRF的发展简史

在这里插入图片描述

一、CRF基础

在这里插入图片描述
1、无向图

什么是图?什么是无向图?

在这里插入图片描述
2、马尔可夫随机场

什么是场?什么是随机过程?

在这里插入图片描述
什么是随机场?什么是马尔可夫随机场?
在这里插入图片描述
3、最大团

什么是团?什么是最大团?

在这里插入图片描述
4、无向图的因子分解

Hammersley-Clifford 定理如下:
在这里插入图片描述
举个无向图的因子分解的例子。
在这里插入图片描述

二、CRF原理

在这里插入图片描述
1、条件随机场

2001年,John Lafferty, Andrew McCallum 和 Fernando Pereira,在论文《 Conditional Random fields :Probabilistic Models for Segmenting and Labeling Sequence Data》提出条件随机场。

Conditional Random fields :Probabilistic Models for Segmenting and Labeling Sequence Data
​citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.26.803&rep=rep1&type=pdf
提出条件随机场。

在这里插入图片描述
条件随机场定义如下:

在这里插入图片描述
2、线性链条件随机场

在这里插入图片描述
线性链条件随机场的定义如下:

在这里插入图片描述
线性链条件随机场CRF的图结构

在这里插入图片描述
3、线性链条件随机场公式
在这里插入图片描述
特征函数定义如下:

在这里插入图片描述
为了简单起见,将转移特征和状态特征及其权值用统一符号表示。条件随机场简化公式如下:

在这里插入图片描述
4、条件随机场例子

例2:已知中文文本"刘启林”,采用IOB标注方法,求实体标注序列为{ B,I,I }的概率。

在这里插入图片描述
例1的几何描述如下:

在这里插入图片描述

例1的标注序列为{B、I、I}的联合概率分布如下:

在这里插入图片描述

三、CRF应用

在这里插入图片描述
1、中文分词

刘启林:中文分词的原理、方法与工具
178 赞同 · 8 评论文章

基于CRF由字构词方法的基本思想,基本原理如下:

在这里插入图片描述

CRF中文分词的图结构如下:

在这里插入图片描述
2、命名实体识别

刘启林:中文命名实体识别NER的原理、方法与工具
195 赞同 · 16 评论文章

基于CRF的命名实体识别过程如下:

在这里插入图片描述
CRF命名实体识别的图结构如下:

在这里插入图片描述
3、词性标注

基于CRF词性标注方法的基本思想,基本原理如下:

在这里插入图片描述
CRF中文词性标注的图结构如下:
在这里插入图片描述

四、CRF总结

在这里插入图片描述

1、CRF的概括总结
在这里插入图片描述
2、图模型之间的关系

朴素贝叶斯、HMM、逻辑回归、CRF等图模型关系如下:
在这里插入图片描述

朴素贝叶斯、HMM、逻辑回归、CRF对比如下表所示:
在这里插入图片描述
更多HMM可参考:

刘启林:HMM隐马尔可夫模型的例子、原理、计算和应用
437 赞同 · 39 评论文章

更多LR逻辑回归模型可参考:

刘启林:LR逻辑回归模型的原理、公式推导、Python实现和应用
141 赞同 · 12 评论文章

3、CRF的发展简史

在这里插入图片描述
机器学习阶段:CRF

深度学习阶段:BiLSTM-CRF、BiLSTM-CNN-CRF

Attention阶段:Transformer-CRF、BERT-BiLSTM-CRF

条件随机场CRF一直是标注问题的基础模型。

由于能力和水平的限制,我的可能是错的。

参考文献:
1、王元等, 数学大词典(第二版), 科学出版社[M], 2017.09

2、John Lafferty, Andrew McCallum, and Fernando Pereira, "Conditional Random Fields:

Probabilistic Models for Segmenting and Labeling Sequence Data", June 2001.

3、李航, 统计学习方法(第2版), 清华大学出版社[M], 2019.05

4、宗成庆, 统计自然语言处理(第2版), 清华大学出版社[M], 2013.08

5、Charles Sutton and Andrew McCallum, An Introduction to Conditional Random Fields, 2011

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/645497.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MATLAB文化算法

目录 文化算法 主要代码 Sphere AdjustCulture 结果 文化算法 基本概念:优化算法 | 详解文化算法(附MATLAB代码) - 知乎 不同于遗传算法只有种群进化空间,文化算法包含信念空间、种群空间两个进化空间,因此&#…

[学习笔记] [机器学习] 11. EM算法(极大似然估计、EM算法实例、极大似然估计取对数的原因)

视频链接数据集下载地址:无需下载 学习目标: 了解什么是 EM 算法知道极大似然估计知道 EM 算法实现流程 讲 EM 算法主要是为了后面的 HMM 做准备。 1. 初始 EM 算法 EM 算法(Expectation-Maximization algorithm,期望最大化算法…

索引介绍和基本使用

介绍 索引就是用来加速SQL查询的 由于索引也是需要存储成索引文件的,因此对索引的使用也会涉及磁盘I/O操作。如果索引创建过多,使用不当,会造成SQL查询时,进行大量无用的磁盘I/O操作,降低了SQL的查询效率&#xff0c…

SaaS 系统完全开源介绍

🐯 平台简介 芋道,以开发者为中心,打造中国第一流的快速开发平台,全部开源,个人与企业可 100% 免费使用。 架构图 管理后台的 Vue3 版本采用 vue-element-plus-admin ,Vue2 版本采用 vue-element-admin 管…

MySQL数据库概念、管理以及SQL语句的基本命令操作

MySQL数据库概念、管理以及SQL语句的基本命令操作 一、数据库概念1、数据库的组成:数据、表、数据库2、数据库类型3、数据库的管理系统(DBMS)4、数据库系统(DBS) 二、数据库系统发展史三、当今主流数据库四、关系型数据库五、MySQ…

HTML+CSS实训——Day15——部署项目到阿里云服务器

前言 因为阿里云有免费的3个月试用,我们可以把项目部署到上面。 选择这个服务 我们用CentOS,更简单,更轻量化。 打开他的VNC控制台 安装宝塔控制面板,输入 yum install -y wget && wget -O install.sh https://downlo…

提高你的小程序开发技能:五大重要步骤

对于任何开发人员来说,想要创建一个小程序并不是一件容易的事情。你需要为每个功能和应用程序编写代码,并且你需要不断地进行测试以确保它不会出错。 那么,我们该如何提高小程序的开发技能呢?通过下面这五个重要步骤,…

Win10麦克风没有声音怎么办?Win10麦克风没有声音恢复教程

Win10麦克风没有声音怎么办?Win10电脑中用户发现麦克风没有声音了,想知道怎么操作才能让声音恢复正常,这时候用户需要打开Win10电脑的设备管理器,点击更新相对应的驱动程序,这样就能轻松解决Win10麦克风没有声音的问题…

Python 课程设计2:学生信息管理系统

开发环境要求 本系统的软件开发及运行环境具体如下。 操作系统:Windows 10。Python版本:Python 3.7.0。开发工具:PyCharm VSCodePython内置模块:os、re。 功能: 1 录入学生信息功能 …

大模型微调方法调研

文章目录 Freeze方法PT方法Lora方法AdaloraPrompt TuningAdapter TuningPrefix tuning遗留问题 Freeze方法 对原始模型部分参数进行冻结操作,仅训练部分参数 PT方法 P-Tuning,仅对大模型的Embedding加入新的参数。 P-Tuning 提出将 Prompt 转换为可以…

Cgroup资源管理

docker资源限制 容器怎么实现资源的限制? 通过Cgroup资源限制 docker 通过Cgroup来控制容器使用的资源配额,包括CPU,内存,磁盘三大方面。 Cgroup是linux内核提供的一种可以限制,记录,隔离进程组所使用的…

IDEA默认代码样式的坑,逗号前面默认加上了空格

IDEA默认代码样式的坑,逗号前面默认加上了空格 个人习惯编写完代码,会使用CTRLALTL进行代码格式化,同时设置了提交的时候进行代码重排和格式化。突然有一天,格式化代码之后发现跟仓库的差异文件几百个,吓死。。。 当然…

代码开发中VO,BO,PO,DO,DTO是什么

代码开发中VO,BO,PO,DO,DTO是什么 MVC的简单定义: M层负责与数据库打交道; C层负责业务逻辑的编写; V层负责给用户展示(针对于前后端不分离的项目,不分离项目那种编写…

一、微机保护装置的典型结构

微机型保护装置实质上是一种依靠单片微机智能地实现保护功能的工业控制装置。一般典型的微机保护结构是由五个部分构成的,即信号输入电路、单片微机系统、人机接口部分、输出通道回路及电源部分,如图1-l所示。 (一)信号…

多线程之基础

写在前面 本文看下多线程基础相关内容。 1:线程基础分析 1.1:摩尔定律失效 戈登.摩尔,英特尔公司的创始人之一,其发现了一个计算机的发展规律,即,处理器的性能每24个月就会翻一倍,这就是摩尔…

Vintage的变体与解读应用

Vintage在风险管理中有很多变体,通常分为以下四类: 1.根据选取切片数据时间不一样,可划分为Month end(月末)与Cycle end(期末)两种。 说明: **Month end:**选取切片数…

基于自适应高斯混合的稀疏注释语义分割

文章目录 Sparsely Annotated Semantic Segmentation with Adaptive Gaussian Mixtures摘要本文方法GMM FormulationTraining with AGMM 实验结果 Sparsely Annotated Semantic Segmentation with Adaptive Gaussian Mixtures 摘要 稀疏注释语义分割(SASS&#xf…

给图片添加水印的最简单方法

给图片添加水印的最简单方法在数字化时代,图片广泛应用于社交媒体、网站、电商平台等各种场景中。然而,由于互联网分享的便捷性,图片的盗用问题也越来越严重。为了保护图片版权,给图片添加水印已经成为一个非常必要和重要的步骤。…

参与赢大奖!阿里云机器学习平台PAI助力开发者激发AIGC潜能

近年来,随着海量多模态数据在互联网的爆炸性增长和训练深度学习大模型的算力大幅提升,助力开发者一站式快速搭建文生图、对话等热门场景应用,阿里云机器学习平台PAI特推出AIGC加油包,为广大开发者加油助力激发AIGC潜能&#xff0c…

OJ管理员如何进行添加题目

OJ系统简介 Online Judge系统(简称OJ)是一个在线的判题系统。用户可以在线提交程序多种程序(如C、C) 源代码,系统对源代码进行编译和执行,并通过预先设计的测试数据来检验程序源代码的正确性。 一个用户提…