【四范式】浅谈NLP发展的四个范式

news2024/12/28 4:39:27

自然语言处理(Natural Language Processing,NLP)是计算机科学,人工智能,语言学关于计算机和人类自然语言之间的相互作用的领域,是计算机科学领域与人工智能领域中的一个重要方向。NLP发展到今天已经进入到了LLM(大语言模型)的时代,学术界按发展时间线将NLP归纳到四个范式,即NLP四范式

第一范式:基于「传统机器学习模型」的范式,利用特定的规则或数学、统计学的模型来对特征进行匹配和利用,进而完成特定的NLP任务,靠人工来进行大量的特征提取,依赖于大量的监督数据,并且需要专业知识和技能。如序列标注、朴素贝叶斯等算法。

第二范式:基于「深度学习模型」的范式,来到了深度学习时代,实现了自动获取特征来进行端到端的分类,从而减少了手动构建特征的需求,模型准确度有所提高,特征工程的工作量也有所减少。如CNN、RNN等神经网络模型。

第三范式:基于「预训练模型+fine-tuning」的范式,分为两个阶段,先利用大型语料库完成预训练模型的无监督学习,然后利用预训练好的模型在下游任务的特定数据集上进行fine-tuning,模型准确度得到显著提高。如GPT、Bert等模型。

第四范式:基于「预训练模型+Prompt+预测」的范式,prompt 将下游的输入输出形式改造成预训练任务中的形式(重构下游任务),使得小样本、零样本学习成为可能,模型训练所需的训练数据显著减少。 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2134518.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[Python学习日记-19] 细讲数据类型——集合

[Python学习日记-19] 细讲数据类型——集合 简介 集合的创建 集合的增删查 集合的循环 集合的去重 集合的关系运算 简介 在前面我们学习到了列表、元组、字符串、字典这几种数据类型,在 Python 中还有最后一种数据类型,那就是集合,下面…

Cloudflare Pages 部署 Next.js 应用教程

Cloudflare Pages 部署 Next.js 应用教程 本教程将指导你如何将现有的 Next.js 应用部署到 Cloudflare Pages。 准备工作 安装部署依赖 首先,安装 cloudflare/next-on-pages: npm install --save-dev cloudflare/next-on-pages添加 wrangler.toml 配置文件 在项目根目录创建 …

如何删除git提交记录

今天在提交github时,不小心提交了敏感信息, 不要问我提交了啥,问就是不知道 查了下资料,终于找到简单粗暴的方式来删除提交记录。方法如下 git reset --soft HEAD~i i代表要恢复到多少次提交前的状态,如指定i 2&…

GD32F4开发 -- SEGGER RTT移植

FreeRTOS移植了,我将SEGGER RTT移植和FATFS也一并移植进去得了。 参看:GD32F4开发 – JLink使用 这里面其实已经讲了怎么移植了。 一、移植 直接将整个 RTT 文件夹加入工程 将其拷贝到我的工程: 二、创建 RTT 分组 工程目录如下&#xf…

微波无源器件 功分器2 用于双极化应用的新型宽带圆波导四路功分

摘要: 提出了一种适用于多级()波束形成网络高度紧凑和有效的双模功。圆波导双极化通过使用一个对称4:1的十字转门拓扑和有策略的腔体谐振抑制器来实现理论35dB的交叉极化隔离的高于20%的带宽。对于一个Ku波段(10.5-13GHz)的双模四路功分器的实测验证被提出了&#x…

2024重症医学科常用评估量表汇总,附操作步骤与评定标准!

常笑医学整理了8个重症医学科常用的评估量表,包括院前指数评估、多脏器功能障碍评分、急性生理学与慢性健康状况评分等。这些量表在常笑医学网均支持在线评估、下载和创建项目使用。 01 院前指数评估 (完整量表请点击量表名称查看) 院前指数…

音频芯片DP7344兼容CS4344低成本方案双通道24位DA转换器

产品简介 DP7344 是一款完整的 2 通道输出数模转换芯片,内含插值滤波器、Multi-Bit 数模转换器、输出模拟滤波器,并支持大部分的音频数据格式。 DP7344 基于一个带线性模拟低通滤波器的四阶 Multi-BitΔ∑调制器,自动检测信号频率和主时钟频率…

班组建设中如何避免团队协作的问题?

在班组建设的广阔天地里,团队协作无疑是推动项目进展、提升工作效率的基石。然而,在实际操作中,团队协作往往伴随着一系列复杂而微妙的问题,这些问题若得不到妥善解决,便会成为阻碍团队前进的绊脚石。本文,…

AMD CMD UMD CommonJs ESM 的历史和区别

这几个东西都是用于定义模块规范的。有些资料会提及到这些概念,不理清楚非常容易困惑。 ESM(ES Module) 这个实际上我们是最熟悉的,就是ES6的模块功能。出的最晚,因为是官方出品,所以大势所趋&#xff0c…

Qt 开发:深入详解 Qt 的信号与槽机制——彻底搞懂QT信号与槽

一、概念 Qt 的信号与槽(Signals and Slots)机制是一个用于对象间通信的核心特性。这个机制使得对象能以松散耦合的方式进行通信,从而提升了代码的模块化和可维护性。 信号(Signal):对象状态的变化或事件…

C++:内部类,匿名对象,操作符new与delete

一.内部类 1.如果一个类定义在另一个类的内部,这个内部类就叫做内部类。内部类是一个独立的类,跟定义在全局相比,他只是受外部类类域限制和访问限定符限制,所以外部类定义的对象中不包含内部类。 2.内部类默认是外部类的友元类。…

基于Java+Mysql实现(web)大型企业管理系统

技术报告 第一章 系统概述 包括用户管理、权限管理、软件项目管理、软件模块管理、测试用例管理、测试任务分配、bug管理等功能。实现公司不同部门间团队协作,管理人员也能够更加有效的把控系统开发的进度。 本实验综合应用JavaWeb编程中的Servlet,JS…

【渗透测试】-CVE-2016-4437-Shiro550漏洞复现

Shiro550漏洞爆出的时间是2016年为第4437个漏洞,所以它的CVE编码是2016-4437 文章目录 前言 什么是Shiro550漏洞? 1.Shiro550漏洞原理: 2.漏洞利用 3.漏洞复现: 前提:下载并打开vulhub靶场。 CVE-2016-4437-shiro550漏…

CentOS 7停更官方yum源无法使用,更换阿里源

CentOS 7官方源已经停止维护,导致无法使用yum更新软件。通过尝试使用阿里云、清华大学等第三方源解决,现以阿里云第三方源进行配置: 1、备份原有的yum源配置文件 # cp -a /etc/yum.repos.d /etc/yum.repos.d.bak 2、删除原有的yum源配置文…

什么是交换机级联?

在现代计算机网络中,交换机级联是一种广泛应用的技术,有助于提升网络的扩展性和灵活性。本文将深入探讨交换机级联相关知识,详细介绍其基本概念和连接配置方法,并对常见技术问题进行解答。 交换机级联概述 交换机级联是指通过将…

windows server2012 配制nginx安装为服务的时候,直接跳要安装.net框架,用自动的安装,直接失败的解决。

1、上一个已成功在安装过程中的图: 2、之前安装过程中错误的图: 3、离线安装解决: 下载.net framework 3.5,然后解压后,选择指定备用源路径,然后选择.net安装包所在目录: 只要指定上面全路径就…

WebGL系列教程八(GLSL着色器基础语法)

目录 1 前言2 基本原则3 基本数据类型4 顶点着色器和片元着色器4.1 声明4.2 初始化项目4.3 赋值 5 结构体5.1 声明5.2 赋值 6 函数6.1 基本结构6.2 自定义函数6.3 常用内置函数 7 精度8 其他9 总结 1 前言 通过前七讲,我们已经见过了WebGL中的部分基础语法&#xff…

初始爬虫1(补充)

TCP 和 UDP 是什么? TCP(Transmission Control Protocol)和 UDP(User Datagram Protocol)都是传输层协议,它们负责在计算机网络上发送和接收数据包。两者有不同的特性和适用场景: TCP&#xff0…

文档团队如何组成?

经常有朋友问我文档团队是由怎样背景的人组成的?今天来聊聊这个话题。 中国贸促会和技术传播专委会以及lnfomagic学院2023年在技术传播行业做了一个调查,在收到的231份有效样本中显示, 受访群体的背景主要是两大类,他们分别是技术…

视频推镜拍摄SDK解决方案,创新短视频玩法

在当今社交媒体盛行的时代,短视频已成为人们分享生活、展示创意的重要方式。美摄科技推出的视频推镜拍摄SDK解决方案,为用户提供了一种全新的短视频创作体验。 一、什么是视频推镜拍摄SDK解决方案? 美摄科技的视频推镜拍摄SDK解决方案是一种…