从“NLP技术”到“AI大模型”

news2024/11/17 7:57:07

自从AI大模型问世以来,仿佛很少有人提及NLP技术这个词了。昨天休息的时候突然在想一个问题,AI大模型已经如此强大了,还需要传统的NLP技术吗?

img

传统的NLP技术指:从分词(ws)、词性标注(pos)、命名实体识别(ner)、依存句法分析(dp)、语义角色标注(srl)等过程。

传统的NLP技术主要应用一些基于规则、统计学的机器学习模型来实现。而AI大模型核心是基于词嵌入技术来进行实现,相当于是一种暴力解题的方式,通过超大规模参数来达到模型涌现的能力。

二者最核心的区别在于2个:一个是训练所需的数据不在同一个一个数量级上,传统的NLP技术处理的更多的是企业内部定向任务的数据,而AI大模型则应用全网数据来实现;另一个则是在技术实现的抽象层次不同。

NLP技术是直接应用人力可以理解的语言规则来实现;而AI大模型则是将语言规则抽象成向量,然后通过深度神经网络来进行训练,在神经网络中面对抽象后的高维向量,人力已无法理解,这也是AI大模型的解释性比较差的原因。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

在让机器理解人类语言这件事儿上,现在看来可以划分为2个阶段:NLP技术阶段、和AI大模型阶段,每个阶段都有其独特的技术特点和里程碑事件。以下是这两个阶段的技术演变过程的详细梳理。

一、传统NLP技术阶段

1. 早期方法(1950s – 1990s)

早期的NLP主要依赖于规则-based的方法和基于词典的系统。技术包括语法分析、模式匹配、关键词提取等。

2. 统计学习方法的兴起(1990s – 2000s)

统计学习方法开始应用于NLP,如隐马尔可夫模型(HMM)和条件随机场(CRF)。这些方法能够处理序列数据,并且对标记数据的需求较少。

img一款产品无到有,产品经理需要做些什么?在一个产品从无到有的过程中,要做好产品经理这个角色实在是不容易,除了大家都知道的写需求、写需求、写需求,要做的事多着呢。产品经理不是你眼中的只会找你麻烦,提要求…查看详情 >

3. 浅层和深层学习(2000s – 2010s)

特征工程和机器学习方法(如支持向量机SVM)在这一时期得到了广泛应用。出现了一些重要的NLP任务,如情感分析、命名实体识别、机器翻译等。

4. 语义角色标注和语义解析(1998 – 2000s)

FrameNet和语义角色标注的提出,推动了浅层语义解析的发展。共享任务和评估标准(如CoNLL)促进了核心NLP任务的研究。

二、AI大模型阶段

1. 词嵌入的革命(2013年前后)

Word2Vec和GloVe等词嵌入技术的提出,使得NLP能够更好地捕捉词汇的语义信息。词嵌入技术的出现为后续的深度学习模型奠定了基础。

2. 神经网络的突破(2013年 – 2014年)

循环神经网络(RNN)、卷积神经网络(CNN)、长短期记忆网络(LSTM)开始应用于NLP任务。这些网络能够捕捉文本数据中的序列特征和局部依赖关系。

3. 预训练语言模型的兴起(2018年前后)

BERT、GPT、XLNet等预训练语言模型的出现,极大地推动了NLP技术的发展。这些模型通过在大规模文本数据上进行预训练,学习到了丰富的语言表示。

4. Transformer架构的普及(2017年 – 至今)

Transformer架构的提出,特别是在BERT和GPT系列模型中的应用,成为了NLP领域的核心技术。Transformer能够有效处理长距离依赖问题,并且支持多任务学习和迁移学习。

5. 大模型的挑战与创新(2022年代)

大模型虽然在多个NLP任务上取得了显著的性能提升,但也面临着诸如可解释性、偏见、伦理和隐私等挑战。研究人员和开发者正在探索如何设计和训练更加安全、可控和可解释的大模型。

三、总结

传统的NLP技术是人类探索机器理解自然语言的一个过程,如果没有这个过程,那么后面的词嵌入、预训练模型、以及AI大模型可能就不会诞生了,正是由于传统NLP技术在应用层的惰性,才激发了研究人员的新思考,做出重大突破。

所以,回到文初的那个问题:AI大模型已经如此强大了,还需要传统的NLP技术吗?

当然如果你是从事应用层工作的人员,个人觉得不需要再去研究传统的NLP技术了,直接从词嵌入阶段开始了解即可。‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍‍

而如果你是偏科研方面的工作人员,则非常有必要去研究一下,传统的NLP技术,知其因,才能更好的解其果,这是奠定科研工作的基础。‍‍‍‍‍‍‍‍‍

读者福利:如果大家对大模型感兴趣,这套大模型学习资料一定对你有用

对于0基础小白入门:

如果你是零基础小白,想快速入门大模型是可以考虑的。

一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

资源分享

图片

大模型AGI学习包

图片

图片

资料目录

  1. 成长路线图&学习规划
  2. 配套视频教程
  3. 实战LLM
  4. 人工智能比赛资料
  5. AI人工智能必读书单
  6. 面试题合集

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

1.成长路线图&学习规划

要学习一门新的技术,作为新手一定要先学习成长路线图方向不对,努力白费

对于从来没有接触过网络安全的同学,我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线,大家跟着这个大的方向学习准没问题。

图片

2.视频教程

很多朋友都不喜欢晦涩的文字,我也为大家准备了视频教程,其中一共有21个章节,每个章节都是当前板块的精华浓缩

图片

3.LLM

大家最喜欢也是最关心的LLM(大语言模型)

图片

人工智能\大模型入门学习大礼包》,可以扫描下方二维码免费领取

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1896924.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【半导体行业推荐】PFA酸纯化器 特氟龙材质 酸蒸馏仪

PFA酸纯化器是一种实验室设备,专门用于制备高纯度的酸,这些高纯酸在化学分析、材料科学、半导体制造、光伏产业、生物医学研究等领域有着重要应用。以下是PFA酸纯化器的一些关键特性和功能: 1. 高效提纯:PFA酸纯化器通过先进的膜…

go语言day09 通道 协程的死锁

Go语言学习——channel的死锁其实没那么复杂 - JackieZheng - 博客园 (cnblogs.com) 目录 通道 创建通道 1)无缓冲通道 2)有缓冲通道 通道的使用 1) 值从通道入口进 2) 值从通道出口出 信道死锁: 0)死锁现场0 1)死…

Twitter批量发送消息api接口如何申请配置?

Twitter批量发送消息API接口的功能?接口有哪些限制? 企业和开发者越来越多地需要在Twitter上批量发送消息。然而,申请和配置这个接口需要一定的步骤和注意事项。AokSend将详细介绍如何申请和配置Twitter批量发送消息API接口。 Twitter批量发…

静力水准仪:测量与安装的全面指南

静力水准仪作为一种高精度的测量仪器,广泛应用于管廊、大坝、核电站、高层建筑、基坑、隧道、桥梁、地铁等工程领域,用于监测垂直位移和倾斜变化。本文将详细介绍静力水准仪的工作原理、特点及其安装过程中的注意事项,旨在为相关工程人员提供…

sql业务场景分析思路参考

1、时间可以进行排序,也可以用聚合函数对时间求最大值max(时间) 例如下面的例子:取最晚入职的人,那就是将入职时间倒序排序,然后limit 1 表: 场景:查找最晚入职员工的所有信息 se…

maven项目、idea抽风问题解决

开发的时候遇到奇奇怪怪的非技术问题,解决起来会费时间,做无用功。   这里记录常见的情况和解决方法 1.未识别maven项目 文件的图标变成了这种橙色的,而且有主启动函数也不能run 右键pom文件,点击Add as Maven Project 如果…

215. 数组中的第K个最大元素(中等)

215. 数组中的第K个最大元素 1. 题目描述2.详细题解3.代码实现3.1 Python3.2 Java 1. 题目描述 题目中转:215. 数组中的第K个最大元素 2.详细题解 快速排序算法在每一轮排序中,随机选择一个数字 x x x,根据与 x x x的大小关系将要排序的数…

C++ 引用——引用的基本语法

引用的基本使用 作用:给变量起别名 语法:数据类型 &别名 原名 示例: 运行结果:

【网络安全】漏洞挖掘之Spring Cloud注入漏洞

漏洞描述 Spring框架为现代基于java的企业应用程序(在任何类型的部署平台上)提供了一个全面的编程和配置模型。 Spring Cloud 中的 serveless框架 Spring Cloud Function 中的 RoutingFunction 类的 apply 方法将请求头中的“spring.cloud.function.routing-expression”参数…

【微信小程序开发实战项目】——花店微信小程序实战项目(4)

👨‍💻个人主页:开发者-曼亿点 👨‍💻 hallo 欢迎 点赞👍 收藏⭐ 留言📝 加关注✅! 👨‍💻 本文由 曼亿点 原创 👨‍💻 收录于专栏&#xff1a…

创新引领,构筑产业新高地

在数字经济的浪潮中,成都树莓集团以创新驱动为核心,通过整合行业资源、优化服务、培养数字产业人才等措施,致力于打造产业高地,推动地方经济的高质量发展。 一、创新驱动,引领产业发展 1、引入新技术、新模式&#xf…

作为图形渲染API,OpenGL和Direct3D的全方位对比。

当你在网页看到很多美轮美奂的图形效果,3D交互效果,你知道是如何实现的吗?当然是借助图形渲染API了,说起这个不就不得说两大阵营,OpenGL和Direct3D,贝格前端工场在本文对二者做个详细对比。 一、什么是图形…

05-《猪笼草》

猪笼草 猪笼草是猪笼草属全体物种的总称。属于热带食虫植物,原产地主要为旧大陆热带地区。其拥有一个独特的吸取营养的器官——捕虫笼,捕虫笼呈圆筒形,下半部稍膨大,笼口上具有盖子,因其形状像猪笼而得名。 猪笼草 形…

【MySQL】事务实现原理

目录 事务 如何使用 ACID 原子性(Atomicity) 原子性实现原理 持久性(Durability) 持久性实现原理 隔离性 隔离级别 读未提交 读已提交 可重复读 串行化 隔离级别原理 锁 共享锁&独占锁 意向锁 索引记录锁 间隙锁 临键锁 插入意向锁 自增锁 MVCC 实现…

【杂交版】植物大战僵尸杂交版v2.1最新版本下载链接

B站游戏作者潜艇伟伟迷于6月13日中午更新了植物大战僵尸杂交版2.1版本,有老版本的也可以完美继承存档数据。 不多废话下载链接放上: 夸克网盘链接:https://pan.quark.cn/s/095de551d1d1 UC网盘链接:https://drive.uc.cn/s/86debb3…

pdf压缩教程:pdf怎么压缩的小一点?6个方法轻松搞定!

大多数用户在上传PDF文件到网站时,常常遇到文件大小限制的问题。当PDF文件含有大量图片、图形和内容时,文件大小会变得过大,因此我们需要将其压缩至网站所要求的大小,才能成功上传。那么,pdf怎么压缩的小一点 呢&#…

微信扫普通二维码打开小程序-详细实现

微信扫普通二维码链接打开小程序的官方文档地址:扫普通链接二维码打开小程序 | 微信开放文档 我们讲一下开发中的避坑点。 获取链接参数 本人项目采用UNIAPP,所以在开发的时候,牵扯打开页面的特殊性,在onLoad生命周期不执行。在…

华为OD机试2024年最新题库 JAVA C卷+D卷

目录 专栏导读华为OD机试算法题太多了,知识点繁杂,如何刷题更有效率呢? 一、逻辑分析二、数据结构1、线性表① 数组② 双指针 2、map与list3、队列4、链表5、栈6、滑动窗口7、二叉树8、并查集9、矩阵 三、算法1、基础算法① 贪心思维② 二分查…

#招聘数据分析#2024年6月前程无忧招聘北上广深成渝对比情况

#招聘数据分析#2024年6月前程无忧招聘北上广深成渝对比情况 0、根据前程无忧不完全样本统计,北上广深成都重庆平均月工资从高到低依次为 北京15441元、上海14425元、深圳13310元、广州11192元、成都10539元、重庆10290。 1、成都招聘样本数全量35228个&#xff0c…