大模型改变了NLP的游戏规则了吗

news2025/1/24 8:33:15

NLP已经死了吗?

自从 ChatGPT 横空出世以来,自然语言处理(Natural Language Processing,NLP) 研究领域就出现了一种消极的声音,认为大模型技术导致 NLP “死了”。在某乎上就有一条热门问答,大家热烈地讨论了这个问题。

228cca5cdb4b9752373ed7affade2c3f.png

有人认为 NLP 的市场肯定有,但 NLP 的研究会遇到麻烦,因为大模型的训练建立在海量数据与超高算力之上,普通研究者难以获取这样的资源,只能做些应用研究;也有人认为大模型为 NLP 打开了一片新天地,NLP 的研究整体上会再上一个新台阶。

看看专家们怎么说,上海交通大学 ACM 班创办人俞勇教授等几位 AI 学界大咖认为,不了解过去,就无法理解当下。NLP 技术的发展历经了几十年,期间经历了多次重大技术革新,如果我们的讨论脱离历史发展,那是没有意义的。

所以俞勇教授等大佬们决心为 NLP 技术编写一本在历史和现代之间更加平衡的教科书——《动手学自然语言处理》,这本书将为我们讲透 NLP 的经典技术,梳理整个领域的发展脉络,启发我们思考 NLP 的未来。

8f23861247c70909a56a36e469697fde.png

点击下方即可购书,限时特惠

https://item.jd.com/14544280.html

 本书书课包同步上线,可以点击书课一起购买,更高效哦!

30c7b977f887cac0389e7ef141959ae1.jpeg

点击图片购买书课包

现在,让我们探究一下 NLP 的发展历程。

NLP 迎来新时代

NLP 的发展之路充满了探索与创新,2013年前后,基于符号系统和统计学习的方法主导着 NLP 研究的潮流。研究者通过制定复杂的规则和使用统计模型,尽力使计算机能够理解和生成自然语言。

然而,这种方法在处理复杂的语言结构和语义理解上存在着一定的局限性,难以适应不断增长的数据规模和复杂的语言任务。随着深度学习技术的兴起,特别是深度神经网络的发展,NLP 研究迈上了新台阶。

深度学习模型强大的表征学习能力,使得计算机可以更好地理解和处理自然语言,在诸多 NLP 任务上取得了突破性的进展。这一时期,神经网络模型开始成为 NLP 研究的主流,为文本分类、情感分析、机器翻译等任务提供了更加高效和灵活的解决方案。

真正让 NLP 脱胎换骨的是 2018 年,基于 Transfomer 架构的预训练语言模型崛起。预训练模型利用大规模语料库进行无监督学习,为各种 NLP 任务提供了强大的基础。

到 2022 年底,ChatGPT 的发布引发了前所未有的热潮。ChatGPT 不仅拥有惊人的生成能力,而且能够进行有意义的对话和语言理解,自然语言处理进入新时代。

 

b3a92253ec414e3207a1dea525b62e34.png

NLP 的快速发展也为专业教学带来考验,一方面是已有教材在技术层面过时了,另一方面是市场上的一些新书只关注神经自然语言处理,不涉及传统技术。《动手学自然语言处理》就弥补了这两个缺憾,将带领我们温故而知新。

本书的作者团队堪称豪华,我们来认识一下。

 

7b3557ea37ab4fd77162cbb65ebcb075.png

屠可伟

上海科技大学信息科学与技术学院长聘副教授、研究员、博士生导师。研究方向包括自然语言处理、机器学习等,主要研究将符号、统计和神经方法相结合用于语言结构的表示、学习与利用。发表论文100余篇,主要发表在ACL、EMNLP、AAAI 等人工智能领域顶级会议。担任多个顶级会议程序委员会委员和领域主席。曾获 ACL 2023 杰出论文奖,以及 SemEval 2022 和 SemEval 2023 最佳系统论文奖。

 

28f0942c324ad4a1bf0d3fa279fb4f98.png

王新宇

上海科技大学博士,长期从事自然语言处理研究工作,在 ACL、EMNLP、NAACL 等顶级会议上发表论文10余篇,担任ACL、NAACL 会议的领域主席以及ACL滚动审查(ACL Rolling Review)执行编辑。曾获得中国中文信息学会优秀博士学位论文提名、SemEval 2022 最佳系统论文奖等荣誉。

 

38d9025e1f46c9a5a210d0ca53e9225f.png

曲彦儒

伊利诺伊大学厄巴纳-香槟分校博士生,长期从事自然语言处理研究工作,在 ACL、NAACL、AAAI、ICLR 等会议上发表了多篇论文。

 

8ba41b1b378dfeee55c99b825156e213.png

俞勇

上海交通大学 ACM 班创始人,国家级教学名师,上海交通大学特聘教授。2018 年创办伯禹人工智能学院,在上海交通大学ACM 班人工智能专业课程体系的基础上,对人工智能课程体系进行创新,致力于培养卓越的人工智能算法工程师和研究员。

有如此多的名师指点,学透 NLP 只需要走好三步。

玩转NLP要走好这三步

在学习本书的内容之前,读者需要具备一些基础知识,包括基本的数学概念和机器学习的基础知识,如概率论、概率图模型、神经网络等。如果你已经准备好了,那我们继续前进。

本书将 NLP 的知识分为三部分,分别是基础、序列、结构

第一步:基础

从最基础的自然语言处理技术入手,讲解了文本规范化、文本表示、文本分类和文本聚类等内容。通过学习这些基础知识,读者可以了解如何将文本转化为计算机可以理解和处理的形式,以及如何对文本进行分类和聚类,为后续的学习打下坚实的基础。

第二步:序列

书中深入探讨了自然语言的序列建模技术,包括语言模型、序列到序列模型、预训练语言模型和序列标注等内容。

通过学习这些内容,读者将了解对文本序列进行概率建模的方法。书中还介绍了预训练语言模型将语言模型和序列到序列模型在大量数据上进行预训练,获取通用语言学知识的过程。

这部分内容是本书的重点,涵盖了当前应用最广泛的自然语言处理技术。读者可以学习到构成大模型的基础技术,包括循环神经网络、注意力机制、Transformer 模型。书中对这些知识点给出了详尽的代码说明,帮助读者全盘消化掌握。

 

5f55c77408062993d20676fc75ddef13.png

第三步:结构

书中探讨了自然语言文字序列背后更为复杂的结构,包括句法结构、语义结构和篇章结构等内容。

学习这些知识,读者可以了解句子中词语之间的连接关系、文本表达含义的结构化表示,以及多个句子如何组合形成段落和文章,从而更深入地理解和应用自然语言处理技术。

这部分内容曾经是自然语言处理的主流技术,也很有可能是未来自然语言处理的重要发展方向,读者可以在这里探索将来的发展机会。

把这三步走好,读者就摸透了 NLP 技术,可以在工作中大显身手了。

特色介绍

NLP 的研究方法也许会改变,但是 NLP 的应用市场会更加广阔。学习 NLP 不仅要追踪热门技术,也要透彻了解 NLP 发展的来龙去脉,《动手学自然语言处理》就可以很好地帮助读者通盘掌握 NLP。

本书最大的特色就是理论与实践紧密结合,提供了大量的配套学习资源。我们来看一下究竟可以获得哪些资源:纸书 + 可以扫码观看的理论视频课 + 配套课件方便教学 + 课后习题 + 配套代码(可在线运行也可离线运行)+ 配套代码实战课 + 针对高校教师的师资培训计划。

这几乎就是背靠一个强大的后勤军团,读者根本不用担心学习中会遇到困难,只要将这些资源善加利用,定能啃透 NLP 技术。

如书名中的“动手学”所示,本书给读者提供了极其便利的学习环境,每一章都由一个 Python Notebook 组成, Notebook 中包括概念定义、理论分析、方法讲解和可执行代码。读者可根据自己的需要学习理论,或者动手实践。

 

6d91f4c5877f3b3a3829d145deedf096.png

精彩代码示例

内容如此精湛的佳作,自然博得学界、业界各位大佬的一片赞誉之声。

本书深度整合了自然语言处理的理论精髓与实战智慧,内容讲解深入浅出、代码实例丰富易学,为培养自然语言处理领域的实战型人才提供了坚实的理论基石与丰富的实战资源,是渴望学习自然语言处理的读者必备的入门宝典。

——文继荣 中国人民大学高瓴人工智能学院执行院长、信息学院院长

在智能化浪潮下,懂技术、知应用的实战型人工智能人才的重要性日益凸显。本书以深入浅出的理论讲解为基础,辅以清晰明了的代码解析,帮助读者将自然语言处理的理论与实战融会贯通,值得广大读者深度研读。

——周明 澜舟科技创始人,ACL 原主席,CCF 原副理事长,微软亚洲研究院原副院长

学习自然语言处理需要将理论与实战相结合。本书凭借详尽的理论阐述、可运行的代码实例以及配套的习题与教学资源,构建了一座连接理论与实战的桥梁。无论是新手还是老手,均可使用本书深化对自然语言处理的理解并提升实战能力。

——邱锡鹏 复旦大学计算机科学技术学院教授

本书具有两大亮点。一是以序列和结构为主线来组织自然语言处理的关键技术。序列、结构和语义是语言文字的3个重要属性,语言文字是离散符号的序列,文本又由带有语义信息的结构组成。二是以指导动手实战为目标,每个章节均提供可执行代码,并加以解读。本书非常适合作为自然语言处理领域的高校教材,也适合作为工程师的常备工具书。

——李磊 卡内基梅隆大学计算机科学学院助理教授

本书作为一本全面且系统的自然语言处理教材,深入浅出地讲解了自然语言处理的基本概念和关键方法,无论是学生还是行业人士,都能够通过本书有效掌握自然语言处理的知识体系并进行动手实战。

——杨笛一 斯坦福大学计算机科学系助理教授

凡是对 NLP 原理和应用有兴趣的读者,包括本科生、研究生、教师、企业研究人员及工程师等,都可以从本书中获得自己想要的知识,助力学习工作得到提升。

如果读者对 AI 技术还有更广泛的兴趣,也可以将以下几本“动手学”系列好书给学起来。

《动手学深度学习(PyTorch版)》:大神李沐和阿斯顿·张的作品,本书通过经典的 PyTorch 深度学习框架,帮助读者掌握深度学习的精髓。

43c7fdd12be3653ee7cb55c12aca399a.png

《动手学强化学习》《动手学机器学习》:这两本书都是在俞勇教授的指导下,集合交大 ACM 班优秀的学者参与编写的,讲透了强化学习与机器学习的基本概念与关键技术。

 

e749c8a8040aca0e5e3b4fe2879de182.jpeg

 

78ffd05df7fd52048856912d58f26102.png

这些书同样提供了丰富的配套资源和友好的交互式学习环境。大家还等什么,就从《动手学自然语言处理》开始,通晓 AI 理论与应用,成为新时代的超级个体吧!

粉丝福利

  • 现在点赞收藏评论“人生苦短,我爱人工智能”
  • 评论区将随机抽取1名小伙伴免费赠书1本(包邮)
  • 截止日期:2024年4月25日

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1615120.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

03-为啥大模型LLM还没能完全替代你?

1 不具备记忆能力的 它是零状态的,我们平常在使用一些大模型产品,尤其在使用他们的API的时候,我们会发现那你和它对话,尤其是多轮对话的时候,经过一些轮次后,这些记忆就消失了,因为它也记不住那…

Python 开发实现登陆和注册模块

Python 开发实现登陆和注册模块 一、案例介绍 本例设计一个用户登录和注册模块,使用Tkinter框架构建界面,主要用到画布、文本框、按钮等组件。涉及知识点:Python Tkinter界面编程、pickle数据存储。本例实现了基本的用户登录和注册互动界面…

纹理合成在AI去衣技术中的关键作用

随着人工智能技术的飞速发展,图像处理和计算机视觉领域取得了显著的进步。其中,AI去衣技术作为图像处理的一个分支,近年来引起了广泛关注。在AI去衣技术中,纹理合成发挥着至关重要的作用,它不仅能够保证图像的真实性&a…

YOLO算法改进Backbone系列之MogaNet:

卷积神经网络(ConvNets)一直是计算机视觉的首选方法。受灵长类视觉系统的启发,卷积层可以对具有区域密集连接和平移等方差约束的观测图像的邻域相关性进行编码。通过交错分层,ConvNets获得了被动增加的感受野,并善于识…

掼蛋比赛中的违规及处罚

一、越序违规及处罚 1、越序抓牌:抢先抓其他选手应抓的牌。 (1)越序抓牌但并没有看到的,一经发现须马上退回。 (2)越序抓牌已经看到的但是没有插入手牌中的,除马上退回外,可由裁判员…

OpenHarmony实战开发-文件上传下载性能提升指导。

概述 在开发应用时,要实现高效的客户端跟服务器之间数据交换,文件传输的性能是至关重要的。一个数据交换性能较低的应用会导致其在加载过程中耗费较长时间,在很多的场景造成页面卡顿,极大的影响了用户体验。相反,一个…

【进程地址空间】地址空间理解存在原因 | 深入理解页表写时拷贝虚拟地址

目录 地址空间深入理解 划分区域 理解地址空间 地址空间存在的意义 意义1 意义2 意义3 理解页表和写时拷贝 页表 写时拷贝 OS识别错误 理解虚拟地址 fork解释 上篇我们简单的学习了进程地址空间/页表/物理地址/虚拟地址/写时拷贝等概念。本篇深入理解下。 地址空…

分数求和(C语言)

一、N-S流程图&#xff1b; 二、运行结果&#xff1b; 三、源代码&#xff1b; # define _CRT_SECURE_NO_WARNINGS # include <stdio.h>int main() {//初始化变量值&#xff1b;double a 0, b 1, result1 2, sum 0;int i 0;//循环运算&#xff1b;for (i 1; i <…

人工智能大模型培训老师叶梓 探索知识库问答中的查询图生成:处理多跳复杂问题的新方法

在人工智能领域&#xff0c;基于知识库的问答&#xff08;KBQA&#xff09;技术正变得越来越重要。它使得机器能够理解自然语言问题&#xff0c;并从结构化的知识库中检索答案。然而&#xff0c;面对多跳复杂问题&#xff0c;传统的KBQA方法往往力不从心。近期&#xff0c;研究…

Threejs绘制传送带

接下来会做一个MES场景下的数字孪生&#xff0c;所以开始做车间相关的模型&#xff0c;不过还是尽量少用建模&#xff0c;纯代码实现&#xff0c;因为一方面可以动态使用&#xff0c;可以调节长度和宽度等&#xff0c; 下面这节就做一个简单的传送带&#xff0c;这是所有车间都…

C++心决之类和对象详解(中篇)(封装入门二阶)

目录 1.类的6个默认成员函数 2. 构造函数 2.1 概念 2.2 特性 3.析构函数 3.1 概念 3.2 特性 4. 拷贝构造函数 4.1 概念 4.2 特征 5.赋值运算符重载 5.1 运算符重载 5.2 赋值运算符重载 5.3 前置和后置重载 7.const成员 8.取地址及const取地址操作符重载 1.类的…

Win 进入桌面黑屏,只有鼠标

大家好&#xff0c;我叫秋意零。 今天&#xff0c;遇到一个同事电脑进入桌面黑屏&#xff0c;只有鼠标。经过询问沟通&#xff0c;说是 Windows 突然进行了自动更新&#xff0c;更新之后桌面就黑了屏。经过查询是一个桌面进程没启动才会导致桌面黑屏。首先分两种情况&#xff0…

【linux】软件工具安装 + vim 和 gcc 使用(上)

目录 1. linux 安装软件途径 2. rzsz 命令 3. vim 和 gcc 使用 a. vim的基本概念 b. 命令模式下的指令 c. 底行模式下的指令 1. linux 安装软件途径 源代码安装rpm安装 -- linux安装包yum安装&#xff08;最好&#xff0c;可以解决安装源&#xff0c;安装版本&#xff0…

ArrayList与顺序表(1)

前言~&#x1f973;&#x1f389;&#x1f389;&#x1f389; hellohello~&#xff0c;大家好&#x1f495;&#x1f495;&#xff0c;这里是E绵绵呀✋✋ &#xff0c;如果觉得这篇文章还不错的话还请点赞❤️❤️收藏&#x1f49e; &#x1f49e; 关注&#x1f4a5;&#x…

使用matplotlib的quiver绘制二维箭头图

使用ax.quiver绘制二维箭头图 1. matplotlib的quiver函数的调用方式 quiver函数是axes类的成员函数&#xff0c;其基本调用方式为&#xff1a; quiver([X, Y], U, V, [C], **kwargs) [X,Y]是箭头的位置&#xff0c;U,V是箭头的方向&#xff0c;C是箭头颜色。 具体而言&#x…

多项式轨迹规划

公众号“轻松玩转机器人”&#xff0c;欢迎关注。 1、简介 常用的多项式规划一般泛指3次、5次和7次等多项式规划&#xff0c;4次多项式规划用到的比较少&#xff0c;暂不介绍。 为什么奇数次多项式比较常用呢&#xff1f;因为其有偶数个系数&#xff01; 偶数个系数有什么用…

泛型的初步认识(1)

前言~&#x1f973;&#x1f389;&#x1f389;&#x1f389; hellohello~&#xff0c;大家好&#x1f495;&#x1f495;&#xff0c;这里是E绵绵呀✋✋ &#xff0c;如果觉得这篇文章还不错的话还请点赞❤️❤️收藏&#x1f49e; &#x1f49e; 关注&#x1f4a5;&#x…

Unity中的UI系统之UGUI

目录 概述UGUI基础——六大基础组件六大基础组件概述Canvas画布组件CanvasScaler画布缩放控制器组件必备知识恒定像素模式缩放模式恒定物理模式3D模式 Graphic Raycaster图形射线投射器EventSystem和Standalone Input ModuleRectTransform UGUI基础——三大基础控件Image图像控…

【解决】Caused by: javax.net.ssl.SSLHandshakeException: PKIX path building failed

问题原因&#xff1a; 在Java8及高版本以上的版本在源应用程序不信任目标应用程序的证书&#xff0c;因为在源应用程序的JVM信任库中找不到该证书或证书链。也就是目标站点启用了HTTPS 而缺少安全证书时出现的异常 解决方案&#xff1a; 我使用的是忽略证书验证 public clas…

vs code server for wsl closed unexpectedly

前言&#xff1a; 我的Windows 版本&#xff1a; 10.0.19045.4291 &#xff08;如果你是Win11或者你要使用WSL2请谨慎&#xff09; 之前是可以用的&#xff0c;但安装Vmware&#xff08;并安装了Ubuntu进行了一番实验后&#xff0c;就出现如标题所述问题&#xff09; 问题&a…