【NLP相关】NLP的发展历程

news2024/9/20 15:28:27

❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

【NLP相关】NLP的发展历程

NLP

1. NLP发展历程

自然语言处理(Natural Language Processing,NLP)是一种计算机科学和人工智能交叉领域,旨在帮助计算机理解和处理人类语言。NLP的发展历程可以追溯到20世纪50年代,随着时间的推移,它不断发展,逐渐成为计算机科学领域的一个重要分支。本文将详细介绍NLP的发展历程。

(1)20世纪50年代到70年代

自然语言处理领域的历史可以追溯到20世纪50年代,当时计算机的发展正处于起步阶段。在1950年代初期,人们开始尝试使用计算机处理自然语言文本。然而,由于当时的计算机处理能力非常有限,很难处理自然语言中的复杂语法和语义。

在20世纪60年代和70年代,自然语言处理领域取得了一些重要的进展。在1961年,IBM研究人员Victor Yngve开发了一个名为COMIT的系统,它可以对英语进行语法分析。在1970年,美国宾夕法尼亚大学的Adele Goldberg和David Robson创建了一个名为Lunenfeld Project的系统,它可以进行自动翻译。

在国内方面,中国科学院自动化研究所也在20世纪70年代开始研究自然语言处理技术。当时,中国的自然语言处理研究主要集中在机器翻译领域。

(2)20世纪80年代到90年代

在20世纪80年代和90年代,自然语言处理领域取得了更多的进展。在1981年,Xerox PARC研究人员Ron Kaplan和Martin Kay开发了一个名为Lexical Functional Grammar(LFG)的语法框架。在1986年,欧洲语言资源协会(ELRA)成立,致力于创建和维护多语言语料库。在1987年,美国国家科学基金会(NSF)成立了一个名为American National Corpus(ANC)的计划,致力于创建一个覆盖美国英语的语料库。

在90年代,随着计算机技术的进一步发展,自然语言处理技术逐渐变得更加成熟和普及。在1990年代初期,诸如Information Retrieval and Extraction System(IREX)和Text REtrieval Conference(TREC)等研究项目涌现,为自然语言处理技术的发展提供了重要的支持。在1999年,Google发布了基于PageRank算法的搜索引擎,标志着自然语言处理技术开始应用于大规模的信息检索和处理领域。

在国内方面,20世纪80年代后期和90年代初期,中国的自然语言处理研究得到了进一步发展。在1988年,清华大学成立了自然语言处理实验室,致力于机器翻译、语音识别和自然语言理解等领域的研究。此外,中国科学院自动化研究所和中科院计算技术研究所等机构也在自然语言处理领域取得了一些进展。

(3)21世纪初期至今

进入21世纪,自然语言处理领域取得了更加显著的进展。随着互联网的快速发展,自然语言处理技术开始应用于许多领域,例如搜索引擎、社交媒体分析、智能客服等等。在2001年,美国国家科学基金会(NSF)启动了一个名为OntoNotes的计划,致力于创建多语言语料库,并提供高质量的语义注释。在2002年,微软研究院发布了名为Ngram的语言模型,该模型被广泛应用于自然语言处理的各个领域。

在近年来,自然语言处理技术取得了一些突破性的进展。在2011年,IBM的Watson超级计算机赢得了美国电视游戏节目Jeopardy!的冠军,引起了广泛的关注。在2017年,谷歌发布了一种名为Transformer的神经网络架构,该架构被广泛应用于自然语言处理领域,并在机器翻译和自然语言理解等领域取得了出色的成果。此外,还有很多新兴技术,例如BERT(Bidirectional Encoder Representations from Transformers)、GPT(Generative Pre-trained Transformer)等,都在自然语言处理领域得到了广泛应用。

在国内方面,中国的自然语言处理技术也在快速发展。在2017年,中国的自然语言处理技术团队在GLUE基准测试中获得了第一名,并在多个领域取得了卓越的成果。此外,国内的企业和机构也在自然语言处理领域进行了大量的研究和开发,例如百度、阿里巴巴、腾讯、华为等等。

2. 自然语言处理技术的应用

自然语言处理技术已经应用于许多领域,例如信息检索、机器翻译、情感分析、智能客服、智能问答系统、语音识别和合成、自然语言生成等等。

(1)信息检索

信息检索是自然语言处理技术最早被广泛应用的领域之一。自然语言处理技术可以帮助搜索引擎更好地理解用户的搜索意图,提高搜索结果的准确性和相关性。例如,搜索引擎可以分析用户输入的查询语句,并自动识别其中的关键词和短语,并根据这些关键词和短语来搜索相关的内容。

(2)机器翻译

机器翻译是自然语言处理技术的另一个重要领域。自然语言处理技术可以帮助机器翻译系统更好地理解源语言和目标语言之间的语义和语法关系,并生成高质量的翻译结果。目前,机器翻译技术已经得到了广泛应用,例如在跨境电商、国际合作、新闻报道等领域。

(3)情感分析

情感分析是一种自然语言处理技术,可以分析和理解文本中的情感和情绪。情感分析可以帮助企业更好地了解用户的需求和反馈,以及在社交媒体上的声誉和品牌形象。例如,企业可以使用情感分析技术来分析用户在社交媒体上的评论和反馈,并快速响应和处理问题,提高用户满意度和忠诚度。

(4)智能客服

智能客服是一种基于自然语言处理技术的客服系统,可以自动识别用户的问题和需求,并提供相应的解答和服务。智能客服可以帮助企业更快速和高效地处理用户的问题和需求,减少客服成本和提高用户满意度。例如,智能客服系统可以使用自然语言处理技术来识别用户的问题和需求,并提供相应的解答和服务,帮助用户更快速和方便地解决问题。

(5)智能问答系统

智能问答系统是一种基于自然语言处理技术的智能系统,可以自动回答用户的问题。智能问答系统可以帮助用户更快速和方便地获取所需信息,提高信息检索的效率和准确性。例如,智能问答系统可以使用自然语言处理技术来分析用户输入的问题,并自动匹配相关的知识和答案,并将结果返回给用户。这种技术可以被广泛应用于智能家居、智能机器人、智能助手等场景中。

(6)语音识别和合成

语音识别和合成是自然语言处理技术的另一个重要领域。语音识别可以将人类的语音转换成文字,而语音合成则可以将文字转换成自然的语音。这些技术可以被广泛应用于语音识别和合成、语音助手、智能客服等领域中。

(7)自然语言生成

自然语言生成是一种自然语言处理技术,可以自动生成符合语法和语义规则的自然语言文本。自然语言生成可以被广泛应用于生成新闻报道、自动生成语音对话、自动生成电子邮件等领域中。

3.语言模型发展历程

  • 1950年代初:美国数学家克劳德·香农(Claude Shannon)提出了基于信息熵的语言模型。他认为,语言可以看作是一种信息源,而熵是表示信息的度量。

  • 1960年代:IBM的研究人员开始使用基于n-gram的语言模型来进行机器翻译。他们使用的是二元语法模型,即考虑两个相邻单词的组合。

  • 1970年代:语言学家Jelinek和Mercer等人开始使用基于概率的语言模型,如N-gram语言模型,并且开始使用最大似然估计方法来训练语言模型。

  • 1980年代:隐马尔可夫模型(Hidden Markov Model,HMM)开始被广泛应用于语音识别和自然语言处理领域。这种模型可以通过学习词性标记序列来提高语言模型的准确性。

  • 1990年代:神经网络模型开始被应用于语言模型,例如循环神经网络(Recurrent Neural Networks,RNN)和长短时记忆网络(Long Short-Term Memory,LSTM)等。这些模型可以处理长文本序列,并且可以通过学习单词之间的关系来提高语言模型的准确性。

  • 2000年代:深度学习模型开始成为语言模型领域的主流,如基于卷积神经网络(Convolutional Neural Networks,CNN)和注意力机制(Attention)的模型。这些模型在自然语言处理领域取得了重大突破,如机器翻译和自然语言生成等任务。

  • 2010年代至今:预训练语言模型(Pre-trained Language Models)成为了语言模型领域的新热点。这些模型可以在大规模文本语料库上进行预训练,并且可以通过微调来适应特定的任务,如问答、文本分类、文本生成等。BERT、GPT等模型已经成为了自然语言处理领域的重要工具。

除了上述里程碑事件之外,还有一些其他的重要发展:

  • 语言模型评价标准的提出:BLEU、ROUGE、METEOR等指标被广泛应用于自然语言处理领域,用于评估机器翻译、文本生成等任务的质量。

  • 知识图谱的应用:知识图谱是一种结构化的知识表示方式,被广泛应用于自然语言处理领域。例如,可以使用知识图谱来增强问答系统的能力,使得机器可以回答更加复杂的问题。

  • 基于强化学习的语言生成:强化学习可以用来训练机器生成连续的文本序列。通过与环境的交互,机器可以学习如何产生符合要求的文本序列,例如对话系统中的自然语言回应。

  • 多语言语言模型的发展:随着全球化的发展,多语言语言模型的需求越来越大。目前,已经有很多多语言语言模型被开发出来,例如XLM、M2M等。

4. Transformer的发展历程

Transformer是一种革命性的神经网络架构,它于2017年被Google提出,用于自然语言处理领域的文本序列建模。相比于传统的递归神经网络(如RNN、LSTM等),Transformer使用了全新的基于注意力机制的架构,避免了递归计算的复杂度,并实现了并行计算,大大提高了模型的训练速度和效率。

Transformer的发展历程可以追溯到2014年,当时Google的研究人员已经开始研究基于注意力机制的序列建模方法,但是这项研究还没有引起太多关注。直到2017年,Google Brain团队的研究人员Vaswani等人发表了一篇题为《Attention Is All You Need》的论文,这篇论文提出了一种全新的基于注意力机制的神经网络架构——Transformer。

Transformer的核心思想是利用注意力机制来建模文本序列之间的关系。传统的RNN或LSTM模型需要递归计算每个时间步的状态,而Transformer可以并行计算整个序列,从而大大提高了模型的训练速度和效率。在Transformer中,注意力机制被广泛应用于编码器和解码器中,通过计算注意力权重来自适应地融合不同位置的信息,从而实现了更加精确的文本序列建模。

除此之外,Transformer还引入了残差连接和层归一化等技术,进一步提高了模型的性能和稳定性。在经过大量的实验验证之后,Transformer在机器翻译、语言建模、文本生成等自然语言处理任务中取得了巨大成功,并逐渐成为自然语言处理领域的标准模型之一。

Transformer的出现标志着神经网络架构设计的一个重要转折点,它通过全新的基于注意力机制的思想,避免了传统递归神经网络的计算复杂度,并且实现了更加精确的文本序列建模。未来,我们可以期待更加先进的自然语言处理模型的出现,这些模型将会更加智能、更加高效、更加适应多样化的任务需求。

参考文献


❤️觉得内容不错的话,欢迎点赞收藏加关注😊😊😊,后续会继续输入更多优质内容❤️

👉有问题欢迎大家加关注私戳或者评论(包括但不限于NLP算法相关,linux学习相关,读研读博相关......)👈

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/384167.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++实现AVL树

目录 一、搜索二叉树 1.1 搜索二叉树概念 二、模拟实现二叉搜索树 2.1 框架 2.2 构造函数 2.2.1 构造函数 2.2.2 拷贝构造 2.2.3 赋值拷贝 2.3 插入函数 2.3.1 insert() 2.3.2 RcInsert() 递归实现 2.4 删除结点函数 2.4.1 Erase() 2.4.2 RcErase() 2.5 中序遍历…

Nuxt 3.0 全栈开发:五种数据获取 API 选择和应用最佳实践

Nuxt 3.0 全栈开发 - 杨村长 - 掘金小册核心知识 工程架构 全栈进阶 项目实战,快速精通 Nuxt3 开发!。「Nuxt 3.0 全栈开发」由杨村长撰写,299人购买https://s.juejin.cn/ds/S6p7MVo/ 上一讲我们学习了如何基于 API Route 编写接口&#…

12.2 基于Django的服务器信息查看应用(CPU信息)

文章目录CPU信息展示图表展示-视图函数设计图表展示-前端界面设计折线图和饼图展示饼图测试折线图celery和Django配合实现定时任务Windows安装redis根据数据库中的数据绘制CPU折线图CPU信息展示 图表展示-视图函数设计 host/views.py def cpu(request):logical_core_num ps…

【Unity VR开发】结合VRTK4.0:创建人工按钮

语录: 人生需要准备的,不是昂贵的茶,而是喝茶的心情。 前言: 按钮按下抬起是虚仿中经常会出现的功能,那么如何去表现呢,我们可以使用线性变换驱动器对人工按钮进行装箱,以对来自交互器的碰撞做…

Netty——心跳机制与断线重连

心跳机制与断线重连心跳机制IdleStateHandler客户端服务端测试正常情况异常情况总结断线重连为了保证系统的稳定性,心跳机制和断线重连可是必不可少的,而这两个在Netty中也是非常好实现的心跳机制 我们以客户端发送心跳为例,平时我们的心跳实…

linux常用命令介绍 04 篇——uniq命令使用介绍(Linux重复数据的统计处理)

linux常用命令介绍 04 篇——uniq命令使用介绍(Linux重复数据的统计处理)1. uniq 使用语法2. sort 简单效果3. uniq 使用例子3.1 不加任何选项3.1.1 不用 sort 效果3.1.2 uniq 结合 sort 一起使用3.2 使用选项例子3.2.1 去重打印(或打印不重复…

12 nuxt3学习(配置)

链接: nuxt3官网 nuxt简介 vue3技术栈:Nuxt3 是基于 Vue3 Vue Router Vite 等技术栈,全程 Vue3Vite 开发体验(Fast)。自动导包:Nuxt 会自动导入辅助函数、组合 API和 Vue API ,无需手动导入。 基于规范…

卡方分布、非中心卡方分布详解 (概念、求阈值方法、非中心化参数求解办法等)

一、相关概念 1、卡方分布 若n个 相互独立 的随机变量 ξ₁、ξ₂、……、ξn ,均服从 标准正态分布N(0,1),则这n个服从标准正态分布的随机变量的 平方和 构成一新的随机变量,其分布规律称为卡方分布(chi-squaredistribution);其中参数n称为自由度(通俗讲,样本中独立…

有关数据库的一级、二级、三级封锁协议

一级封锁协议 一级封锁协议是指,事务T在修改数据R之前必须先对其加X锁,直到事务结束才释放。事务结束包括正常结束(COMMIT)和非正常结束(ROLLBACK).一级封锁协议可防止丢失修改,并保证事务T是可恢复的。在…

SpringBoot热部署

启动热部署 关于热部署 重启(Restart):自定义开发代码,包含类、页面、配置文件等,加载位置restart类加载器重载(ReLoad):jar包,加载位置base类加载器开启开发者工具 导…

gma 地理空间绘图:(1) 绘制简单的世界地图-2.设置经纬网

内容回顾 gma 地理空间绘图:(1)绘制简单的世界地图-1.地图绘制与细节调整 方法 AddGridLines(LONRange (-180, 180, 15), LATRange (-90, 90, 15), ShowLON True, ShowLAT True, LineColor ‘gray’, LineStyle (0, (6, 6)), LineWidth 0.3) 功能&#xf…

10种常见网站安全攻击手段及防御方法

在某种程度上,互联网上的每个网站都容易遭受安全攻击。从人为失误到网络罪犯团伙发起的复杂攻击均在威胁范围之内。 网络攻击者最主要的动机是求财。无论你运营的是电子商务项目还是简单的小型商业网站,潜在攻击的风险就在那里。 知己知彼百战不殆&…

MOA-30kV氧化锌避雷器泄露电流测试仪

一、概述 用于检测10kV及以下电力系统用无间隙氧化锌避雷器MOA阀电间接触不良的内部缺陷,测量MOA的直流参考电压(U1mA)和0.75 U1mA下的泄漏电流。该仪器将直流高压电源、测量和控制系统组成一体,元件浓缩在一个机箱内&#xff0c…

JS混淆加密:Eval的未公开用法

JavaScript奇技淫巧:Eval的未公开用法 作者:http://JShaman.com w2sft,转载请保留此信息很多人都知道,Eval是用来执行JS代码的,可以执行运算、可以输出结果。 但它还有一种未公开的用途,想必很少有人用过。…

【计算机网络】数据链路层:组帧,奇偶校验,CRC循环冗余校验,海明码详解

数据链路层 一、校验 1. 奇偶校验 偶校验 数据位和为偶数:校验位为0;数据位和为奇数:校验位为1; 奇校验 数据位和为奇数:校验位为0;数据位和为偶数:校验位为1; 缺点是会存在误判…

【Autoware】采集实验数据bag包并仿真运行

文章目录1. 官方demo包2. 控制底层地图采集3. 感知定位4. 规划控制5. 仿真或实车运行1. 官方demo包 wget http://db3.ertl.jp/autoware/sample_data/sample_moriyama_data.tar.gz wget http://db3.ertl.jp/autoware/sample_data/sample_moriyama_150324.tar.gz官方示例包的网上…

iPhone屏蔽APP广告的方法

iPhone怎么屏蔽网站(域名)? 操作步骤:“设置” -> “屏幕使用时间” -> “打开屏幕使用时间” -> “内容和隐私访问限制” -> “内容访问限制” -> “网页内容” -> “限制成人网站” -> “永不允许”, 添加需要屏蔽的网站或者域名…

项目开发过程中实际遇到的几个问题处理

1、今天开发环境运行的时候出现下面问题 The project cannot be built until build path errors are resolved. 出现报错情况,之前也没有遇到过。 根据字面意思“在解决生成路径的错误之前,无法生成项目”,也就是说项目的路径位置配置错误…

【论文速递】CVPR2021 - 基于自引导和交叉引导的小样本分割算法

【论文速递】CVPR2021 - 基于自引导和交叉引导的小样本分割算法 【论文原文】:Self-Guided and Cross-Guided Learning for Few-Shot Segmentation 【作者信息】:Bingfeng Zhang, Jimin Xiao , Terry Qin 获取地址:https://openaccess.the…

来香港饮茶吹水先,免费报名Zabbix Meetup香港站!

Zabbix Meetup 来到香港啦! 春暖花开,Zabbix计划5月来到香港,和你一起饮茶吹水! 时间:5月某日,周几方便? 预计14:00-17:00 形式:线下交流会,免费,线下&…