自然语言处理(NLP)是什么?

news2024/10/7 14:33:49

NLP(自然语言处理) 和 Phoebe Liu 的简介

您有没有和聊天机器人互动过?或者您是否向虚拟助手,例如 Siri、Alexa 或您车上的车载娱乐系统发出过某些请求?您使用过在线翻译吗?我们大多数人都曾与这些人工智能 (AI) 互动过,我们也从未停止过思考如何便捷地表达我们的需求并获得适当的回应。如果我和Siri说:“hey Siri,今天我失恋了,能放首让我快乐的歌吗?”,下一秒,你的手机开始播放:昨天已是过去明天更多回忆,今天你要嫁给我。你的世界会在那一刻突然吐粉色泡泡吗?但是,如果你听到:分手快乐,祝你快乐.. 你的内心是不是有一万头草泥马飞奔而过,然后立马关机? 但是,只要停下来想一想人类语言的复杂性,机器能够和人类交流难道不是一个奇迹吗? 这一切要归功于自然语言处理。那究竟什么是自然语言处理 (NLP)?自然语言处理是教会计算机如何以人类的方式理解问题并让其给出适当回应的技术。借助 NLP,机器可以学习阅读、解密和解释人类的书面和口头语言,并创建以类似人类的方式描述、概括或解释输入(结构化数据)的叙述。NLP 是您经常与之交互的诸多 AI 解决方案的驱动力,并促成了人类与机器之间的理解。 如今,由于数据访问的巨大进步和计算机技术的提高,NLP 变得越来越受欢迎。  

NLP 技术

NLP 将语言分解为较短的语段,以便理解语段之间的关系以及各语段怎样结合起来产生意义。语言成分有两类:句法(单词在句子中按照语法意义进行排列)和语义(文本所传达的含义)。每一类中都有核心的NLP 技术:

句法分析

以下是机器用于分析句法的一些标准方法:

  • 分割:将一句话分解为较小的语段。
  • 词形还原:将一个词缩小至词基,并将具有相似词基的词组合在一起。
  • 词性标注:指出每个词的词性。
  • 提取词干:删除词的前缀和后缀以获得词根。

请注意,这里只选取了诸多语法分析方法中的一部分。

语义分析

以下是机器用于分析语义的两种流行方法:

  • 命名实体识别:确定预设组(例如人物和地点)并将其分类
  • 词义消歧:根据语境确定词义。

机器可以结合使用上述技术来获取给定文本中的句法和语义。  

自然语言处理能做什么?

什么是自然语言处理

 NLP 的应用场景有很多。它使机器能够执行原本由人类执行的重复性任务,从而帮助扩大与语言相关的任务的规模。许多行业都在使用 NLP,其中较为常见的包括:

  • 社交媒体分析:NLP 可以跟踪与品牌、产品或特定主题有关的情绪,并确定客户如何做出选择。它还可以通过检测政治偏见来过滤虚假新闻。
  • (TTS)文本转语音应用程序: 文本转语音应用程序通过更多方式提供信息以提高包容性,并为呼叫中心、视频游戏和语言教育领域提供更丰富的交互体验。
  • 个人助手和聊天机器人:NLP 使 AI 能够与人们就日常问题和事务进行交流,为人类腾出更多时间来进行更高层次的战略性工作。
  • 搜索结果查询:NLP 在电子商务领域特别有用,它可以帮助确定关键搜索词,从而获得更相关的搜索结果。
  • 语言翻译:NLP 广泛应用于各种语言和方言的翻译。
  • 信息提取:例如,用于医疗保健行业进行患者病历处理时,通过 NLP 进行数据提取对于快速提取关键信息至关重要。

以上只是NLP的一些常见应用场景,还有更多场景我们就不一一道来了。这充分说明了自然语言处理方面已经取得了惊人的进步。NLP 的变革力量将继续为我们与技术的交互增添光彩。随着人机通信差距的进一步缩小,我们必将看到这一领域的更多突破。  

为什么NLP难以实施?

NLP 具有挑战性。为什么自然语言处理难以实施?计算机的基础语言是数百万个 1 和 0 的集合,即“是”和“否”的二进制组合。计算机不会像人类那样在语境中思考,它们只会从逻辑上进行思考。当您对支持 AI 的计算机说话时,这台机器必须以某种方式理解和解释您所说的内容,计算出一个适当的响应,并将该响应转换为人类(或自然)语言,而这一切仅在几毫秒之内就能完成。很难想象实现这一壮举所需的处理能力水平,而计算机一直在这样做。 同样,自然语言的复杂性也不应该被低估。人类以无数种方式表达自己。全世界有数百种语言和方言,而且每种语言,无论是书面的还是口头的,都有自己的语法规则和俚语,并且各不相同。每个人的书写和说话方式也大相径庭。例如,有些人可能讲话口齿不清,或者在书写中使用缩写词。为了使计算机理解所有这些差异,它必须事先遇到过这些差异。它必须接受类似数据的培训。另一个挑战是,训练数据库与预期的应用程序应属于同一个领域。例如,在医疗环境中收集的对话不同于客户所处领域内会发生的对话,这种情况使得数据收集更具挑战性,因为从正确的领域收集数据很困难,但这又是必需的。 这些因素都导致了 NLP 实施中的困难。您必须访问大量的自然语言数据,以便计算机可以进行广泛的交互。为这些交互提供服务并弥合二进制语言与自然语言之间的差距,计算能力至关重要。所以 NLP 直到最近才成为了机器学习中的重要组成部分。  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/949494.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

校园用电安全管理系统可以识别违规电器吗

校园用电安全管理系统是处理恶意用电问题有效手段之一,系统具有实时监测、异常预警、监测设备运行状态、远程控制用电等功能,可以从根本上管理学校用电量,制定合理的用电计划,限制用电成本,避免各种恶意用电行为&#…

windows环境搭建ELK

目录 资源下载(8.9.1) ES安装、注册、使用 Kibana安装、注册、使用 Logstash安装、注册、使用 Filebeat安装、使用(如果只有一个数据流,则不需要使用filebeat,直接上logstash即可) 资源下载&#xff0…

关于商品活动的H5页面技术总结

背景 在单个html文件里面使用vue3、jquery等其他第三方js库,实现规定的页面效果,其中主要功能是从商品json数据中读取数据,然后可以通过搜索框、下拉框、左侧菜单来筛选商户信息。 页面布局 技术要点: 1、通过路由来进行页面布…

Django实现音乐网站 ⒁

使用Python Django框架制作一个音乐网站, 本篇主要是歌手页-全部歌手页功能开发。 目录 分出首页样式内容 创建首页样式文件 首页引入样式文件 全部歌手列表 创建路由 显示视图 引入分页实现库 视图方法 创建歌手首页 增加歌手跳转 导航条改活 首页增加…

移动端通讯录相关代码

vue3更新版本 附件地址 代码在附件里噜 太多了不好贴

EMC 性能优异的ISO7761QDBQQ1、ISO7762QDWQ1、ISO7741QDWWQ1、ISO7710QDRQ1汽车类数字隔离器

一、EMC 性能优异的 ISO776x-Q1 高速、增强型六通道数字隔离器 ISO776x-Q1 器件是高性能六通道数字隔离器,可提供符合 UL 1577 的 5000VRMS(DW 封装)和 3000VRMS(DBQ 封装)隔离额定值。该系列器件还通过了VDE、CSA、T…

2023_Spark_实验二:IDEA安装及配置

一、下载安装包 链接:百度网盘 请输入提取码 所在文件夹:大数据必备工具--》开发工具(前端后端)--》后端 下载文件名称:ideaIU-2019.2.3.exe (喜欢新版本也可安装新版本,新旧版本会存在部分差异) IDEA …

极智AI | 地平线天工开物工具链部署流程详解

欢迎关注我的公众号 [极智视界],获取我的更多经验分享 大家好,我是极智视界,本文来介绍一下 地平线天工开物工具链部署流程详解。 邀您加入我的知识星球「极智视界」,星球内有超多好玩的项目实战源码下载,链接:https://t.zsxq.com/0aiNxERDq 地平线天工开物工具链从完备…

【AI】数学基础——线代(向量部分)

参考: kenjihiranabe——The-Art-of-Linear-Algebra-zh-CN 详细计算方法与理论:见 矩阵论 线性代数的本质在于将具体事物抽象为数学对象,并描述其静态和动态特性 最基本的概念是 set 集合的定义是由某些具有某些共性的对象汇总成的集体。 将这…

go语言 go mod生成

1. go hello world 创建文件夹gotest,在其中创建test1.go文件,并写入 package mainimport ("fmt" )func main() {fmt.Println("hello world") } 运行命令 go run test1.go 可以看到输出hello world 2. cli 命令行的使用 代码如下…

Git 速查表:中级用户必备的 12 个 Git 命令

本文译自:Git Cheat Sheet: 12 Essential Git Commands For Intermediate Users,原文链接:https://initialcommit.com/blog/git-cheat-sheet-intermediate 本系列共有三篇文章,本文是第二篇: Git Cheat Sheet: 12 Ess…

了解 HarmonyOS

引言 在开始 HarmonyOS 开发之前,了解其背景、特点和架构是非常重要的。本章将为你提供一个全面的 HarmonyOS 概览。 目录 什么是 HarmonyOS HarmonyOS 的发展历程 HarmonyOS 的特点 HarmonyOS 的架构 HarmonyOS 与其他操作系统的比较 1. 什么是 HarmonyOS …

如何在WSL上导入任何Linux发行版

文章目录 一、准备1. 开启WSL相关功能2. 升级WSL3. 设置默认的wsl版本 二、通过 Microsoft Store 安装 Linux1. 查看 Microsoft Store 有哪些可安装的 Linux 发行版2. 安装 Linux 发行版3. 查看已安装的 Linux 发行版4. 启动Linux发行版 三、通过Linux发行商提供的tar文件安装1…

[PyTorch][chapter 53][Auto Encoder 实战]

前言: 结合手写数字识别的例子,实现以下AutoEncoder ae.py: 实现autoEncoder 网络 main.py: 加载手写数字数据集,以及训练,验证,测试网络。 左图:原图像 右图:重构图像 ----main----- 每轮训…

DHCP 服务器部署

| DHCP - - > Dynamic Host Configuration Protocol 动态主机配置协议 背景 任何一个需要上网的设备,都必须得有IP地址,子网掩码,网关,等等网络参数。比如:手机,电脑,智能手表&#xff0c…

【SpringBoot学习笔记】02.静态资源与首页订制

静态资源 Spring Boot 通过 MVC 的自动配置类 WebMvcAutoConfiguration 为这些 WebJars 前端资源提供了默认映射规则,部分源码如下。 jar包: JAR 文件就是 Java Archive File,顾名思意,它的应用是与 Java 息息相关的,…

IDEA 报 Cannot resolve symbol ‘HttpServletResponse‘ 解决

springboot2版本换成springboot3之后,代码这里突然报红了, 首先要淡定,把原先Import的引入删掉,重新引入试试呢,是不是很简单哈哈。 原来,springboot3的路径是: import jakarta.servlet.http…

Docker之私有仓库 RegistryHarbor

目录 一、Docker私有仓库(Registry) 1.1 Registry的介绍 二、搭建本地私有仓库 2.1首先下载 registry 镜像 2.2在 daemon.json 文件中添加私有镜像仓库地址 2.3运行 registry 容器 2.4Docker容器的重启策略 2.5为镜像打标签 2.6上传到私有仓库 2…

【车载雷达信号处理】利用sinc函数实现扣点

针对信号处理流程中多次FFT输出的频谱结果,在特殊的场景下,可能存在针对某一特定频点的固定"虚警",所以针对某一个特定频点进行“扣点”的操作是常有的信号处理流程需求。不仅如此,针对最大能量值的扣点也能在不适合使用…