什么是Natural Language Generation(NLG)?

news2024/9/27 17:23:20

文章目录

  • 1.NLG的定义
  • 2.NLP的步骤
  • 3.NLG生成文本方式有哪些?
    • 3.1.简单的数据合并
    • 3.2.模板化的NLG
    • 3.3.高级NLG
  • 4.NLG的应用有哪些?

1.NLG的定义

自然语言生成(Natural Language Generation, NLG)是NLP(自然语言处理)中的一项核心任务,主要目的是降低人类和机器之间的沟通鸿沟,将非语言格式的数据转换成人类可以理解的语言格式。例如:人类对话智能音响,“现在几点了”,则需要先利用NLU(自然语言理解)技术判断用户的意图,理解用户的需求是什么。然后再利用NLG(自然语言生成)技术回复:“现在是早晨8点整”。

在这里插入图片描述

2.NLP的步骤

通常自然语言生成(NLG)有2种方式:

  • text to text:文本到语言的生成
  • data to text :数据到语言的生成

NLG的六个步骤:

  1. 内容确定 – Content Determination
    首先,NLG系统需要确定哪些信息应该包含在正在建构的文本中,哪些又不包含。通常数据中包含的信息比最终传达的信息要多。

  2. 文本结构 – Text Structuring
    确定需要传达的信息后,NLG系统需要合理的组织文本的顺序。例如:在报道一场篮球比赛时,会优先选择表达“比赛时间、地点、球队”等信息,其次再表达“比赛的概况”,最后表达“比赛的结局”。

  3. 句子聚合 – Sentence Aggregation
    不是每一条信息都需要一个独立的句子来表达,将多个信息合并到一个句子里表达可能会更加流畅,也更易于阅读。

  4. 语法化 – Lexicalisation
    确定好每一句内容后,就需要将这些语言组织成自然语言。这一步hi在各种信息之间加一些连接词,使得内容看起来是一个完整的句子。

  5. 参考表达式生成 – Referring Expression Generation|REG
    此步骤与语法化十分相似,都是选择一些单词和短语来构成一个完整的句子。但其和语法化的本质区别就在于“REG”需要识别出内容的领域,然后使用该领域的词汇。

  6. 语言实现 – Linguistic Realisation
    最后一步,当所有相关的单词和短语已确定后,需要将它们组成一个结构完整的句子。

3.NLG生成文本方式有哪些?

3.1.简单的数据合并

简单化形式是指将数据转化为文本(通过类似excel的函数)。以Excel中的信息合并为例,从信息源(例如MS Excel中的表格)中检索出来相关信息,并进行简单的合并输出。

3.2.模板化的NLG

模板化的NLG使用模板驱动模式来显示输出。例如,体育运动比赛的分板,基于输入的自定义关键信息,根据预定的业务规则集(如if / else循环语句)生成语言。

3.3.高级NLG

此形式的自然语言生成就与人类一样,其理解意图会考虑到文本的上下文环境,并将结果呈现给用户一种可以轻松阅读和理解的表述中,一般用于深度学习的encoder-decoder结构来实现。

4.NLG的应用有哪些?

通常典型的应用主要有:自动写新闻(AI编辑新闻)聊天机器人(Siri或智能音箱)自动生成报告

目前,NLG技术可以用低成本快速生成文本内容。比如法律判决书的摘要,原本需要人类通读全文在进行摘要总结,现在可以借助NLG技术自动生成摘要,省时省力。又比如自动生成相似问句,用NLG技术去扩充标注数据实现新业务领域的快速冷启动,从而降低AI训练和运营本身的成本。更进一步,“看图说话”的能力也是NLG技术的一大亮点应用。针对目标图片,NLG技术可以生成相关的图片描述,在电商领域的商品描述生成以及盲人辅助场景具有实际意义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/688524.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Sikulix自动化工具的使用

1.Sikuli-x简介 Sikuli是识别和控制GUI组件进行UI自动化测试的技术,它是有MIT的研究人员开发进行设计的。Sikuli在墨西哥维乔印第安人(Huichol Indians)的语言里是上帝之眼的意思,Sikuli的工作模式与人眼一样,直接识别图像。 Sikuli-x是Sik…

1、Redis入门与安装配置

是什么? Remote Dictionary Server(远程字典服务) 是完全开源的,使用ANSIC语言编写遵守BSD协议,是一个高性能的Key-Value数据库。提供了丰富的数据结构,例如String、Hash、List、Set、SortedSet等等。数据是存在内存中的&#xf…

python爬虫-逆向实例小记-2

注意!!!!某数据网站逆向实例仅作为学习案例,禁止其他个人以及团体做谋利用途!!!! 案例分析 第一步:分析请求和响应内容。该网站任何一请求和内容都不可直接…

网站SEO优化的注意事项

SEO作为一种网络营销方式,高投入产出比是其优势所在。通过SEO优化为站点带来大量的主动搜索自然流量,对于企业主来说,是非常必要的。搜索引擎算法在不断发展,SEO技术也在不断发展。那么,如何能做好SEO呢?小…

投出去的简历无人问津,原因竟然在这……

近期收到了不少朋友的反馈说,失业半个月无人问津,放在前些年第二天开始面试有人找,或者是第二天入职了……,为啥明明不招人要挂着招人的岗位? 随着移动互联网的发展,Android市场的需求也在不断变化和升级。…

【springboot】—— 后端Springboot项目开发

后端Springboot项目开发 步骤1 先创建数据库,并在下面创建一个user表,插入数据,sql如下: CREATE TABLE user (id int(11) NOT NULL AUTO_INCREMENT COMMENT ID,email varchar(255) NOT NULL COMMENT 邮箱,password varchar(255)…

Turf.js:用于地理空间分析的 JavaScript 库

https://turfjs.org/ 处理和分析地理空间数据在许多应用程序和平台中发挥着至关重要的作用。如地图绘制、路径规划、基于位置的服务和地理空间分析。Turf.js 是一个专门为执行地理空间操作而开发的开源 JavaScript 库。在本文中,我将详细探讨 Turf.js ,…

Linux系统下列出库文件中的符号指令(nm)

文章目录 1 nm指令2 符号类型的含义3 简单示例 1 nm指令 nm是names的缩写, nm命令主要是用来列出某些文件中的符号(说白了就是一些函数和全局变量等)。 nm命令的输出包含三个部分: 1 符号值。默认显示十六进制,也可以…

SNMP 计算机网络管理 实验3(二)SNMP协议工作原理验证与分析

⬜⬜⬜ 🐰🟧🟨🟩🟦🟪(*^▽^*)欢迎光临 🟧🟨🟩🟦🟪🐰⬜⬜⬜ ✏️write in front✏️ 📝个人主页:陈丹宇jmu &am…

从零手写微前端qiankun框架【超详细万字长文】

项目创建 我们创建如图几个文件夹 main&#xff1a;主应用&#xff08;采用vue3作为技术栈&#xff09;react&#xff1a;子应用1vue2&#xff1a;子应用2vue3&#xff1a;子应用3service&#xff1a;服务端代码 vue2子应用&#xff1a; 我们在App.vue中写一点点东西 <t…

Java微服务金融项目智牛股-基础知识一(CAT链路监控)

CAT链路监控 背景&#xff1a;从单体架构到微服务架构的演变&#xff0c; 一个业务请求往往会流转多个服务&#xff0c; 大型互联网产品服务架构尤为复杂&#xff0c;腾讯的抢红包服务&#xff0c; 阿里的交易支付服务&#xff0c; 可能就流转成百上千个服务节点&#xff0c; 面…

HashMap夺命14问

1. HashMap的底层数据结构是什么&#xff1f; 在JDK1.7中和JDK1.8中有所区别&#xff1a; 在JDK1.7中&#xff0c;由”数组链表“组成&#xff0c;数组是HashMap的主体&#xff0c;链表则是主要为了解决哈希冲突而存在的。 在JDK1.8中&#xff0c;有“数组链表红黑树”组成。当…

【软考网络管理员】2023年软考网管初级常见知识考点(19)-防火墙与入侵检测系统IDS

涉及知识点 防火墙有哪些及其功能&#xff0c;防火墙的区域划分及工作模式&#xff0c;IDS是什么及其作用&#xff1f;入侵检测系统的分类及原理&#xff0c;软考网络管理员常考知识点&#xff0c;软考网络管理员网络安全&#xff0c;网络管理员考点汇总。 原创于&#xff1a;…

java.sql.Time 字段时区问题 Jackson 源码分析 意想不到的Time处理类

java.sql.Time 字段时区问题 系列文章目录 第一章 初步分析 第二章 Mybatis 源码分析 第三章 Jackson 源码分析 意想不到的Time处理类 文章目录 java.sql.Time 字段时区问题 系列文章目录前言Jackson 源码阅读1. 先找 JsonFormat.class 打断点一步步跟踪2. 跟踪进入实际处理类…

RTSP视频流相关的一些操作

播放rtsp camera 内容 端口554在网络通信中用于Real Time Streaming Protocol(RTSP)。 gst-launch-1.0 playbin urirtsp://admin:WANGfengtu1210.0.20.190:554/client0x gst-launch-1.0 playbin urirtsp://admin:WANGfengtu1210.0.20.61:554/client1xgst-launch-1.0 rtspsrc …

基于Arduino UNO的循迹小车

目录 1.analogWrite函数的使用 2.红外循迹模块介绍 3.循迹小车代码实现 4.实物示例 1.analogWrite函数的使用 用analogWrite来替换digitalWrite 说明 将一个模拟数值写进Arduino引脚。这个操作可以用来控制LED的亮度, 或者控制电机的转速. 在Arduino UNO控制器中&#…

关于二叉树的操作,详细操作与实现方法

树是数据结构中的重中之重&#xff0c;尤其以各类二叉树为学习的难点。在面试环节中&#xff0c;二叉树也是必考的模块。本文主要讲二叉树操作的相关知识&#xff0c;梳理面试常考的内容。一起来复习吧。 本篇针对面试中常见的二叉树操作作个总结&#xff1a; 前序遍历&#x…

Kubernetes(k8s)容器编排控制器使用

目录 1 Pod控制器1.1 Pod控制器是什么1.2 Pod和Pod控制器1.3 控制器的必要性1.4 常见的控制器1.4.1 ReplicaSet1.4.2 Deployment1.4.3 DaemonSet 2 ReplicaSet控制器2.1 ReplicaSet概述2.2 ReplicaSet功能2.2.1 精确反应期望值2.2.2 保证高可用2.2.3 弹性伸缩 2.3 创建ReplicaS…

专项练习12

目录 一、选择题 1、JavaScript中定义var a"40",var b7,则执行a%b会得到&#xff1f; 2、下面哪个选项中的对象与浏览列表有关&#xff08; &#xff09; 3、下面哪一个语句可以实现在jQuery中找到所有元素的同辈元素&#xff1f; 4、如何阻止IE和各大浏览器默认行为…

CVSS4.0将于2023年底正式发布

通用漏洞评分系统(CVSS)是一种流行的、标准化的方法&#xff0c;用于评估数字系统安全漏洞的严重程度。由事件反应和安全小组论坛(FIRST)开发&#xff0c;它为安全专业人员提供了评估和优先排序风险的一致方法。 目前的CVSS v3.0已经运行了十多年&#xff0c;但因其复杂性和灵…