对话到行动:通过行动级生成构建面向任务的对话系统

news2024/11/24 13:26:03

目录

对话到行动:通过行动级生成构建面向任务的对话系统

1介绍

2框架描述

2.1概述

2.2第一步:对话动作构造

2.3步骤2:响应标准化响应标准化

2.4步骤3:动作序列预测

2.5步骤4:生成响应

3实验

3.1实验设置

3.2主要结果

3.3深度分析

4结论

5主持人简介

6公司简介


对话到行动:通过行动级生成构建面向任务的对话系统

Dialog-to-Actions: Building Task-Oriented Dialogue System via Action-Level Generation

摘要:基于端到端生成的方法已经被研究并应用于面向任务的对话系统中。然而,在工业场景中,现有的方法面临着可靠性(如域响应不一致、重复问题等)和效率(如计算时间长等)的瓶颈。在本文中,我们提出了一个以任务为导向的对话系统。具体来说,我们首先从大规模对话中构建对话动作,并将每个自然语言(NL)响应表示为对话动作的序列。此外,我们训练了一个sequence - tosequence模型,该模型将对话历史作为输入并输出一系列对话动作。生成的对话动作被转换成口头反应。实验结果表明,该方法具有较好的性能,且具有可靠和高效的优点。

关键词:任务导向对话系统,行动级生成,对话-行动

1介绍

最近,直接输出适当的自然语言响应或API调用的端到端生成方法在面向任务的聊天机器人中得到了深入研究[2,5,9,16,22],并被证明对现实世界的业务有价值,特别是售后客户服务[1,7,8,13,14,19,21,24,25]。基于生成的方法基于大规模预训练的语言模型[10,11],具有架构更简单和拟人化交互的优势。尽管取得了重大进展,但我们发现这些令牌级生成方法在实际场景中存在以下两个限制。

1. 令牌级生成方法的可靠性有限,这对面向任务的工业对话系统至关重要。由于预训练语言模型的特点,模型可能会产生从预训练语料库中学习到的响应。在某些情况下,这样的响应是无意义的,并且在语义上与当前业务领域不一致,从而中断了在线交互。更糟糕的是,模型偶尔会在多个回合中产生重复的反应(例如,反复询问用户相同的信息)。以上问题也被其他研究者[4,12]和实践者广泛观察到。

2.研究者[4,12]与实践者。令牌级生成方法可能无法满足工业系统的效率要求,特别是解码步骤较大时。令牌级生成模型的长计算时间导致在线对话系统的响应延迟不可接受,特别是当模型生成的句子长度超过阈值时(例如,对于30个单词的句子,T5为1,544 ms,如图3所示)。由于延迟问题,在高峰期可能会有大量的业务请求被挂起或阻塞。此外,上述系统所需的计算资源(例如gpu)对于小型公司来说可能负担不起。

针对以上两个问题,本文提出了一种基于行动级生成方法的面向任务的对话系统。[19]中,我们用对话动作(Dialogue Actions)来表示响应,即一类具有唯一和相同语义的响应,可以通过聚类自动获得。[19]直接将整个响应视为特定的对话动作,我们将一个响应拆分为多个响应段[6]和每个段都可以映射到一个对话动作。通过这种方式,每个响应都表示为一系列对话动作。给定对话上下文,使用带有动作级循环解码器的Seq2Seq模型来生成对话动作序列。此外,基于频率的采样方法用于根据生成的对话动作序列组成最终响应。由于我们方法的核心组件是将对话上下文作为输入和输出操作的生成模型,因此我们的方法被命名为Dialog-T - o- Actions(缩写为DTA)。与现有的基于令牌级生成的系统相比,我们的DTA具有以下优点:1)可靠性,因为生成的自然语言响应来自预定义的对话动作;2)效率,因为解码空间(即对话动作)和解码步骤要小得多。

2框架描述

2.1概述

我们遵循之前端到端面向任务的对话系统[2,9]中使用的工作流,其中系统将对话历史作为输入,并生成一个文本字符串,该文本字符串可以作为对用户或API调用的口头人员响应(例如,信息查询,操作执行等)。当调用API时,从API返回的信息将被合并到系统的下一个响应中。在图1 (b)中可以找到遵循这种系统交互生命周期的对话示例。 

我们工作的关键思想是产生对话动作,然后组成一个口头回应。为此,我们首先从大规模对话中构建对话动作(步骤1),并将每个响应表示为对话动作序列(步骤2),如图1 (a)所示。使用带有动作级循环解码器的Seq2Seq模型来生成对话动作(步骤3),并使用生成的动作进一步组成口头响应(步骤4)。我们以电动自行车售后客户服务为例租赁业务,用户和员工通过短信在线交流。技术细节介绍如下。

2.2第一步:对话动作构造

对话动作是指一组具有相同语义并代表共同交际意图的话语或话语片段,如提出请求或查询信息。然而,过于简化的设置,即将整个话语抽象为一个动作,导致表达能力和可扩展性相对有限。为了使应答更有针对性和灵活性,我们基于(员工的)话语段而不是话语来构建对话动作。具体来说,每个话语被基于规则的方法[6]分成多个片段。具体来说,使用ConSERT[20]为每个话语段生成表示,然后使用K-means对片段进行聚类。我们选择簇的数量?根据经验来平衡集群的纯度和数量,并将每个片段集群视为对话动作(例如,?1和?图1 (a)中的2)。

2.3步骤2:响应标准化响应标准化

旨在通过将每个响应映射到一系列对话动作来标准化响应(来自大规模对话)。跟随Yu等人。在[23]中,我们利用了一种基于检索的方法,该方法检索与给定输入话语段最相似的聚类片段,并根据相应的聚类对输入进行标记。如图2所示,给定一个输入段?我们用BM25来召回top ?段{?1,…, ? ? }从所有聚集的段。进一步,我们开发了基于bert的文本相似度计算模型。重新排序?分段和选择。

2.4步骤3:动作序列预测

2.5步骤4:生成响应

3实验

3.1实验设置

3.2主要结果

3.3深度分析

4结论

在本文中,我们提出了一个通过行动级生成的面向任务的对话系统。提出了一种有效的框架,以最小的人工工作量从大规模对话中构建生成模型。实验分析表明,该系统能够解决现有端到端生成方法所遇到的可靠性和效率问题。在未来,我们有兴趣探索将DTA中的离散模块统一到端到端架构中的集成系统。

5主持人简介

主持人:华运成。他是美团的算法工程师,专注于研究和构建对话系统。

6公司简介

美团是中国领先的购物平台,提供本地消费品和零售服务,包括娱乐、餐饮、外卖、旅游和其他服务。

Xi Xiangyu (习翔宇) - Homepage

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/456990.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

V-Ray渲染教程:又快又好的V-Ray渲染参数!

Chaos V-Ray 是适用于大部分主流3D设计软件和CAD程序的3D渲染插件,它可以与 3ds Max、Cinema 4D、Houdini、Maya、Nuke、Revit、Rhino、SketchUp、Unreal 无缝协作。借助 V-Ray渲染器强大的功能,艺术家和设计师可以产生出非常逼真的渲染效果。 那么&…

服务提供者 Eureka + 服务消费者(Rest + Ribbon)实战

1、Ribbon背景介绍 Ribbon是Netflix发布的开源项目,主要功能是提供客户端的软件负载均衡算法,将Netflix的中间层服务连接在一起。Ribbon客户端组件提供一系列完善的配置项如连接超时,重试等。简单来说,就是在配置文件中列出Load B…

Word中截取部分内容并保存为jpg图片的方法

private void button1_Click(object sender, EventArgs e) { var appWord new Microsoft.Office.Interop.Word.Application(); var doc new Microsoft.Office.Interop.Word.Document(); object oMissing System.Reflection.Missing.Value;//这个是什么东西,我始终…

等级保护5个级别详细说明-行云管家

目前我国正在严格执行等保政策,但不少企业对于等级保护的5个级别不是很清楚,这里我们行云管家小编就来给大家详细说明一下。 等级保护5个级别详细说明-行云管家 根据《信息安全技术网络安全等级保护基本要求》,安全保护等级分为5个级别&…

Linux 中 top信息详解,CPU负载详解

一、top信息的三个参数到底是什么意思? 6.68、7.67、8.08 分别代表前一分钟,五分钟,十五分钟的平均CPU负载,最重要的指标是最后一个数字,即前15分钟的平均CPU负载,这个数字越小越好。所谓CPU负载指的是一段…

蔡春久:主数据标准化如何建设

亿信华辰「2023数字赋能季」主数据管理专场第一期成功举办。我们邀请到了中国数据标准化及治理专家蔡春久为大家带来主数据管理从理论到工具层面的分享,全程干货,深度解读,以下是演讲全文。 蔡春久:中国大数据技术标准推进委员会…

认识AI三大类工具,让你效率加倍

在当今的互联网时代,各种新奇有趣的AI工具充斥着我们的生活。其中,AI写作、AI绘画、AI剪辑等工具更是给运营人带来了前所未有的“速成”体验。今天就来介绍一些好玩有趣的AI工具,让你在各个领域都能快速、轻松地展现自己的创意和才华。 第一…

Docker资源控制

一、CPU 资源控制 cgroups,是一个非常强大的linux内核工具,他不仅可以限制被 namespace 隔离起来的资源, 还可以为资源设置权重、计算使用量、操控进程启停等等。 所以 cgroups(Control groups)实现了对资源的配额和度…

java版本企业电子招投标采购系统源码之登录页面

​ 信息数智化招采系统 服务框架:Spring Cloud、Spring Boot2、Mybatis、OAuth2、Security 前端架构:VUE、Uniapp、Layui、Bootstrap、H5、CSS3 涉及技术:Eureka、Config、Zuul、OAuth2、Security、OSS、Turbine、Zipkin、Feign、Monitor、…

无需编程技能:如何快速搭建教育平台网站

随着在线教育的不断发展,越来越多的人开始想要创建自己的教育平台网站。然而,很多人认为创建一个网站需要具备深厚的编程技能和经验,因此望而却步。实际上,现在有很多平台和工具可以帮助人们快速、简单地搭建一个教育平台网站&…

力扣题库刷题笔记496-下一个更大元素

1、题目如下: 2、个人Python代码实现 代码如下: class Solution: def nextGreaterElement(self, nums1: List[int], nums2: List[int]) -> List[int]: #空列表用于输出结果 ans [] for i in nums1: #如果nums2中不包含或者最后一位元素为当前遍历得…

使用Plist编辑器——简单入门指南

本指南将介绍如何使用Plist编辑器。您将学习如何打开、编辑和保存plist文件,并了解plist文件的基本结构和用途。跟随这个简单的入门指南,您将掌握如何使用Plist编辑器轻松管理您的plist文件。 plist文件是一种常见的配置文件格式,用于存储应…

Chat GPT在全球变暖中的潜在应用

01 摘要 气候变化是一个全球性的重大挑战,需要整合包括大气科学、海洋学和生态学在内的许多不同科学领域。解决这一问题的复杂性和规模需要利用先进的工具和技术来理解、建模和预测未来的气候状况。人工智能和自然语言处理技术,如Chat GPT,…

多数据源 使用 mybatis-plus-generator 3.5.1版本进行代码生成

文章目录 前言多数据源 使用 mybatis-plus-generator 3.5.1版本进行代码生成1. 说明2. 添加依赖2.1. mybatis-plus-generator 自动生成依赖2.2. 多数据源依赖2.3. 建立新项目的完全pom.xml 3. application.yml 多数据源配置 mybatis-plus-generator配置4. 创建一个MybatisPlus…

Cesium项目功能实现记录

目录 1 切换二维地图2 删除默认图层3 隐藏版权信息4 加载cesiumlab切片影像出现栅格阴影5 解决相机控制问题6 cesium中限制地图浏览范围7 鼠标移动显示经纬度8 禁用cesium选取实体操作8.1 禁用操作8.2 双击事件改写8.3 信息隐藏(index.html页面) 9 自定义…

聚合生态 深耕行业——2023用友生态峰会成功举办

近日,2023用友BIP技术大会生态峰会在北京隆重开幕。来自中国电信、毕马威、上海汉得信息、百度、滴滴、金山云、外企德科、上海诺捷、上海熵央等伙伴代表与全国各行业生态伙伴、企业客户等齐聚一堂,解读企业生态新变革,畅谈行业生态新合作&am…

如何使用阿里云短信服务实现登录页面,手机验证码登录?

1:个人如何使用阿里云短信服务? 2022如何使用个人阿里云短信服务?_linxiMY的博客-CSDN博客添加完成之后,等待审核!一般2个小时就会出来审核结果了,这里我因为注册申请时填写规则有误,足足审核了…

MyBatis的缓存、逆向工程、以及分页插件的使用

1、MyBatis的缓存 1.1、MyBatis的一级缓存 一级缓存是SqlSession级别的,通过同一个SqlSession查询的数据会被缓存,下次查询相同的数据,就会从缓存中直接获取,不会从数据库重新访问 使一级缓存失效的四种情况: 不同的…

Spring简介

二、Spring 1、Spring简介 1.1、Spring概述 官网地址:https://spring.io/ Spring 是最受欢迎的企业级 Java 应用程序开发框架,数以百万的来自世界各地的开发人员使用 Spring 框架来创建性能好、易于测试、可重用的代码。 Spring 框架是一个开源的 Jav…

人工大猩猩部队优化器:一种新的面向全局优化问题的自然启发元启发式算法(Matlab代码实现)

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述 元启发式在解决优化问题方面发挥着关键作用,其中大多数都受到自然界中自然生物集体智慧的启发。本文提出了一种新的…