Reconstructing Capsule Networks for Zero-shot Intent Classification

news2025/1/22 16:11:07

摘要

  • intent classification 意图分类。
  • dialogue systems 对话系统
  • 已经存在的系统并没有能力去处理快速增长的意图。
  • zero-shot intent classifcation: 零样本意图分类。
    Nevertheless 不过。
    incipient stage 初期阶段

今年来提出的IntentCapsNet

  • two unaddressed limitations:两个未解决的限制。
  • 在提取语义胶囊的时候,并不能够处理多义性。
  • 在广义零样本意图分类序列中,几乎不能够识别不可见意图的语句
  • 为了克服这个限制,我们提出了重新构建零样本意图分类的胶囊网络

方法

  • 引入:
  • a dimensional attention mechanism to fight against polysemy
  • we reconstruct the transformation matrices for unseen intents by utilizing abundant latent information of the labeled utterances.
  • 实验结果: two task-oriented dialogue datasets

介绍

  • task-oriented spoken dialogue systems :任务导向型的语言对话系统。
  • 为了提升商业效率和用户满意度,准确在用户语句之后识别用户意图。
  • user queries are sometimes short and expressed diversely
    (用户查询更短而且表达更加多元化)
  • 传统的用户意图分类方法在大量标签数据集上训练监督学习模型。在识别越来越增长的不可见意图并没有效率
  • external resources:外部资源

label ontologies

manually defined attributes

(手动定义属性)

方法1

  • utilize neural networks to project intent labels and data samples to the same semantic space. and then measure their similarity.

  • 学习一个好的映射函数是非常困难的。

  • IntentCapsNet 可以使用胶囊网络去提取高维度语义特征。 then transfers the prediction vectors for seen intents to unseen intents

  • 在这里插入图片描述

训练过程

    • labeled utterances are first encoded by Bi-LSTM
  • a set of semantic capsules are extracted via the dimensional attention module
  • these semantic capsules are fed to a capsule network to train a model for predicting the seen intents

测试过程

  • to predict the unseen intents, a metric learning method is trained on labeled utterances and intent label embeddings to learn the similarities between the unseen and seen intents

  • the learned similarities and the transformation matrices for the seen intents trained by capsule networks are used to construct the transformation matrices for the unseen intents
    在这里插入图片描述

  • ReCapsNet-ZS 有两个成分组成:

    • 其引进 a dimensional attention module to alleviate the polysemy problem. (这能为胶囊网络帮助提取语义特征)

    • Second, it computes the similarities between unseen and seen intents by utilizing the rich latent information of labeled utterances

    • *** constructs the transformation matrices** for unseen intents with the computed similarities.

    • the trained transformation matrices for seen intents.

    相关工作

    Zero-shot Intent Classification

    • 零样本分类目的是使用从可见类别中学习到的知识
    • 得到外部资源是困难的。

    Capsule Networks

    • 胶囊网络的提出是为了解决卷积神经网络的缺陷。
    • the dynamic routing algorithm 动态路由算法。和零样文本分类的元学习框架。

    Problem Formulation

    • the set of all intent labels:
      Y = Y s ⋃ Y u Y = Y^s \bigcup Y^u Y=YsYu
      Y s = { y 1 s , y 2 s , ⋯   , y k s } Y^s = \{y^s_1,y^s_2,\cdots,y^s_k\} Ys={y1s,y2s,,yks}
      Y u = { y 1 u , y 2 u , ⋯   , y L u } Y^u = \{y^u_1,y^u_2,\cdots,y^u_{L}\} Yu={y1u,y2u,,yLu}
      是可见类别和不可见类别各自的用户标签。
      Y s ⋂ Y u = ∅ Y^s \bigcap Y^u = \emptyset YsYu=
      K 和 L K和L KL是可见类别和不可见类别用户标签的各自数量。
    • 可见类别和不可见类别用户标签的嵌入。embedding.
      E s = { e 1 s , e 2 s , ⋯   , e k s } E^s = \{e^s_1,e^s_2,\cdots,e^s_k\} Es={e1s,e2s,,eks}
      E u = { e 1 u , e 2 u , ⋯   , e L u } E^u = \{e^u_1,e^u_2,\cdots,e^u_L\} Eu={e1u,e2u,,eLu}
      每个嵌入都是 a d − d i m e n s i o n a l v e c t o r a d-dimensional vector addimensionalvector
  • 可见类别和不可见类别用户标签的联合嵌入可以使用。

    • 可见类别和不可见类别的样本语句集被标注为:
      X s = { x 1 s , x 2 s , ⋯   , x n s s } X^s = \{x^s_1,x^s_2,\cdots,x^s_{n_s}\} Xs={x1s,x2s,,xnss}
      X u = { x 1 u , x 2 u , ⋯   , x n u u } X^u = \{x^u_1,x^u_2,\cdots,x^u_{n_u}\} Xu={x1u,x2u,,xnuu}
    • n s n_s ns is the number of instances of the seen labels
    • n u n_u nu is the number of instances of the unseen labels

Zero-shot Intent Classification

在这里插入图片描述

Generalized Zero-shot Intent Classification

Limitations of IntentCapsNet

  • a multi-dimensional embedding::多维度嵌入。 表示单词。
  • different dimensions of a word embedding may tend to represent different semantic meanings.
  • 在这里插入图片描述
  • ∣ ∣ ⋅ ∣ ∣ || \cdot|| is the L2-norm of a vector
  • R R R is the number of semantic capsules
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

提出的方法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

动态路由算法

在这里插入图片描述

总结

先大致了解一波。然后慢慢的从胶囊网络开始研究,将代码啥的全部都将其搞透彻,将其研究彻底,全部研究彻底都行啦的样子。
会将零样本常用的额技术罗列起来,然后会自己堆砌,形成自己的网络结构。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/89977.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于java+springboot+mybatis+vue+mysql的智慧外贸平台

项目介绍 智慧外贸平台能够通过互联网得到广泛的、全面的宣传,让尽可能多的用户了解和熟知智慧外贸平台的便捷高效,不仅为群众提供了服务,而且也推广了自己,让更多的群众了解自己。对于智慧外贸而言,若拥有自己的系统…

播放量超1500w,谁的恰饭两次都在B站成顶流?

- 导语 女性消费一直以来都是消费市场的主力,“她经济”市场应运而生。有关数据显示,我国拥有近4亿消费者为女性,在如此庞大购买力的驱动下,截至目前统计我国共有492.9万家“她经济”相关企业,其中有3/4的是近5年内成…

【Spring】——16、使用@Autowired、@Qualifier、@Primary这三大注解自动装配组件?

📫作者简介:zhz小白 公众号:小白的Java进阶之路 专业技能: 1、Java基础,并精通多线程的开发,熟悉JVM原理 2、熟悉Java基础,并精通多线程的开发,熟悉JVM原理,具备⼀定的线…

【Redis】Redis事务工作原理解析与分布式事务实战(Redis专栏启动)

📫作者简介:小明java问道之路,专注于研究 Java/ Liunx内核/ C及汇编/计算机底层原理/源码,就职于大型金融公司后端高级工程师,擅长交易领域的高安全/可用/并发/性能的架构设计与演进、系统优化与稳定性建设。 &#x1…

8.Django大型电商项目之商品添加分页

1.添加分页 添加分页在Django中使用自带分页器paginator 1.1 配置setting settings中配置分页数量 # 每页显示记录条数 PER_PAGE_NUMBER 81.2 配置views 完成分页栏使用paginator创建对象,返回选中条数 from django.shortcuts import render from goodsapp.mo…

桶排序算法

题目 代码1&#xff1a; #include <stdio.h> int main() {int sz0;scanf("%d",&sz);int arr[sz];//输入int i0;for (i0;i<sz;i){scanf("%d",&arr[i]);}//删除多余相同元素int j0;int k0;for (i0;i<sz;i){if (i0){arr[j]arr[i];}else{…

MyBatis批量保存(Oracle)MyBatis批量插入时,组装SQL过长会有问题,一定要根据批量插入数据量进行切割,再批次提交保存!!!

MyBatis批量保存&#xff08;Oracle&#xff09; oracle 批量插入与mysql 的批量插入的方式不同 insert into tablename()values(),(),(); ---这个是mysql 的批量插入形式 insert all into tablename() values() into tablename() values() -------这个是Oracle批量插入形式 你…

大数据测试 - 数仓测试

前言 对于数据仓库的测试来说底层的系统会有很多有自建的集群使用 spark 或者 flink 测试&#xff0c;也有很多直接使用云厂商的产品比如 datworks 等等&#xff0c;再这里我想分享下抛开环境&#xff0c;只对数据仓库测试的一些小心得。 数仓分层设计 标准数仓分为 ODS,DWD…

java计算机毕业设计基于安卓Android的微整形美容app

项目介绍 首先,论文一开始便是清楚的论述了系统的研究内容。其次,剖析系统需求分析,弄明白“做什么”,分析包括业务分析和业务流程的分析以及用例分析,更进一步明确系统的需求。然后在明白了系统的需求基础上需要进一步地设计系统,主要包罗软件架构模式、整体功能模块、数据库设…

前缀和问题

前缀和 一维二维 ac795. 前缀和【一维】 输入一个长度为 nn 的整数序列。 接下来再输入 mm 个询问&#xff0c;每个询问输入一对 l,rl,r。 对于每个询问&#xff0c;输出原序列中从第 ll 个数到第 rr 个数的和。 输入格式 第一行包含两个整数 nn 和 mm。 第二行包含 nn…

基于android的资源文件管理器

软 件 学 院 毕业实训报告 课题名称&#xff1a; android资源管理器 专 业&#xff1a; 软件设计&#xff08;游戏开发方向&#xff09; 班 级&#xff1a; 学 号&#xff1a; 学生姓名&#xff1a; 指导教师&#xff1a; 年 月 日 摘 要 相信大家对Android的发展历史…

Nacos-配置中心,特性,启动,集成mysql,快速入门

Nacos - 配置管理 目录Nacos - 配置管理1. 什么是配置中心1.1 什么是配置1.2 什么是配置中心2 Nacos****简介2.1 主流配置中心对比2.2 Nacos****简介2.3 Nacos****特性3 Nacos 快速入3.1 安装 Nacos Server3.1.1 预备环境准备3.1.2 下载源码或者安装包3.1.3 启动服务器3.1.4 OP…

HTML班级网页设计 基于HTML+CSS+JS制作我们的班级网页(web前端学生网页设计作品)

&#x1f389;精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 &#x1f482; 作者主页: 【主页——&#x1f680;获取更多优质源码】 &#x1f393; web前端期末大作业…

计算机毕业设计---java+springboot宠物商城系统

一、项目运行 环境配置&#xff1a; Jdk1.8 Tomcat8.5 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; Springboot Maven mybatis Vue 等等组成&#xff0c;B/…

光栅尺差分计数/频率5MHz/磁栅尺编码器差分脉冲计数采集模块

产品特点&#xff1a; ● 光栅尺磁栅尺解码转换成标准Modbus RTU协议 ● 光栅尺5V差分信号直接输入&#xff0c;4倍频计数 ● 模块可以输出5V的电源给光栅尺供电 ● 高速光栅尺磁栅尺计数&#xff0c;频率可达5MHz ● 支持4个光栅尺同时计数&#xff0c;可识别正反转 ● …

Oracle函数

目录 一、数值函数 1.ABS(value)&#xff1a;绝对值 2.CEIL(value)&#xff1a;向上取整 3.FLOOR(value)&#xff1a;向下取整 4.ROUND(value)&#xff1a;四舍五入 5.MOD(value(被除数),divisor(除数))&#xff1a;求模 6.SIGN(value)&#xff1a;判断正(0)负(-1)和零(…

隐私计算学习笔记

目录 安全保护技术和应用总结 基础隐私计算技术在联邦学习中的应用 参考书籍 图片来源&#xff1a; https://www.basebit.ai/en/Statics/Images/en/dbys.png 隐私计算技术的产生是互联网、大数据以及区块链等技术发展到一定阶段的必然成果&#xff0c;以下为大家分享读书笔…

01-32-spring5-bean-ioc-aop

01-spring5&#xff1a; spring 1、spring概念 1、什么是spring及优点 Spring框架使Java EE应用程序的开发更加简捷&#xff0c;通过使用POJO为基础的编程模型促进良好的编程风格。 轻量级&#xff1a;Spring在大小和透明性方面绝对属于轻量级的&#xff0c;基础版本的Spr…

【推荐系统学习笔记】-- 2、特征工程

1、可利用的特征 1.1 用户行为特征 显性反馈行为&#xff1a;点赞、评分、评价等隐形反馈行为&#xff1a;点击、浏览、播放、加入购物车等 1.2 用户关系数据 显性&#xff1a;关注、好友关系隐形&#xff1a;点赞、共同观影使用Graph Embedding生成用户和物品的Embedding …