[计算机毕业设计]知识图谱的检索式对话系统

news2024/10/6 20:44:55

前言

    📅大四是整个大学期间最忙碌的时光,一边要忙着准备考研,考公,考教资或者实习为毕业后面临的就业升学做准备,一边要为毕业设计耗费大量精力。近几年各个学校要求的毕设项目越来越难,有不少课题是研究生级别难度的,对本科同学来说是充满挑战。为帮助大家顺利通过和节省时间与精力投入到更重要的就业和考试中去,学长分享优质的选题经验和毕设项目与技术思路。

🚀对毕设有任何疑问都可以问学长哦!

本次分享的课题是

🎯知识图谱的检索式对话系统

课题背景与意义

近年来,随着自然语言处理(NLP)和深度学习等领域的深入研究和应用,构建一个人与机器可以自然对话的系统引来更多学术界和工业界的关注。

  • 从应用的角度来看对话系统可以分为两大类:

    (1)任务导向和(2)非任务导向。任务导向的对话系统,通过人机之间的多轮对话,来完成一个指定的任务。如客服系统,用户可以购买机票、预定餐馆、办理业务等。非任务导向的系统,通常是单轮对话,如闲聊、问答类。

  • 从技术的角度看,数据驱动的对话系统也可分为两大类:

    (1)基于检索模型和(2)基于生成式模型。基于检索的对话系统,需要预先构建好数据,通过检索模型来选择最合适的答案。而基于生成式模型的对话系统,则利用训练模型来生成序列回答。实际中,对话系统往往是结合检索模型和生成式模型二者的优点共同实现。

本文探讨一个非任务导向对话系统中的问题:无论是基于检索还是生成式模型,仅考虑当前对话上下文的情况下,经常会出现一些模糊、甚至是无意义的回答。直觉上,对话机器人显得很笨拙、不够智能。反观人与人之间的对话往往是围绕一个话题,而且聊天也不限于当前的对话内容,经常会基于人的知识进行丰富和扩展,让聊天更加自然地进行。因此一个直接的想法就是:能否通过引入外部的知识信息来丰富和提升人机对话的体验?

课题实现技术思路

基于语义网络的知识

知识的表示和推理是AI领域一个重要的方向,研究如何表示现实世界的知识以及如何运用知识来解决问题。一般地,知识可以通过如逻辑表达式、产生式规则(如IF-THEN)、语义网络(如概念图)等来表示。这里,我们采用基于语义网络表示的知识。

语义网络:基于图来构建,其中节点表示概念(实体对象)、而边表达概念节点之间的关系,节点之间的关系可以表示为一个三元组形式如:<concept1, relation, concept2>。

ConceptNet [3]:是一个完全免费的语义网络,设计之初主要是帮助机器理解人类词语的意义。

图1. “猴子”

图1.表示“猴子”可以做出如“吃香蕉”、“喝水”、“打劫路人”的动作,同时“猴子”也是一种“动物”等知识信息。

图2.“football”

图2.包含了“football”有多种语言的同义词如“soccer”,“football”是一类游戏、运动项目等信息。

SenticNet [4]:是一个描述概念之间的情感语义网络。

图3. SenticNet例子

如上图3.表示出cook是一种person,cook的位置一般是在restaurant,cake可以用于satisfy hunger,sweet可以产生joy等信息。

知识在检索式对话系统的应用

基于前面介绍的知识库,接下来主要是基于论文[2]来详细介绍如何利用知识来增强端到端的对话系统。

>>>> 任务定义

原论文主要是在整合常识性知识到基于检索的对话模型中,消息(上下文)x和回答y是从词表V中的词组成的序列。给定x和一组回答候选集

,模型的目标是选出最合适的回答,如下:

这里,f(x, y)是一个评估x和y兼容性的打分函数。通过<消息,回答,标签>三元组来训练。其中标签为二元值,区别<消息,回答>是否来自于真实数据还是随机组合。

>>>> 模型一:Dual-LSTM编码器

Dual-LSTM编码器将消息x和回答y经过相同LSTM网络的最后层隐状态作为固定大小的嵌入式表示

 和 ,之后利用如下打分函数:

这里,参数矩阵

通过训练来学习。

>>>> 知识检索

有了知识库,检索与对话消息相关的知识,可以通过如下步骤:

  • 构建词典:原有语义网络中的三元组<c1, r,c2>,c1和c2分别是概念,r表示c1和c2之间的关系。对于概念c构建词典,key为c,value表示元组信息。

  • 检索阶段:通过消息x与词典key的n-gram进行匹配,召回所有相关的元组数据作为知识。



     

图4. Tri-LSTM编码器

>>>> 模型二:Tri-LSTM编码器

如图4所示,Tri-LSTM在Dual-LSTM编码器(图中下半部分)的基础上,对于检索得到的所有元组Ax采用另一个LSTM进行编码(图中上半部分),这里作者简单的将任意一个知识元组a(<c1, r, c2>)转换为一个词序列:

对于多个相关的元组a,这里只选择匹配得分最大的一个。匹配得分函数通过知识a和回答y来计算,如下:

匹配最相关的元组(知识)之后,消息x和回答y的最终得分在考虑x和y本身的同时,考虑检索得到的知识匹配得分,如下:

直观上这里优化目标表明一个合适的回答y不仅依赖于消息x,同时也会根据x检索得到的知识产生关联。因此,回答y可以包含更多关于某个知识的信息,提升对话体验。

>>>> 对比方法

  • 方法一:监督词向量SWE(supervised word embedding)直接利用消息x和回答y的词袋向量(Bag-of-words Embedding)

     , 的内积计算得分函数,如下:

    考虑检索得到的知识a,也同样表示为词袋向量,因此有以下考虑知识的最终得分函数:

    可以看到,这里线性模型SWE与Tri-LSTM编码器的区别,主要是SWE利用词袋向量而不是RNN来表示句子。

  • 方法二:记忆网络MM(memory network)是一类经典的方法,在语言理解中引入知识模块。在这里,MM的输出记忆表示为

    ,其中是检索到知识的词袋向量表示,是消息x在记忆Ax(这里检索知识作为记忆模块)上的注意力信号。因此,消息x和回答y的最终打分函数如下:

    可以看到MM与Tri-LSTM利用知识的区别在于MM考虑回答y的权重是通过消息x和知识a的注意力信号来计算,而Tri-LSTM则是直接利用回答y和知识a计算之后选择最大。

>>>> 实验结果

实验部分,数据集采用一个100万规模的Twitter<消息,回答>对作为正样本,负样本中消息的答案则通过随机采样得到。

首先来总结对比前面提到的多个模型之间的区别,如下:

模型

Encoder

考虑知识

非线性转换

知识选择

SWE

词袋向量

Max

MM

词袋向量

Attention  weight

Dual-LSTM

LSTM

Tri-LSTM

LSTM

Max

原论文主要是集中在基于检索的对话模型,因此召回作为评价指标,结果如下:

图5. 实验结果

可以看到Tri-LSTM相比其他基础模型,结果最好。

>>>> 一个例子

图6. 个例分析

如上所示,根据消息检索到知识有:“insomnia(失眠症)”是一类睡眠问题,“夏威夷”是一个流行的度假目的地、是一个太平洋的岛屿,“too_much_work”可以产生度假的想法等。很明显,考虑了知识的回答使得人机对话的体验更好(图中相同颜色表示对应的知识和回答)。

🚀海浪学长的作品示例:

大数据算法项目

机器视觉算法项目

 

微信小程序项目

Unity3D游戏项目

最后💯

🏆为帮助大家节省时间,如果对开题选题,或者相关的技术有不理解,不知道毕设如何下手,都可以随时来问学长,我将根据你的具体情况,提供帮助。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/20046.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

NX二次开发-调内部函数SEL_set_type_filter_index_by_label设置类型过滤器例子剖析怎么查找内部函数调用内部函数

NX二次开发-调内部函数SEL_set_type_filter_index_by_label设置类型过滤器例子剖析怎么查找内部函数调用内部函数 前言 给那些不会调内部函数的人,一个学习方法,大概知道怎么找内部接口,怎么调用内部函数的。 复杂的东西我也不会,等我研究出来了,在更新到博客上。 版本…

业务级灾备架构设计

同城多中心架构 同城双中心基本架构 关键特征&#xff1a; 相同城市&#xff0c;相距50km以上光纤互联机房间网络延时<2ms 同城双中心架构本质 同城双中心可以当做一个逻辑机房可以应对机房级别的灾难 同城双中心应用技巧-多光纤通路 同一集群&#xff0c;部署在同城两个…

异常~~~

异常 异常体系 编译时异常和运行时异常的区别 Java中的异常被分为两大类&#xff1a;编译时异常和运行时异常&#xff0c;也别成为受检异常和非受检异常 所有的RuntimeException类及其子类被称为运行时异常&#xff0c;其他的异常都是编译时异常 编译时异常&#xff1a;必须…

怎么在bios里设置光驱启动 bios设置光驱启动图文教程

大部分主板都是在开机以后按DEL键进入BIOS设置。 第一部分&#xff1a;学会各种bios主板的光驱启动设置&#xff0c;稍带把软驱关闭掉。 图1&#xff1a; 图2&#xff1a;光驱启动设置 。 图3&#xff1a;回车后要保存退出 。 图4&#xff1a;提示用户&#xff0c;必须选择“…

机器学习:BP神经网络

神经网络人工神经网络的结构特点人工神经网络单层神经网络双层神经网络多层神经网络BP神经网络通过TensorFlow实现BP神经网络单层感知网络是最初的神经网络&#xff0c;具有模型清晰、结构简单、计算量小等优点&#xff0c;但是它无法处理非线性问题。BP神经网络具有任意复杂的…

性能工具之前端分析工Chrome Developer Tools性能标签

文章目录一、前言二、第一部分三、第二部分四、第三部分五、第四部分六、小结一、前言 之前本博曾经写过几篇和前端性能分析相关的文章&#xff0c;如下&#xff1a; 常见性能工具一览性能工具之常见压力工具是否能模拟前端&#xff1f;性能工具之前端分析工Chrome Developer…

【Pytorch with fastai】第 19 章 :从零开始的 fastai 学习者

&#x1f50e;大家好&#xff0c;我是Sonhhxg_柒&#xff0c;希望你看完之后&#xff0c;能对你有所帮助&#xff0c;不足请指正&#xff01;共同学习交流&#x1f50e; &#x1f4dd;个人主页&#xff0d;Sonhhxg_柒的博客_CSDN博客 &#x1f4c3; &#x1f381;欢迎各位→点赞…

AutoDWG 文件属性编辑修改控件/Attribute Modifier-X

AutoDWG 文件属性编辑修改控件组件/AttributeX 控件组件 属性控件组件是开发者无需AutoCAD就可以直接在dwg文件中提取或修改属性值的组件。 主要特征&#xff1a; 从 dwg 文件中提取属性值。 直接在dwg文件中添加或修改属性值。 支持 R9 到 2016 版本的 DWG 和 DXF。 独立于 A…

如何学习Python技术?自学Python需要多久?

前言 Python要学习的时间取决于学习方式&#xff1a;自学至少需要学8个月;报班的话&#xff0c;可能需要4个月左右的时间。如果想具体了解Python要学多久&#xff0c;那不妨接着往下看吧! &#xff08;文末送读者福利&#xff09; 这个问题分为两种情况&#xff0c;分为自学和…

机械设计基础总复习

《机械设计基础》 一、简答题 1. 机构与机器的特征有何不同&#xff1f; 机器的特征&#xff1a;&#xff08;1&#xff09;人为机件的组合&#xff1b;&#xff08;2&#xff09;有确定的运动&#xff1b;&#xff08;3&#xff09;能够进行能量转换或代替人的劳动。 机构…

攻防世界Encode

Encode 题目描述&#xff1a;套娃&#xff1f; 题目环境&#xff1a;https://download.csdn.net/download/m0_59188912/87094879 打开timu.txt文件&#xff0c;猜测是rot13加密。 Rot13在线解码网址&#xff1a;https://www.jisuan.mobi/puzzm6z1B1HH6yXW.html 解密得到&#x…

跟艾文学编程《Python基础》(1)Python 基础入门

作者&#xff1a; 艾文&#xff0c;计算机硕士学位&#xff0c;企业内训讲师和金牌面试官&#xff0c;现就职BAT一线大厂公司资深算法专家。 邮箱&#xff1a; 1121025745qq.com 博客&#xff1a;https://wenjie.blog.csdn.net/ 内容&#xff1a;跟艾文学编程《Python基础入门》…

专题18:Django之Form,ModelForm

原始思路实现添加用户功能的缺点&#xff1a; 1&#xff09;用户提交的数据没有校验 2&#xff09;如果用户输入的数据有错误&#xff0c;没有错误提示 3&#xff09;前端页面上的每一个字段都需要我们重新写一次 4&#xff09;关联的数据需要手动取获取并循环展示在页面 1…

【Effective_Objective-C_1熟悉Objective_C】

文章目录说在前面的熟悉ObjectiveCfirst了解Objective-C的起源1.消息结构和函数调用运行期组件内存管理Objective-C的起源要点总结Second 在类的头文件尽量少饮入其他文件尽量延后引入头文件或者单独开辟一个文件向前声明在类的头文件尽量少饮入其他文件要点总结THIRD-多用字面…

梯度下降法的理解

1 梯度下降法 本文所有的数学定义概念非官方所给&#xff0c;皆来自于个人理解融合 1.1 梯度的定义 个人理解就是能够使函数值增大最快的方向 需要明确的一点&#xff0c;这里说的方向都是自变量变化的方向 1.2 梯度下降法 梯度下降法本质上是用来求解目标函数最小值的一种…

CocosCreater学习1

1.产品定位 Cocos Creator 是以内容创作为核心&#xff0c;实现了脚本化、组件化和数据驱动的游戏开发工具。具备了易于上手的内容生产工作流&#xff0c;以及功能强大的开发者工具套件&#xff0c;可用于实现游戏逻辑和高性能游戏效果。 2.工作流程 3.项目文件夹结构 初次创…

C++入门基础01:指针与引用

C入门基础&#xff1a;指针与引用 指针 #include <iostream> //系统定义头文件一般是尖括号 #include<fstream> #include<string> using namespace std;//引用与指针 //是复合数据类型&#xff0c;与基本数据类型int、double这类是不一样的 //指针存储的是…

Java集合框架详解(一)Collection接口、List接口、ArrayList类、Vector类

一、集合架构图 二、Collection接口 Collection集合的遍历 迭代器&#xff1a;Iterater 方法名称备注Iterater Iterater()返回在此collection的元素上进行迭代的迭代器boolean hasNext()如果有元素可以迭代&#xff0c;返回true&#xff0c;否则返回falseE next()返回迭代的下…

Kafka - Kafka生产者|发送消息|分区策略|提高吞吐量|数据可靠性|数据去重|数据有序

文章目录1. Kafka 生产者2. 生产者发送消息1. 生产者异步发送消息2. 生产者异步发送消息带回调函数3. 生产者同步发送消息3. 生产者发送消息的分区策略1. Kafka 分区好处2. 分区器 DefaultPartitioner 和 ProducerRecord 源码3. 指定 partition 的情况4. 没有指定 partition 但…

从零集成mybatis-plus

Mybatis-Plus特性&#xff1a; 无侵入&#xff0c;即引入它不会对现有工程产生影响。损耗小&#xff0c;启动就会自动注入基本的CRUD&#xff0c;内置通用Mapper、Service等&#xff0c;基本能满足大部分需求。支持主键自动生成&#xff0c;其中包括分布式唯一ID生成器Sequenc…