1、Bot定义
能执行大量自动化、高速或机械式、繁琐的工作的计算机程序,包括但不仅限于聊天功能
2、Retrieval-based
KE(知识网络)基于信息的提取。(检索的过程中有延迟,设置比较快捷的检索方式)
2.1 Intent(意图)
把一些相似功能的命令分在一起,例如“how are you ?”和"how do you do?"都是打招呼意图,把他们放在同一个节点(因为他们回答的都差不多),后面的分支是对应的回答,例如“I AM FINE”。通过这种方式,可以使得问题泛化,就是对于用户来说,类似的问题都能得到自己想要的答案,问的方式比较灵活。(设置文本分类器)
3、Generative(生成模型,类似rnn)
能生成人没有预先设定好的内容。
必读:A Neural Conversational Model
运用Neural即神经网络,训练两组对话,film dialoge(电影对白)、IT support(IT对话)。即,获取电影行业和IT行业的相关知识
3.1中英文处理区别
英文对话一般是有空格的,要把空格截掉,提取出每个单词
中文对话要用第三方的中文分词库,也起到分割的作用,类似区分主谓宾
第三方中文分词库:第三方中文分词库下载
4、知识框架(总结)
可以通过google的search搜索所有问题,再把结果都反馈给chatbot
5、LONG VS SHORT
5.1第一维度(回答文本长度)
回答是比较短的例如Y/N,还是比较长的对话例如今天是晴天。
但有个问题,机器生成的回答语法可能有问题,要么就是,人为提前设置,要么就是,用大量数据训练回答方式。
5.2第二维度(scope范围)
一问一答,短范围。
记住以前发生过什么,长范围。
5.3LSTM
推荐阅读:LSTM的基础干货,带脑子用心看
LSTM的设计者提出了“长短期记忆”的概念——只有一部分的信息需要长期的记忆,而有的信息可以不记下来。同时,我们还需要一套机制可以动态的处理神经网络的“记忆”,因为有的信息可能一开始价值很高,后面价值逐渐衰减,这时候我们也需要让神经网络学会“遗忘”特定的信息
6、学术界的挑战
6.1语境
(1)语言语境
一文读懂Embedding的概念,以及它和深度学习的关系
(2)物理语境
涉及到周围的物理环境