连续词袋模型(Continous bag of words, CBOW)

news2024/9/22 11:25:28

将高维度的词表示转换为低纬度的词表示方法我们称之为词嵌入(word embedding)。

CBOW是通过周围词去预测中心词的模型。(Skip-gram是用中心词预测周围词)

CBOW模型的结构

 

 最左边为上下文词,这些词用One-hot编码表示,维度为1*V(上图容易让人理解错误)

每个上下文的词向量都需要乘以一个共享的矩阵W,由于整个模型是一个神经网络结构,我们将这个存入输入层和隐藏层之间的矩阵定义为W,矩阵的维度为V*N(N是我们自己定义的一个维度)。

One-hot编码矩阵乘以矩阵W得到的是一个1*N的向量。

因为一个中心词会有多个上下文词,而且每个上下文词都会计算得到一个1*N向量,将这些1*N的向量相加取平均,得到中间层(隐藏层)的向量,这个向量也是1*N,之后这个向量需要乘以一个N*V的矩阵W2,最终得到的输出层维度为1*V。

然后将1*V的向量softmax处理得到新的1*V向量,在V个取值中概率值最大的数字对应的位置所表示的词就是预测结果。

上述就是CBOW模型的前向计算过程。

那个这个模型的训练过程如下:

1.当前词的上下文词语的独热编码输入到输入层;

2.这些词分别乘以同一个矩阵W1后分别得到各自的1*N向量

3.将这些1*N向量相加取平均得到一个1*N向量

4.将这个1*N向量乘以矩阵W2,称为一个1*V向量

5.将1*V向量softmax归一化后输出取每个词的概率向量1*V

6.将概率值最大的数对应的词作为预测词。

7.将预测的结果1*V向量和真实标签1*V向量计算误差,一般是交叉熵

8.在每次前向传播之后反向传播误差,不断调整w1和w2的值。

预测的时候,做一次前向传播即可得到预测的中心词结果。

其实,我们在做CBOW时,最终要的是W1这个V*N矩阵。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/32976.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

codeforces:C. Set Construction【构造 + 入度观察】

目录题目截图题目分析ac code总结题目截图 题目分析 题目要找n个集合给出一个矩阵b如果bij 1,表示第i个集合为第j个集合的真子集bij 0,表示不是真子集寻找集合间的关系,g记录下一个更大的集合,smaller表示被本集合包含的集合的…

以数据为中心的标记语言-->yaml

目录 一.yaml 介绍 二.yaml 基本语法 三.数据类型 1.字面量 2.对象 3.数组 四.yaml 应用实例 1.需求: 2.需求图解 3.代码实现 五.yaml 使用细节 一.yaml 介绍 YAML 是"YAML Aint a Markup Language"(YAML 不是一种标记语言) 的递归缩写。在开发 的这种语言…

每日一练2——C++排序子序列问题倒置字符串问题

文章目录排序子序列问题思路:代码:倒置字符串思路:方法一:代码:方法二:代码:排序子序列问题 题目链接 这道题题意不难理解,但是想写对还是有很多细节的。 本题要求解的是排序子序列…

python之正则表达式【简化版】

大家好,我们今天说一说正则表达式,在之前我们也介绍了关于正则表达式,今天,我们来深入的了解一下。我们知道正则表达式是处理字符串的强大工具,它有自己的语法结构,什么匹配啊,都不算什么。 正…

JavaIO流:BIO梳理

BIO(blocking I/O) : 同步阻塞,服务器实现模式为一个连接一个线程,即客户端有连接请求时服务器端就需要启动一个线程进行处理,如果这个连接不做任何事情会造成不必要的线程开销,可以通过线程池机…

Java8新特性 Stream流

Stream流 在Java 8中,得益于Lambda所带来的函数式编程,引入了一个全新的Stream概念,用于解决已有集合类库既有的弊端。 传统集合的多步遍历代码几乎所有的集合(如 Collection 接口或 Map 接口等)都支持直接或间接的遍…

我这样写代码,比直接使用 MyBatis 效率提高了 100 倍

对一个 Java 后端程序员来说,mybatis、hibernate、data-jdbc 等都是我们常用的 ORM 框架。它们有时候很好用,比如简单的 CRUD,事务的支持都非常棒。但有时候用起来也非常繁琐,比如接下来我们要聊到的一个常见的开发需求&#xff0…

【知识图谱论文】调整元知识图信息以在少样本关系上进行多跳推理

文章题目:Adapting Meta Knowledge Graph Information for Multi-Hop Reasoning over Few-Shot Relations时间:2019 摘要 多跳知识图 (KG) 推理是一种有效且可解释的方法,用于在查询回答 (QA) 任务中通过推理路径预测目标实体。 大多数以前…

做交互设计都有哪些需要掌握的思维方式

由于目前的环境对这个细分领域仍然缺乏了解,我希望在这篇文章中写一些交互设计所需的思维方式。 ​ 1.可用性优先,视觉靠边 一个功能个功能应该能够使用和使用,以便有人关心它是否好看。审美挑剔的用户实际上比你想象的要少得多。当然&#…

机械工程基础知识点汇总

第一章 常用机构 一、零件、构件、部件 零件,是指机器中每一个最基本的制造单元体。 在机器中,由一个或几个零件所构成的运动单元体,称为构件。 部件,指机器中由若干零件所组成的装配单元体。 二、机器、机构、机械 机器具有以下特…

智能捡乒乓球机器人

本文素材来源于物理与电子电气工程学院 作者:丁文龙 、王小军、任剑杰、张钊铭 指导老师:康彩 一、项目简介 随着人们对机器人技术智能化本质认识的加深,机器人技术开始源源不断地向人类活动的各个领域渗透。在这其中,服务机器人…

数字图像处理(十二)最大熵算法

文章目录前言一、熵是什么?1.信息量如何计算?2.熵如何计算?二、最大熵方法1.设计思想2.算法步骤3.C代码4.实验结果参考资料前言 在图像分析中,通常需要将所关心的目标从图像中提取出来,这种从图像中某个特定区域与其他…

JAVA中的集合类型的理解及应用

目录 概述 List和Queue Map和Set HashTable和HashMap的区别 Queue和Deque BlockingQueue 并发集合 概述 写程序免不了处理一些批量数据,不同数据结构和算法,会带来不同的性能效果。大学的计算机课程中就有一门叫《数据结构》的课程,这门…

总结我的 MySQL 学习历程,给有需要的人看

作者| 慕课网精英讲师 马听 你好,我是马听,现在是某零售公司的 MySQL DBA,身处一线的我表示有很多话要讲。 我的MySQL学习历程 在我大三的时候,就开始接触到 MySQL 了,当时我也是从最基础的 MySQL 知识(…

6、项目第六阶段——用户名登录显示和注册验证码

第六阶段——用户名登录显示和注册验证码 1、登陆—显示用户名 UserServlet 程序中保存用户登录的信息 UserServlet程序中: //保存用户登录信息到Session域中 req.getSession().setAttribute("user",loginUser);修改 login_succuess_menu.jsp&#xf…

2019 国际大学生程序设计竞赛(ICPC)亚洲区域赛(银川) 7题

文章目录N.Fibonacci SequenceB.So EasyI.Base62G.Pot!!F.Function!K.Largest Common Submatrix补题链接:https://codeforces.com/gym/104021 难得VP打出这么好的成绩,虽然是有争议的西部枢纽银川站,虽然没能早生几年。。。。 N.Fibonacci Se…

【数据结构】基础:堆

【数据结构】基础:堆 摘要:本文主要介绍数据结构堆,分别介绍其概念、实现和应用。 文章目录【数据结构】基础:堆一、概述1.1 概念1.2 性质二、实现2.1 定义2.2 初始化与销毁2.3 入堆2.4 出堆2.5 堆的创建2.6 其他三、应用3.1 堆排…

《前端》css总结(下)

文章目录元素展示格式displaywhite-spacetext-overflowoverflow内边距和外边距marginpadding盒子模型box-sizing位置position:用于指定一个元素在文档中的定位方式浮动flex布局flex-directionflex-wrapflex-flowjustify-contentalign-itemsalign-contentorderflex-g…

你最少用几行代码实现深拷贝?

问题分析 深拷贝 自然是 相对 浅拷贝 而言的。 我们都知道 引用数据类型 变量存储的是数据的引用,就是一个指向内存空间的指针, 所以如果我们像赋值简单数据类型那样的方式赋值的话,其实只能复制一个指针引用,并没有实现真正的数…

计算机组成原理4小时速成:存储器,内存ROM,RAM,Cache,高速缓存cache,外存,缓存命中率,效率

计算机组成原理4小时速成:存储器,内存ROM,RAM,Cache,高速缓存cache,外存,缓存命中率,效率 2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法…