阅读论文笔记《Efficient Estimation of Word Representations in Vector Space》

阅读论文笔记《Efficient Estimation of Word Representations in Vector Space》

news2026/2/12 12:46:17

这篇文章写于2013年，对理解 word2vec 的发展历程挺有帮助。

本文仅适用于 Word2Vect 的复盘

引言

这篇论文致力于探索从海量数据中学习高质量单词向量的技术。当时已发现词向量能保留语义特征，例如 “国王 - 男人 + 女人≈女王”。论文打算借助该特性，提出新的词向量表示方法，进一步提高词向量质量，并探究训练时间、准确性与向量维度、数据量之间的关联。

此前，已有不少利用神经网络语言模型 NNLM 生成词向量的研究，其中部分研究发现，简单模型展现出了学习词向量的能力。本文从中获得启发，决定探索简单神经网络结构，期望在降低计算复杂度的同时，高效地从大规模数据中学习高质量词向量。

模型架构

首先将模型的计算复杂度定义为需要训练的参数的数量。

有两个目的：1、最大化准确度；2、最小化计算复杂度

论文基于前馈神经网络语言模型（NNLM）进行了改善。
NNLM 包含输入层、映射层、隐藏层和输出层，每轮训练的计算复杂度为：
在这里插入图片描述
这里主要是 $H\times V$ 这一项占主导，也就是 $V$ 这个值。论文使用了已有方法分层 softmax 对这部分进行了优化。这样一来，变成了 $N\times D\times H$ 进行主导，为了优化这部分，论文去掉了隐藏层，这样模型的复杂度就很大程度上取决于softmax归一化的效率了。

作为 NNLM 的改进，RNNLM 考虑了可变上下文长度，利用 RNN 来处理。RNNLM 由输入层、隐藏层和输出层这三层构成，相应每次训练的计算复杂度为：
在这里插入图片描述
其中词向量的维度与隐藏层维度相同。 $H\times V$ 仍然可以使用分层 softmax 来优化。这样一来，复杂度的优化集中于 $H\times H$ 。

在本论文中，采用了并行训练的方法，使用多个部署了模型副本的 GPU 同时训练。论文使用小批量异步梯度下降方法，即将训练数据划分为多个 batch 部署到不同的 GPU 上，这些 GPU 异步地各自进行训练。另外，论文使用了名为 Adagrad 的自适应学习率过程。

新的对数线性模型

从前面对 NNLM 和 RNNLM 的介绍中，我们看到计算复杂度主要来自非线性隐藏层。为此论文考虑探索更简单的架构（想去掉隐藏层），尽管这样的结果不如神经网络模型那样精确，但对于大规模训练数据来说可能更加有效。

论文提出了 CBOW 和 Skip-gram 这两个简单的架构。

连续词袋模型（CBOW）

在这里插入图片描述
CBOW 的计算复杂度为：

连续跳元模型（Skip-gram）

在这里插入图片描述
Skip-gram 的计算复杂度：

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2299351.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

初学PADS使用技巧笔记（也许会继续更新）

初学PADS使用技巧笔记（也许会继续更新）

操作意图：网上找某个芯片封装又不想自己画，再加上没经验，怎么办？ 就以AC-DC芯片PN8036为例，打开嘉立创的的DFM，打开立创商城，输入PN8036，点击数据手册，然后点击直接打开…

阅读更多...

从无序到有序：上北智信通过深度数据分析改善会议室资源配置

从无序到有序：上北智信通过深度数据分析改善会议室资源配置

当前企业普遍面临会议室资源管理难题，预约机制不完善和临时会议多导致资源调度不合理，既有空置又有过度拥挤现象。针对上述问题，上北智信采用了专业数据分析手段，巧妙融合楼层平面图、环形图、折线图和柱形图等多种可视化工具&a…

阅读更多...

CAS单点登录（第7版）4.管理

CAS单点登录（第7版）4.管理

如有疑问，请看视频：CAS单点登录（第7版） 管理概述 Admin Console & 仪表板 CAS 提供了许多可用于管理 CAS 服务器部署的工具和控制板。此类选项通常不是互斥的，旨在协同工作并呈现 CAS 配置和构建的各个方面&am…

阅读更多...

Baklib一站式云平台：全场景赋能企业知识资产激活

Baklib一站式云平台：全场景赋能企业知识资产激活

内容概要在数字化浪潮推动下，企业知识资产的高效管理与价值释放成为核心议题。Baklib作为一站式云平台，以全场景赋能为核心定位，通过构建知识中台架构，为企业提供从资源整合到应用落地的闭环解决方案。该平台不仅支持文本、图像…

阅读更多...

登录弹窗效果

登录弹窗效果

1，要求点击登录按钮，弹出登录窗口提示1：登录窗口 display:none 隐藏状态； 提示2：登录按钮点击后，触发事件，修改 display:block 显示状态提示3：登录窗口中点击关闭按钮&#xff0…

阅读更多...

小小小病毒（3）（~_~|)

小小小病毒（3）（~_~|)

一分耕耘一分收获声明： 仅供损害电脑，不得用于非法。损坏电脑，作者一律不负责。此作为作者原创，转载请经过同意。欢迎来到小小小病毒（3） 感谢大家的支持还是那句话：上代码！ …

阅读更多...

【Java 面试八股文】Spring Cloud 篇

【Java 面试八股文】Spring Cloud 篇

Spring Cloud 篇 1. Spring Cloud 5大组件有哪些？2. 服务注册和发现是什么意思？Spring Cloud 如何实现服务注册发现？3. 我看你之前也用过nacos，你能说下nacos与eureka的区别？4. 你们项目负载均衡如何实现的&#xff1f…

阅读更多...

Esxi8.0设置nvidia显卡直通安装最新驱动

Esxi8.0设置nvidia显卡直通安装最新驱动

ESXI8.0设置显卡直通在某些情况下，我们需要多次切换操作系统，以测试软件是否适用于特定系统和环境，减少多次重装系统的麻烦 ESXI8.0安装包通过网盘分享的文件：ESXi-8.0U2-22380479-USB-NVME-集成网卡镜像.iso 链接: https://…

阅读更多...

LabVIEW袜品压力测试系统

LabVIEW袜品压力测试系统

开发了一种基于LabVIEW开发的袜品压力测试系统。该系统利用LabVIEW并结合灵敏的传感器和高精度的处理模块，实现了对袜品压力的精确测量和分析。系统不同于传统的服装压力测试方法，为研究和评价袜子的舒适性提供了新的测试手段。项目背景该系统的…

阅读更多...

TestHubo基础教程-创建项目

TestHubo基础教程-创建项目

TestHubo是一款国产开源一站式测试工具，涵盖功能测试、接口测试、性能测试，以及 Web 和 App 测试，可以满足不同类型项目的测试需求。本文将介绍如何快速创建第一个项目，以快速入门上手。 1、创建项目在 TestHubo 中，…

阅读更多...

深度求索—DeepSeek API的简单调用（Java）

深度求索—DeepSeek API的简单调用（Java）

DeepSeek简介 DeepSeek（深度求索）是由中国人工智能公司深度求索（DeepSeek Inc.）研发的大规模语言模型（LLM），专注于提供高效、智能的自然语言处理能力，支持多种场景下的文本生成、对…

阅读更多...

企业使用统一终端管理(UEM)工具提高端点安全性

企业使用统一终端管理(UEM)工具提高端点安全性

什么是统一终端管理(UEM) 统一终端管理(UEM)是一种从单个控制台管理和保护企业中所有端点的方法，包括智能手机、平板电脑、笔记本电脑、台式机和 IoT设备。UEM 解决方案为 IT 管理员提供了一个集中式平台，用于跨所有作系统和设备类型部署、配置、管理和…

阅读更多...

爱彼（Audemars Piguet）：瑞士制表艺术的巅峰之作（中英双语）

爱彼（Audemars Piguet）：瑞士制表艺术的巅峰之作（中英双语）

爱彼（Audemars Piguet）：瑞士制表艺术的巅峰之作在瑞士高级制表界，Audemars Piguet（爱彼） 以其大胆创新、卓越工艺和独立家族经营的传统，成为世界顶级腕表品牌之一。作为瑞士“三大制表品牌”之…

阅读更多...

1134. 国王的魔镜

1134. 国王的魔镜

题目 AC代码 #include<bits/stdc.h> using namespace std; bool hw(char s[]) {bool rtrue;int i;for(i0;i<strlen(s)/2;i){if(s[i]!s[strlen(s)-i-1]){rfalse;break;}}return r; } int main() {char s[1005];gets(s);while(hw(s)true&&strlen(s)%20){s[strl…

阅读更多...

浅说树形dp

浅说树形dp

文章目录前言树形dp的转移方式树形dp的使用的场景小结初步感知——简单的树形dp例题1例题2 深入分析——树形dp的经典模型最大独立集最小点覆盖最小支配集树上直径前言因为树的形式非常适合递归，他所带来的访问顺序也是非常符合拓扑排序的，故而在处…

阅读更多...

使用Charles进行mock请求

使用Charles进行mock请求

在 Charles 中，“Compose”（构建请求）功能允许你手动创建和发送 HTTP 或 HTTPS 请求，方便进行 API 测试、调试等操作。以下是 Compose 功能的详细使用方式： 1. 打开 Compose 界面启动 Charles 后，在菜单…

阅读更多...

RAMinit 程序编译运行考古记录

RAMinit 程序编译运行考古记录

本科的时候浅浅研究了DOSBox，今天看到网上挺多关于雷军代码的新闻，我把雷军代码在web上编译出来了，但是我是业余选手，所以做得比较差，不过大家感兴趣可以关注我的dosplay项目，旨在利用js-dos实现汇编语言在…

阅读更多...

【Pico】使用Pico进行无线串流搜索不到电脑

【Pico】使用Pico进行无线串流搜索不到电脑

使用Pico进行无线串流搜索不到电脑官串方式：使用Pico互联连接电脑。故障排查以下来自官方文档请按照以下步骡排除故障： 确认电脑和一体机连接了相同的路由器WiFi网络(相同网段) IP地址通常为192.168.XX，若两设备的IP地址前三段相同&…

阅读更多...

Golang Model 字段自动化校验设计

Golang Model 字段自动化校验设计

背景在我们日常开发中，不可避免的总要去进行各种参数校验，但是如果在某个场景中，要校验的字段非常多，并且在其中还有耦合关系，那么我们手写校验逻辑就变得非常的低效且难以维护。本篇文档就基于 DDD 领域模型设计的思…

阅读更多...

移动端测试的挑战与解决方案：兼容性、网络问题及实战策略

移动端测试的挑战与解决方案：兼容性、网络问题及实战策略

引言移动应用已成为用户触达服务的核心入口，但移动端测试面临设备多样性、网络波动、用户场景复杂等多重挑战。据Statista统计，2023年全球活跃移动设备超180亿台，操作系统（Android/iOS）版本碎片化率超30%，这对测试工程师提出了极高要求。本文深度解析移动端测试的核心痛…

阅读更多...

推荐文章

最新文章