PaddlePaddle自然语言处理总结

news2025/1/21 12:07:26

11月28日 week14 周一 910节 物联201 2008070101

本文总结:

1.介绍词向量引入对自然语言处理有着至关重要的作用;

2.介绍了word2vec算法;

3.介绍CBOW算法的实现;

4.介绍Skip-Gram算法的实现。

基本流程

1.数据预处理:选择需要使用的数据,做好预处理;

2.网络定义:预先定义好网络结构,包括输入层、中间层(隐藏层)、输出层、损失函数和优化算法;

3.网络训练:将准备好的数据送入神经网络进行学习,并观察学习的过程是否正常,如损失函数值是否在降低,也可以及时返回一些关键步骤的结果;

4.网络评估:使用测试集合测试训练好的神经网络,看看训练效果如何。

参考链接:飞桨PaddlePaddle-源于产业实践的开源深度学习平台

目录

词向量

word2vec算法

CBOW算法

1.输入层

2.隐藏层

3.输出层

Skip-Gram算法 

1.结构 

2.实现

代表中心词的tensor

代表目标词的tensor

代表目标词标签的tensor


词向量

[1.]词向量(Word Embedding)的引入:表示自然语言里单词的一种方法,把每个词都表示为一个N维空间内的点,即一个高维空间内的向量,使用这个方法可以把自然语言转换为向量

通过计算这些向量之间的距离,就可以计算出词语之间的关联关系,从而达到让计算机像计算数值一样去计算自然语言的目的。

word2vec算法

[2.]word2vec算法:通过上下文来学习语义信息,word2vec包括两个经典模型:CBOW(continuous bag-of-words)和Skip-gram;

CBOW:通过上下文的词向量推理中心词。

Skip-gram:根据中心词推理上下文。

一般来说,CBOW比Skip-gram训练速度快,训练过程更加稳定,原因是CBOW使用上下文average的方式进行训练,每个训练step会见到更多样本。而在生僻字(出现频率低的字)处理上,skip-gram比CBOW效果更好,原因是skip-gram不会刻意回避生僻字(CBOW结构中输入中存在生僻字时,生僻字会被其它非生僻字的权重冲淡)。 

CBOW算法

[3.]CBOW算法实现:CBOW是一个具有3层结构的神经网络;

1.输入层

一个形状为C*V的one-hot张量,其中C代表上线文中词的个数,通常是一个偶数,我们假设为4;V表示词表的大小,我们假设为5000,该张量的每一行都是一个上下文词的one-hot向量表示,比如"Pineapples, are, and, yellow"。

2.隐藏层

一个形状为V*N的参数张量W1,一般称为word-embedding,N表示每个词的词向量长度,我们假设为128。输入张量和word embedding W1进行矩阵乘法,就会得到一个形状为C*N的张量。综合考虑上下文中所有词的信息去推理中心词,因此将上下文中C个词相加得一个1×N的向量,是整个上下文的一个隐含表示。

3.输出层

创建另一个形状为N×V的参数张量,将隐藏层得到的1×N的向量乘以该N×V的参数张量,得到了一个形状为1×V的向量。最终,1×V的向量代表了使用上下文去推理中心词,每个候选词的打分,再经过softmax函数的归一化,即得到了对中心词的推理概率:

Skip-Gram算法 

[4.]Skip-Gram算法实现

1.结构 

 

2.实现

在实现的过程中,通常会让模型接收3个tensor输入:

代表中心词的tensor

称之为center_words V,一般来说,这个tensor是一个形状为[batch_size,vocab_size]的one-hot tensor,表示一个mini-batch中每个中心词具体的ID。

代表目标词的tensor

称之为target_words T,一般来说,这个tensor同样是一个形状为[batch_size,vocab_size]的one-hot tensor,表示一个mini-batch中每个目标词具体的ID。

代表目标词标签的tensor

假设我们称之为labels L,一般来说,这个tensor是一个形状为[batch_size,1]的tensor,每个元素不是0就是1(0:负样本,1:正样本)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/43744.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

​企业该如何做好源代码防泄密工作

​企业该如何做好源代码防泄密工作 随着企业信息化发展的日益增长,软件行业厂商之间的竞争也愈加白热化,加上国内对知识产权的不够重视、山寨模仿产品的横行。保护源代码、保证企业的核心竞争力,成为众多软件研发企业的第一要务。那么企业应…

智能制造云办公 v3.8.10 发布,团队管理更新

智能制造云办公系统 [SpringBoot2 - 快速开发平台],适用于制造业、建筑业、汽车行业、互联网、教育、政府机关等机构的管理。包含文件在线操作、工作日志、多班次考勤、CRM、ERP 进销存、项目管理、EHR、拖拽式生成问卷、日程、笔记、工作计划、行政办公、薪资模块、…

FusionCompute五个网络平面

文章目录前言一、五个网络平面二、管理网络平面三、存储网络平面四、业务网络平面五、VIMS心跳网络平面前言 FusionCompute 五个网络平面,最少6网口(6电或4电2光),最佳8块网卡(8个电口或6电口2光口) 一套存…

【Mybatis编程:根据id查询相册数据详情】

目录 1.书写SQL语句 2. 在AlbumMapper.java中添加抽象方法 3. 在AlbumMapper.xml中配置SQL语句 4. 在AlbumMapperTests.java中编写并执行测试 1.书写SQL语句 需要执行的SQL语句大致是: SELECT id, name, description, sort FROM pms_album WHERE id? 由于不需要…

Maven下载及环境搭建

目录 一、maven简介 二、maven的下载 1、找到maven官网 2、点击下载 ,下载后解压到此电脑 三、配置环境环境变量 1、找到mybatis解压到的目录 2、打开电脑,找到高级系统设置,点击环境变量 3、点击新建,命名为MAVEN_HOME&…

[附源码]计算机毕业设计javaee家教管理系统

项目运行 环境配置: Jdk1.8 Tomcat7.0 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术: SSM mybatis Maven Vue 等等组成,B/S模式 M…

用huggingface.transformers在文本分类任务(单任务和多任务场景下)上微调预训练模型

诸神缄默不语-个人CSDN博文目录 transformers官方文档:https://huggingface.co/docs/transformers/index AutoModel文档:https://huggingface.co/docs/transformers/v4.23.1/en/model_doc/auto#transformers.AutoModel AutoTokenizer文档:ht…

四旋翼无人机学习第11节--页连接符与跨页连接符的使用

0 前言 在之前的教程中,我们把四轴的全部原理图进行了绘制,当时为了方便,很多跨图纸的信号没有补充完整,本次教程我们就把剩余的信号补充完整哈。 1 输出、输入跨页连接符的使用 1、在放置跨页连接符之前,需要在引脚…

海带软件分享——Office 2021全家桶安装教程(附报错解决方法)

关注“PandaCVer”公众号 >>>深度学习Tricks&#xff0c;第一时间送达<<< &#x1f680; 写在前面 &#x1f431;‍&#x1f3cd; 【问题发现】&#xff1a;小海带才两天没打开Word&#xff0c;突然发现自己的文档就莫名失效且无法编辑&#xff0c;并且提示…

一些计算机的冷知识,你都知道吗?

有些专业冷知识&#xff0c;不仅外人不知道&#xff0c;就算本专业的同学都不一定了解。来看看下面计算机专业发冷知识&#xff0c;你知道几个呢&#xff1f; 很多人习惯双手按 Ctrl Alt Delete 打开任务管理器&#xff0c;其实可以单手用 Ctrl Shift ESC 直接打开你使用的…

【DevPress】V2.4.1版本发布,增加抽奖组件

DevPress V2.4.1版本于2022年10月20日发版 一、该版本功能包含 1、新需求 1&#xff09;控制台增加抽奖组件&#xff0c;可以根据运营活动新建抽奖活动&#xff0c;抽奖中包含奖品设置、中奖名单等一些列功能 - 创建抽奖&#xff1a;抽奖名称、活动时间、参与条件、角标以及…

jenkins CI/CD持续集成/交付/部署

文章目录1.引言2.CI介绍&#xff08;持续集成&#xff09;3.实现持续集成3.1.搭建Gitlab服务器3.2.搭建Gitlab服务器3.3 整合项目入门测试编写一个springboot项目test-ci编写.gitlab-ci.yml文件3.4 编写.gitlab-ci.yml文件&#xff0c;实现持续集成3.5 删除名称为none的image4.…

Linux之SSH、rsync

目录 Linux下的SSH服务 SSH服务简介和原理 SSH结构 SSH服务附带的SCP命令 使用ssh服务 ssh基本用法 ssh服务的两种认证类型 基于口令认证 基于密钥认证 ssh服务常见配置 1.修改ssh端口 2.禁止root用户登录 3.限制ssh监听的IP 4.禁止使用密码登录 ​​Rsync远程同步…

CDGP与CDMP考哪个合适?

在数字经济转型的时代&#xff0c;数据治理已经成为大数据人才提升自身职业素养不可或缺的培训课程&#xff0c;提升大数据治理能力&#xff0c;做数据治理专业化人才。 那么从事数据管理岗位&#xff0c;要不要学习DAMA认证&#xff1f;该怎么选择 答案一定是要看哪个认证的…

希望计算机专业同学都知道这些宝藏博主

湖科大教书匠——计算机网络 “宝藏老师”、“干货满满”、“羡慕湖科大”…这些都是网友对这门网课的评价&#xff0c;可见网课质量之高&#xff01; 湖南科技大学《计算机网络》微课堂是该校高军老师精心制作的视频课程&#xff0c;用简单的语言描述复杂的问题&#xff0c;…

zabbix自动发现

目录 一、环境准备 1、搭建zabbix基础环境 2、创建被监控主机 二、创建自动发现规则 1、自动发现概述 2、自动发现流程 3、部署监控端主机web2 4、创建自动发现规则 三、创建自动发现后的动作 四、测试自动发现 一、环境准备 1、搭建zabbix基础环境 zabbix基础环境部…

SpringCloud:Nacos注册中心和服务消费方式

目录 一、nacos环境搭建 nacos简介 步骤1&#xff1a;安装nacos 步骤2&#xff1a;启动nacos 启动 步骤3&#xff1a;访问nacos 二、nacos的微服务注册 ①导入pom依赖 shop-common的pom.xml 父工程的pom ②加注解 ③在application.yml中添加nacos服务的地址 ④启动服务…

[附源码]Python计算机毕业设计Django病人跟踪治疗信息管理系统

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

python+django大学生心理素质测评及咨询平台

1.系统包括登录模块、消费模块、收入模块和统计模块。 2.登录模块:对用户的管理权限进行验证&#xff0c;确保用户账号的安全。 3.消费模块:包括食品消费、着装消费、家具消费和行车消费&#xff0c;将日常生活中的主要消费进行详细汇总&#xff0c;具体包含购买日期、购买物品…

全国心力衰竭日| 仿生“人工心脏”——心衰患者的“心”希望

积羽沉舟——感冒竟酿心衰 龚先生今年四十多岁&#xff0c;有贤惠的妻子、聪明可爱的儿子&#xff0c;过着平凡却幸福的日子。没想到2017年一次小感冒&#xff0c;竟差点毁掉这个幸福的家庭。2017年的一天&#xff0c;龚先生突然得了一场重感冒&#xff0c;伴随胃痛、浑身无力等…