AFast and Accurate Dependency Parser using Neural Networks论文笔记

AFast and Accurate Dependency Parser using Neural Networks论文笔记

news2025/2/22 6:01:33

基本信息

作者	D Chen	doi
发表时间	2014	期刊	EMNLP
网址	https://emnlp2014.org/papers/pdf/EMNLP2014082.pdf

研究背景

1. What’s known 既往研究已证实
传统的dp方法依存句法分析特征向量稀疏，特征向量泛化能力差，特征计算消耗大，并且是人工构建的稀疏特征。

2. What’s new 创新点
使用密集特征作为神经网络（NN）输入的方法，构建贪婪依存句法解析器。使用的是少量的密集特征，处理速度较快。

3. What’s are the implications 意义
用神经网络做transition-based贪心模型可以缓解特征向量泛化能力差，特征计算消耗大的问题，并且准确率提高，速度变快。

研究方法

1. Transition-Based Dependency Parsing
一个词A有一个箭头指向另外一个词B，箭头上通常有标签(label)，这些标签表示语法关系，比如主语，同位语等等。箭头连接的两个词有head（高级）和dependent（低级）的区别。而这些箭头称为dependency。
通常一个句子中加一个假的root，这样每个单词dependent于另一个节点。通常这些依存关系会形成一棵树（连通，非循环，一个根结点）。对于dependency parsing有一个定义是projectivity，叫投影。如果这些箭头没有交叉，则称这个树是projective的。
He就dependent于has，因为has说明了he要干嘛，所以has是head。而he是has的名词主语(nominal subjective)，就是label。可以看出图中的关系形成了一棵树。
在这里插入图片描述

2. Neural Network Based Parser
通过现有的信息，预测出下一步的transition。输入由三部分组成，词，词的词性，词的箭头的label，全都是embedding的形式。分为了输入层、隐藏层（ cube激活函数）、softmax层。
在这里插入图片描述

结果与讨论

用神经网络做transition-based贪心模型缓解了特征向量泛化能力差，特征计算消耗大的问题，并且准确率提高，速度变快。

个人思考与启发

可以尝试用神经网络去解决一些其他问题。

重要图

文献中重要的图记录下来
一个基于转换的依赖项解析的示例。左上:期望的依赖树，右上:中间配置，底部:弧线标准系统的转换序列

一个基于转换的依赖项解析的示例。左上:期望的依赖树，右上:中间配置，底部:弧线标准系统的转换序列

我们的神经网络架构

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1952522.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

UE5 with plugins AirSim in Windows ROS in WSL2-Ubuntu 20.04配置过程记录

UE5 with plugins AirSim in Windows ROS in WSL2-Ubuntu 20.04配置过程记录

一、概述因为需要使用到Windows系统下的UE5和插件AirSIm进行研究，所以在Windows环境下进行配置。但又因为需要使用到ros进行操作，所以，在通过对诸多资源进行考察过后，因为UE5plugins AirSim已经配置成功。只需要考虑跟ROS的通信以…

阅读更多...

构建查询洞察 UI

构建查询洞察 UI

本文字数：2631；估计阅读时间：7 分钟作者：Bucky Schwarz 本文在公众号【ClickHouseInc】首发我们最近发布了 Query Insights 的初步实现，为 ClickHouse Cloud 用户提供了一种便捷的方法来查看和解释查询日志。该功能对…

阅读更多...

CSS 两种盒模型 box-sizing content-box 和 border-box

CSS 两种盒模型 box-sizing content-box 和 border-box

文章目录 Intro谨记box-sizing 两个不同赋值的效果区别？宽高的数值计算标准盒模型 box-sizing: content-box; box-sizing 属性的全局设置 Intro 先问一句：box-sizing 和它的两个属性值是做什么用的？以前我并不知道它的存在，也做…

阅读更多...

GeneCompass：跨物种大模型用于破解基因调控机理

GeneCompass：跨物种大模型用于破解基因调控机理

GeneCompass是第一个基于知识的跨物种基础模型，该模型预先训练了来自人类和小鼠的超过1.2亿个单细胞转录组。在预训练过程中，GeneCompass有效整合了四种生物先验知识，以自监督的方式增强了对基因调控机制的理解。对多个下游任务进行微调&…

阅读更多...

SSM酒店信息管理系统-计算机毕业设计源码41731

SSM酒店信息管理系统-计算机毕业设计源码41731

摘要酒店信息管理系统是一种基于计算机技术的管理工具，旨在提高酒店业务效率和服务质量。该系统通过集成多个功能模块，实现酒店各项业务的自动化管理，包括客房信息管理、预订信息管理、入住信息管理、退房信息管理、续费信息管理等。该系统可…

阅读更多...

免费使用正版的Typora教程

免费使用正版的Typora教程

1.来到Typora官网下载安装。 Typora官网: https://typoraio.cn/ 2.激活主程序编辑修改Typora安装目录下文件下面展示文件目录路径 ： D:\SoftWare\Typora1.9.5\resources\page-dist\static\js\LicenseIndex.180dd4c7.4da8909c.chunk.js查找：e.hasAc…

阅读更多...

打通“链上数据脉络” 欧科云链数字生态建设成果凸显

打通“链上数据脉络” 欧科云链数字生态建设成果凸显

7月25日，据Coindesk报道，全球领先的区块链技术和服务提供商欧科云链宣布旗下OKLink浏览器与Polygon Labs正式达成合作，成为AggLayer首个区块链搜索引擎及Web3数据分析平台，将为开发者提供精简易用的链上数据访问和开发工具&#x…

阅读更多...

Python 中的正反斜杠用法详解

Python 中的正反斜杠用法详解

在Python编程中，字符串是一个常用的数据类型，字符串中的斜杠（反斜杠\和正斜杠/）具有特殊的用法和意义，本文将介绍这两种斜杠的用法。一、反斜杠的转义作用在Python中，反斜杠（\）…

阅读更多...

2024年必读高质量计算机编程书籍

2024年必读高质量计算机编程书籍

点击上方关注 “终端研发部” 设为“星标”，和你一起掌握更多数据库知识 1、推荐书籍：《Python Cookbook》理由：这本书是Python学习者公认的经典教程，由资深Python专家David Beazley编写。它不仅仅是一本Python语言的参考手册&am…

阅读更多...

【React 】开发环境搭建详细指南

【React 】开发环境搭建详细指南

文章目录一、准备工作1. 安装 Node.js 和 npm2. 选择代码编辑器二、创建 React 项目1. 使用 Create React App2. 手动配置 React 项目三、集成开发工具1. ESLint 和 Prettier2. 使用 Git 进行版本控制在现代前端开发中，React 是一个非常流行的框架，用…

阅读更多...

科学又省力宠物浮毛怎么去掉便捷高效？除毛秘籍养宠空气净化器

科学又省力宠物浮毛怎么去掉便捷高效？除毛秘籍养宠空气净化器

上次和朋友逛完街去她家，她家的猫哈基米一开门就飞奔过来，朋友直接抱起它狂亲。结果，猫毛和汗水粘得到处都是，手臂上、脸上都是，看得我这鼻炎星人直起鸡皮疙瘩。很多养宠物的朋友都说，天天给猫狗梳毛&#…

阅读更多...

C++-----多态

C++-----多态

一.对多态的解释场景：买车票时，学生是半价，军人要优先......,对于不同的人群，在同一个售票窗口会受到不同折扣，这就是多态的体现。上图就是多态的效果。为什么Ticket的参数是person类型，但却能接受不同…

阅读更多...

嵌入式初学-C语言-五

嵌入式初学-C语言-五

C语言语句概述 C语句的分类 ⑴ 控制语句用于完成一定的控制功能 ① if ( ) …… else …… ② for ( ) …… ③ while ( ) …… ④ do …… while ( ) ⑤ continue ⑥ break ⑦ switch ( ) ⑧ return ⑨ goto 标号 (无条件跳转语句) 说明：“( ) ”…

阅读更多...

Flutter Dio网络请求报错FormatException: Unexpected character

Flutter Dio网络请求报错FormatException: Unexpected character

最近开发Flutter项目，网络请求采用的是Dio框架，在发起网络请求的时候报错： 网络请求返回的数据为： var returnCitySN {\"cip\": \"127.0.0.1\", \"cid\": \"00\", \"cname\"…

阅读更多...

【漏洞复现】用友时空KSOA PreviewKPQT SQL注入漏洞

【漏洞复现】用友时空KSOA PreviewKPQT SQL注入漏洞

0x01 产品简介用友时空KSOA是建立在SOA理念指导下研发的新一代产品，是根据流通企业最前沿的I需求推出的统一的IT基础架构，它可以让流通企业各个时期建立的IT系统之间彼此轻松对话，帮助流通企业保护原有的IT投资，简化IT管理&…

阅读更多...

B站录播姬 v2.12.0 中文版

B站录播姬 v2.12.0 中文版

一个方便好用免费开源的哔哩哔哩直播录制工具。 B站录播姬是一款适用于B站的直播录制工具，该软件使用简单，功能强大，为你录制每一次的直播，用户只需要添加主播的直播号，当主播直播时，软件将自动为你录制直…

阅读更多...

文件包涵漏洞（ctfshow 无条件竞争）

文件包涵漏洞（ctfshow 无条件竞争）

Web78 payload: ?filephp://filter/readconvert.base64-encode/resourceflag.php Web79 <?php system(cat flag.php); Data协议写入内容读取 payload: ?filedata://text/plain;base64,PD9waHAgc3lzdGVtKCdjYXQgZmxhZy5waHAnKTs Web80 ?file/var/log/nginx/access.log…

阅读更多...

结构体，联合体，指针和浮点代码笔记

结构体，联合体，指针和浮点代码笔记

系列文章 : 深入理解计算机系统笔记文章目录系列文章3.9 异质的数据结构3.9.1 结构3.9.2 联合3.9.3 数据对齐 3.10 在机器级程序中将控制和数据结合起来3.10.1 理解指针3.10.2 应用：使用GDB调试器3.10.3 内存越界引用和缓冲区溢出3.10.4 对抗缓冲区溢出攻击3.10…

阅读更多...

（最新）华为 2024 届校招-硬件通⽤/单板开发——第十一套和十二套

（最新）华为 2024 届校招-硬件通⽤/单板开发——第十一套和十二套

（最新）华为 2024 届校招-硬件通⽤/单板开发——第十一套和十二套部分题目分享，完整版带答案(有答案和解析，答案非官方，仅供参考）（共十二套）（谢绝白嫖哈） …

阅读更多...

leetcode日记（56）文本左右对齐

leetcode日记（56）文本左右对齐

不难想但是很难写，需要考虑情况。我是先写出代码框架（先看一行可以加入接下来几个字母和对应空格，然后用空格数和字母数相除取模计算出字母间可以塞多少个空格，循环塞入这些空格和字母，添加进结果中）&…

阅读更多...

推荐文章

最新文章