怎样阅读NLP论文

news2025/1/14 4:54:44

经典的论文也是需要读的。并不是所有的论文都值得细读。论文不是从头赶着朝下读。

目录

    • 收集和组织论文
      • 收集
      • 组织
        • 1.通过会议的方式分类
        • 2.是否是arXiv上的文章分类(preprint or not)
        • 3.根据问题(推荐),方法和数据集分类
    • 选择更好的Paper
      • Conferences 会议
      • Relation 相关的文章
      • Citation 引用数
      • Influence 影响
      • Code 代码
    • 论文阅读顺序
    • 做记录

收集和组织论文

收集

基本上好的会议和相关的兴趣组,评测都被收录到ACL Anthology。也就是每年会议上的Paper都会在这个网站,网址如下:https://aclanthology.org/
在这里插入图片描述
点进去是主会,直接去搜关键词就可。
在这里插入图片描述
这里除了Paper原文还会有开会时作者讲的视频、software、code、会议海报。如果看NLP顶会的内容这些就差不多足够了,但这些会议会有延迟,至少会隔了几个月至半年。如果去找最新的这个方向上的Paper的话,arXiv 是不二之选,网址如下:https://arxiv.org/
在这里插入图片描述
这里说一下高级检索,
在这里插入图片描述
条件只有与或非,注意后边限定一下是All fields,Subject限定成Computer Science(cs) 也就是计算语言学,可以加一个or Abstract,如下
在这里插入图片描述
这样可以把名字中不含关键词,而摘要中含的也可以一并找出。

组织

1.通过会议的方式分类

在aclweb上点开就行,可以总结出这个方向在某一时间段的发展倾向性。

2.是否是arXiv上的文章分类(preprint or not)

arXiv需要自己手动去更新,看arXiv上的文章是否中了

3.根据问题(推荐),方法和数据集分类

推荐根据问题分类 这个在写Paper的时候重要

选择更好的Paper

看Conferences、Relation、Citation、Influence、Code。

Conferences 会议

顶会

Relation 相关的文章

找跟自己方向最最最相关的,不要把一大堆没有什么用的也拿过来看,纯属浪费时间。如果需要可以找这个方向的上级(父级)去找一些有共同之处的方法。

Citation 引用数

半年之内能上到三位数或者五六十 就是一篇不错的Paper

Influence 影响

在这个领域,每年在做的就是几个比较大的组,他们可能中的数量占百分之六七十。先看一看顶会审稿的AC,然后再添一添 找一下其他的。

Code 代码

这个大多数可以判断是不是一篇水论文。

论文阅读顺序

Abstract
Abstract+Introduction后半部分
Experiment+Conclusion
Do not just watch the title!
1.Abstract 在哪个任务上解决了什么问题,提的什么方法,什么样的数据集,最后获得了什么效果。
在这里插入图片描述
2.Abstract+Introduction后半部分
Introduction 前半部分是回顾前人的一些工作以及他们中间出现的自己想要去解决的问题,后半部分是稍微详尽的去描述自己所做的事情。图要看。
3.Experiment+Conclusion
结果要看,可能会有分析,值得学习分析的方法
4.Proposal
决定要精读时看,看有创新性的东西,看图,看公式(公式大多是在描述它的网型)
5.Do not just watch the title!
例如:Attention Is All You Need(Transformer)

做记录

在这里插入图片描述
在这里插入图片描述
到时候写文章时,Introduction中回顾前人所做时可以看哪些人提出了啥有啥问题。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/140340.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Ka波段卫星通信小尺寸无线电设计

传统Ka波段地面站卫星通信系统依赖于室内到室外配置。室外单元包含天线和块下变频接收机,接收机输出L波段的模拟信号。该信号随后被传送到室内单元,室内单元包含滤波、数字化和处理系统。Ka波段的干扰信号通常较少,因此室外单元的主要任务是以…

微信小程序开发整体过程整理

目录1微信开发相关介绍1.1微信公众平台1.2微信开放平台1.3注意事项2微信小程序开发整体介绍2.1微信小程序简介2.2小程序接入流程3框架简介3.1uni-app简介3.2学习使用uni-app3.3学习微信小程序开发4开发规范5开发示例5.1开发工具5.2开发调试5.2.1导入代码5.2.2项目运行5.2.3在微…

第三篇 - 对象的单层劫持

一,前言 上篇,介绍了 Vue 使用及数据初始化的流程 回顾一下,主要涉及以下几个核心点: initMixin 方法: 原型方法 Vue.prototype._initvm.$options:使 options 选项在 vm 实例上被共享initState 方法&…

c#入门-匿名函数,多播委托

匿名函数 如果一个函数的参数是一个委托类型。而你此刻没有合适的方法组使用&#xff0c;也不想为他专门声明一个局部函数。 则可以使用匿名函数。匿名函数的创建更为简单&#xff0c;语法为&#xff1a;返回类型 参数列表 > 函数主体 Func<int, string> func str…

人工智能OCR文字识别研究

1 研究背景 人工智能是研究开发能够模拟、延伸和扩展人类智能的理论、方法、技术及应用系统的一门新的技术科学&#xff0c;研究目的是促使智能机器会听&#xff08;语音识别、机器翻译等&#xff09;、会看&#xff08;图像识别、文字识别等&#xff09;、会说&#xff08;语音…

使用Jiralert实现AlertManager告警对接Jira

简介 Alertmanager 处理由客户端应用程序&#xff08;如 Prometheus server&#xff09;发送的警报。它负责去重(deduplicating)&#xff0c;分组(grouping)&#xff0c;并将它们路由(routing)到正确的接收器(receiver)集成&#xff0c;如电子邮件&#xff0c;微信&#xff0c…

MMYOLO 自定义数据集从标注到部署保姆级教程

theme: juejin 来自社区 PeterH0323 投稿 AI 已经被应用到各行各业&#xff0c;现如今任何人都可以轻松基于开源框架快速搭建符合自身需求的 AI 应用。本文将基于 MMYOLO 开源框架&#xff0c;基于生活中收集的猫猫数据集&#xff0c;教你如何从零开始训练一个可部署检测模型…

TiCDC 源码阅读(二)TiKV CDC 模块介绍

内容概要 TiCDC 是一款 TiDB 增量数据同步工具&#xff0c;通过拉取上游 TiKV 的数据变更日志&#xff0c;TiCDC 可以将数据解析为有序的行级变更数据输出到下游。 本文是 TiCDC 源码解读的第二篇&#xff0c;将于大家介绍 TiCDC 的重要组成部分&#xff0c;TiKV 中的 CDC 模…

【C++】命名空间(namespace) 以及理解using namespace std

命名空间1.命名空间使用的背景1.背景2.命名空间的定义&#xff08;namespace&#xff09;2.1正常的定义2.2 命名空间可以嵌套定义2.3允许命名空间相同3.域作用限定符&#xff08;&#xff1a;&#xff1a;&#xff09;和命名空间的使用3.1域作用限定符&#xff08;&#xff1a;…

【nodejs】模块化

一、概念 1、模块化 编程领域中的模块化&#xff0c;就是遵守固定的规则&#xff0c;把一个大文件拆成独立并相互依赖的多个小模块 把代码进行模块化拆分的好处&#xff1a; 1、提高代码的复用性 2、提高代码的可维护性 3、可以实现按需加载 2、模块化规范 对代码进行模块化…

《CSS新世界》读书笔记

前言 本文为《CSS新世界》的读书笔记。推荐去读原著。 《CSS新世界》微信读书APP链接&#xff1a;CSS新世界-张鑫旭-微信读书 (qq.com) 1. 尺寸属性值&#xff1a;fit-content 描述 fit-content 不是一个属性&#xff0c;它是 css 尺寸系列属性的一个新属性值。可用在 wid…

lammps教程:旋转模型的技巧

大家好&#xff0c;我是小马老师。 本文介绍lammps翻转模型的方法。 在进行分子动力学模拟时&#xff0c;可能需要特定的面位于设定的方向。 如Al2O3的力学性能模拟中&#xff0c;需要分别对A、B、C面进行压痕或者摩擦模拟。 按照研究界面垂直z轴&#xff0c;并且面法线沿着z轴…

转转测试环境治理的高效能实践

文章目录1. 背景及需求1.1 系统架构的发展1.2 测试环境的需求2. 传统的测试环境解决方案-物理隔离3. 转转测试环境V1-改进的物理隔离3.1 稳定环境3.2 动态环境3.3 优缺点3.3.1 优点3.3.2 缺点4. 转转测试环境V2-基于自动IP标签的流量路由5. 转转测试环境V3-基于手动标签的流量路…

大数据挖掘-伤寒论和金匮要略(COVID-19用药启示录,1.4万字收藏)

来自Toby老师&#xff0c;大数据挖掘-伤寒论和金匮要略 大家好&#xff0c;我是Toby老师&#xff0c;三年来新冠病毒肆虐全球&#xff0c;带来一些列症状&#xff0c;例如发热&#xff0c;恶寒&#xff0c;咳嗽&#xff0c;咽喉痛&#xff0c;腹泻&#xff0c;心脑血管疾病等…

C语言_动态内存管理

目录 1. 为什么存在动态内存管理 2. 动态内存函数介绍 2.1 开辟内存块函数_malloc 2.2 动态内存释放和回收函数_free 2.3 开辟空间初始化元素为0的函数_calloc 2.4 调整动态内存开辟大小的函数_realloc 3. 常见的动态内存错误 3.1 对NULL进行解引用操作 3.2 对动态开辟…

aloam学习笔记(二)

学习aloam框架中前端对于点云部分的预处理和点面特征提取。 这些功能在scanRegistration.cpp部分实现&#xff0c;所以也是对于这个源码的学习。 一、main函数 从main函数开始分析。 首先整个完整的main函数内容&#xff1a; int main(int argc, char **argv) {ros::init(…

RSA、MD5加密解密算法全套解析安装教程

第一部分介绍加密解密算法&#xff0c; 第二部分介绍我小组成功应用的RSA、MD5两种加密解密算法&#xff0c;以及心得体会。 1、加密解密算法介绍 应用的开发中安全很重要&#xff0c;所以信息加密技术显得尤为重要。我们需要对应用中的多项数据进行加密处理&#xff0c;从而来…

(人工智能的数学基础)第一章特征向量与矩阵分析——第三节:特征向量与特征值

参考 3Blue1Brown系列&#xff1a;特征向量和特征值第十章 线性代数之 特征向量与特征值】3Blue1Brown知乎&#xff1a;线性代数的本质10 特征向量和特征值 文章目录一&#xff1a;特征向量与特征值概念引入二&#xff1a;特征向量与特征值概念求解三&#xff1a;特征向量与特…

谷粒学院——第七章、课程分类管理

EasyExcel 介绍 简介 Excel导入导出的应用场景 1、数据导入:减轻录入工作量 2、数据导出:统计信息归档 3、数据传输:异构系统之间数据传输 EasyExcel的特点 Java 领域解析、生成 Excel 比较有名的框架有 Apache poi、jxl 等。但他们都存在一个严重的问题就是非常的耗内存。…

Python数据分析三剑客之Pandas

写在前面的话&#xff1a; 开始之前请确保已经配置好python环境&#xff0c;并安装好第三方库pandas和numpy。 1. pandas库介绍 什么是pandas&#xff1f;pandas是提供高性能易用数据类型和数据分析工具的第三方库。简单讲&#xff0c;pandas主要作用有两个&#xff1a;提供了…