经典的论文也是需要读的。并不是所有的论文都值得细读。论文不是从头赶着朝下读。
目录
- 收集和组织论文
- 收集
- 组织
- 1.通过会议的方式分类
- 2.是否是arXiv上的文章分类(preprint or not)
- 3.根据问题(推荐),方法和数据集分类
- 选择更好的Paper
- Conferences 会议
- Relation 相关的文章
- Citation 引用数
- Influence 影响
- Code 代码
- 论文阅读顺序
- 做记录
收集和组织论文
收集
基本上好的会议和相关的兴趣组,评测都被收录到ACL Anthology。也就是每年会议上的Paper都会在这个网站,网址如下:https://aclanthology.org/
点进去是主会,直接去搜关键词就可。
这里除了Paper原文还会有开会时作者讲的视频、software、code、会议海报。如果看NLP顶会的内容这些就差不多足够了,但这些会议会有延迟,至少会隔了几个月至半年。如果去找最新的这个方向上的Paper的话,arXiv 是不二之选,网址如下:https://arxiv.org/
这里说一下高级检索,
条件只有与或非,注意后边限定一下是All fields,Subject限定成Computer Science(cs) 也就是计算语言学,可以加一个or Abstract,如下
这样可以把名字中不含关键词,而摘要中含的也可以一并找出。
组织
1.通过会议的方式分类
在aclweb上点开就行,可以总结出这个方向在某一时间段的发展倾向性。
2.是否是arXiv上的文章分类(preprint or not)
arXiv需要自己手动去更新,看arXiv上的文章是否中了
3.根据问题(推荐),方法和数据集分类
推荐根据问题分类 这个在写Paper的时候重要
选择更好的Paper
看Conferences、Relation、Citation、Influence、Code。
Conferences 会议
Relation 相关的文章
找跟自己方向最最最相关的,不要把一大堆没有什么用的也拿过来看,纯属浪费时间。如果需要可以找这个方向的上级(父级)去找一些有共同之处的方法。
Citation 引用数
半年之内能上到三位数或者五六十 就是一篇不错的Paper
Influence 影响
在这个领域,每年在做的就是几个比较大的组,他们可能中的数量占百分之六七十。先看一看顶会审稿的AC,然后再添一添 找一下其他的。
Code 代码
这个大多数可以判断是不是一篇水论文。
论文阅读顺序
Abstract
Abstract+Introduction后半部分
Experiment+Conclusion
Do not just watch the title!
1.Abstract 在哪个任务上解决了什么问题,提的什么方法,什么样的数据集,最后获得了什么效果。
2.Abstract+Introduction后半部分
Introduction 前半部分是回顾前人的一些工作以及他们中间出现的自己想要去解决的问题,后半部分是稍微详尽的去描述自己所做的事情。图要看。
3.Experiment+Conclusion
结果要看,可能会有分析,值得学习分析的方法
4.Proposal
决定要精读时看,看有创新性的东西,看图,看公式(公式大多是在描述它的网型)
5.Do not just watch the title!
例如:Attention Is All You Need(Transformer)
做记录
到时候写文章时,Introduction中回顾前人所做时可以看哪些人提出了啥有啥问题。