论文的正确打开方式—如何细读一篇论文分享

news2024/10/6 16:18:04

前段时间听了一个关于读论文的公开课,课上的老师讲的非常好,听完之后确实发现从以前看论文的没头没脑到现在的有了一些思绪的变化,所以特此整理了一下分享给大家,希望对大家有用。

在我们初次接触论文的时候,经常性的遇到以下一系列的问题:
①研究论文时无法透彻理解paper,不能复现代码
②无法提出创新优化方案,导致论文发不出
③还有无法按照技术演进思路,系统学习深度学习知识
④不知道从哪个论文资源平台找论文
所以,有的同学调侃:世上无难事,只要肯放弃

讲师从大家在学习paper面临的问题中,从7个角度给一些参考方法:

1、如何选择论文
2、查找论文的几个常用网址
3、如何筛选优质论文
4、如何精确查找已知论文
5、如何管理论文
6、如何阅读一篇论文
7、论文paper学习路径

1、如何选择论文

那目前论文每年新出的那么多,如果不会选,耗时耗力,所以第一点,如何选论文很重要,我们可以从论文类型角度看:

  • 综述论文
    第一个是综述论文,综述论文是对某一领域的研究历史和现状的相关方法、算法进行汇总,对比分析,同时分析该领域未来发展方向。所以,综述论文是适合入门一个新领域的首选,刚接触一个新领域,首先要读的就是综述类的论文
  • 专题论文
    第二个是专题论文,就是具体的算法、模型的提出。有了相关基础知识,我们就可以进入具体算法论文当中去学习其设计思路,实验技巧,代码实现等具体技术。
    但深度学习技术发展之快,每天都有成千上百的新论文,难免鱼龙混杂。所以需要挑出质量高的论文。读上百篇低质论文,不如精通一篇高质量论文

所以,如何选择高质量的论文,我们可以从以下几个方面入手:
① 选择高质量期刊会议:CVPR、ECCV、ICCV、AAAI、NIPS、ICLR、ICML等
② 选择高引论文:同行间普遍认可,参考,借鉴的论文高引论文表明了这篇论文中的方法在该领域内非常重要,这也是你在选择论文时一个非常重要的参考要素
③ 选择知名团队:因为知名团队的论文质量相对较高,例如 Yoshua Bengio、Yann LeCun、Geoffrey Hinton、 Andrew Ng等
④ 选择有代码论文:我们都知道 Talk is cheap.Show me the code。这句经典名言。有代码复现的论文,不仅质量有保证的,在你实操复现的过程中,才能得到及时的反馈和收获。毕竟很多论文的实验结果无法复现,那么我们读了可能也没什么作用。

2、如何查找论文

问题来了,去哪里找到我们要读的论文呢?
首先,推荐一个实用网站:paperwithcode,上面收集了大量论文及其代码实现,大家可以在上面寻找论文去阅读。
有些同学可能疑惑了,对于未知论文题目的论文,如何进行检索?
一般来说,我们只有关键词,想通过关键词来寻找相关论文来阅读,那么我们可以通过以下4种方法:
(1)通过知网寻找优质综述,快速入门,并通过参考文献收集大量论文题目
(2)通过搜索引擎,这里常用的有百度学术和google scholar,这些搜索引擎上能找到大量的相关论文
(3)arXiv,arXiv是预印本平台。现在大多数论文在发表之前都会先公布到arXiv上占坑。这是由于技术发展之快,论文等不到见刊,就需要先公诸于世,让大家先看到这个方法是作者提出来的
(4)到顶会中搜索相关关键词,紧跟技术发展

3、如何筛选优质论文

通过以上途径可以搜索到成千上万的论文,但是如何筛选优质论文呢?
那需要看论文所在的期刊是否优质,评判期刊优质的方法是看期刊影响因子

期刊影响因子是大家公认的期刊质量评判指标,它的计算方式是:
采用期刊前N年发表的论文被引数除以前N年发表的论文数,通常N=2或N=5

除了看IF,更方便快捷的方法也可以看期刊的分区,一区优于二区,二区优于三区,以此类推

在这里我们需要知道,分区的方式主要有两种,一种是JCR,一种是中科院。JCR是国际通用的方式,而中科院的方式仅在中国适用

以上方法是针对未知论文题目,我们应该从哪里找到论文

那如何精确查找已知论文呢?
这里给大家安利一个能绕过科研论文收费的神奇网站——sci-hub(注意:由于它这个神奇的功能,所以它的网址经常需要变动。)
打开网站,我们可以搜索URL,PMID,DOI或字符串就可以打开论文,进行阅读,下载。
(PMID是PubMed中收录的文献编号,并且是唯一的。DOI是数字对象标识符,每一篇论文都有这个编号,相当于论文的数字身份证,我们可以通过DOI快速的锁定论文。)
在这里插入图片描述
我们可以看一看两篇经典论文的DOI,DOI分为前缀和后缀,后缀是颁发机构。举个栗子,从下面图中我们可以看到,这两篇论文都出自CVPR
在这里插入图片描述
在这里插入图片描述
2、百度学术的文献互助功能。通过搜索,点击求助文献,等待有资源的朋友上传论文就可以了。这个功能还是比较实用,比较快捷的
在这里插入图片描述
3、其他领域
知网:寻找优质综述,快入入门
google scholar:scholar.google.com 构建知识体系
arXiv:arxiv.org 论文预印本(preprint)平台
关注顶会:CVPR、ECCV、ICCV、AAAI、NIPS、ICLR、ICML等

4、如何管理论文

我们学习的论文太多,所以需要论文的管理:
(1)PDF格式论文通过命名进行管理。推荐两种命名格式:
时间-作者-题名的方式, 或者时间-关键词-题名的方式。
将同一个作者的同一个研究进行归类,可以清晰的看出这个研究的发展。除了规范的命名,我们还需要将同类的论文放到同一个文件夹中,方便我们查找。
(2)论文管理软件:如果涉及成百上千的论文管理,那么推荐使用论文管理软件
常用的有endnote,mendeley,Zotero等等,大家可以根据需要自行下载安装管理软件。【这里提醒大家,endnote是收费的,mendeley是免费的,下面就是mendeley的界面,我们可以看到它可以很好的管理大量的论文。】

5、如何阅读一篇论文

【本节敲重点】首先,不同的人看论文侧重点不同:
① 刚入门的学员,这一类同学主要目的是学习论文中的知识点,所以要求面面俱到,尽量每个细枝末节都要学。
② 对于工业界中的工程师,则需要注重算法实现部分,要快速的从论文中知道如何复现算法,应用到自己的项目当中。
那么推荐的论文阅读方法是分为三步,首先 泛读,再精读,最后总结。再加上验证
(1)泛读
这里泛读的作用就是快速浏览,把握概要,如同吃火锅一样,一大桌菜,我们先看看桌上有哪些菜,哪些菜是要吃的,哪些是不吃的。比如,火锅底料我们就是不吃的啦~
泛读阶段,我们重点读标题、摘要、结论以及所有的小标题和图标。
下面我们举个例子,对论文进行快速浏览
在这里插入图片描述
这是一篇CV领域非常经典的论文Alexnet,我们先看题目,题目是Imagenet classification with deep convolutional neural networks,从题目我们知道这论文用深度卷积神经网络来做图像分类任务。

接着阅读摘要,我们可以了解论文的概要,清楚论文采用什么方法,解决什么问题,达到什么效果。接着我们要把论文所有的小标题给列出来,将论文大卸八块,了解论文都有哪些内容,就像前面那一桌子火锅,我们要先浏览每一个盘子里装的是什么菜

接着还要把论文的结论,所有的图片和表格进行浏览,更近一步了解论文中有哪些论证,举例,内容说明

在泛读之后,我们要达到的水平就是能回答以下这三个问题,这样才能算泛读完成。

第一问题,论文要解决什么问题?回想摘要我们就知道它是像要解决ILSVRC挑战赛中的分类任务

第二个问题,论文采用了什么方法?那么这篇论文采用了什么方法呢?其实在题目中就告诉我们了,采用的是深度卷积神经网络

第三个问题,论文达到什么效果?从摘要我们也能知道,论文在ILSVRC2012比赛中以15.3%的top5 error夺冠

以上就是对泛读之后进行自我评测的三个问题

泛读完成之后,对论文总体有了把握,接下来就是挑选精华部分进行阅读

前面提到在校生与工程师读论文之间是有差异的,更具体地就体现在精读部分

① 对于学员来说,要学习更多知识,做到面面俱到,那么论文中的所有内容都是你的精华,都需要仔细阅读,仔细去品

② 对于工程师而言,目标就是找到算法实施部分,了解算法如何实现,以及其中有哪些技巧,更偏工程的看待论文。对于精读完成后,我们要能够对所读段落了如指掌。这样才算完成精读

经过泛读精读,最后需要对论文进行总结。

总结是对论文的创新点、关键点和启发点进行摘抄记录。对于有写论文发论文需要的同学来说,这一步是至关重要的,对论文的总结是为课题提出创新点打下基础。 总结部分也是仁者见仁,在校生需要总结一切与写论文发论文有关的信息句子,对于工程师,可能更多的是总结算法实现的参数,步骤,实验细节等。

完成论文三步曲之后,我们需要对阅读效果进行一个验证

验证的方法其实很简单,就是回答三个终极问题,你是谁,从哪里来,到哪里去 最后也要知道这篇论文有哪些是可以借鉴的

最后,我们来看看论文结构,要知道论文都有哪些内容构成,每一部分会有什么信息。

这里总结为6个主要部分:

  1. 摘要,摘要主要讲论文简介,阐述工作内容,创新点,效果
  2. 引言部分介绍研究背景,研究意义,发展历程,提出问题
  3. 相关工作相关研究算法简介,分析存在的缺点
  4. 本文工作论文主要方法,实现细节
  5. 实验部分,介绍算法实现步骤及结果分析
  6. 探讨部分,论文结论及未来可研究方向

最后,如何更高效地阅读论文,并通过论文熟悉某个方向领域呢?

学习论文是一个系统性的工程,如何更高效地阅读论文,并通过论文熟悉某个方向领域呢?这就需要合理的学习路径

第一点,基础必不可少。这里总结了必备的基础知识,我们来看一下

1、Python基础:这是毋庸置疑的必备基础,我们后边代码实现就是基于python语言

2、数学基础:包含矩阵计算、概率论和信息论,矩阵计算在CV领域是必备知识,概率论与信息论在NLP中也是常见的概念

3、神经网络基础:由于深度学习属于神经网络,因此神经网络的内容必须要了解,特别地,对于CV领域CNN是很重要的,大多数CV任务已经被CNN统治,对于NLP领域而言,RNN是必不可少的知识

4、深度学习框架PyTorch:除了理论基础,实践的基础就是现在最热门的深度学习框架PyTorch,我们需要了解如何利用pytorch实现数据读取,数据增强,如何构建模型,如何设置损失函数优化器等等。而且PyTorch是现在最适合新手入门的框架,代码简洁易读懂,并且目前最前沿的技术,论文,大多数都有pytorch的实现,学会pytorch可以快速的紧跟前沿技术。

第二点,有了理论和实践的基础,就要针对CV和NLP两个方向进行选择,CV和NLP有着各自领域基础,大家要根据自己方向进行基础知识的巩固学习。对于CV领域,我们需要知道图像基础知识,图像的基本处理方法等等内容。对于NLP方向,我们需要了解什么是词袋,分布特征是什么,tfidf权重,等基础知识。

第三点,那我们巩固好理论、实践、方向领域上的基础之后,就可以进入论文的baseline cv方向,你应该选择领域内引用高,同行间普遍熟知的论文,包含alexnet vggnet googlenet resnet等等。

NLP方向的baseline,你应该选择开创性、引用高和应用到实际业务的论文,主要覆盖词向量、nlp深度学习主流框架和应用,预训练模型等主流方向,做到兼顾科研和工业应用平衡

第四点,熟悉了baseline论文,就算是入了门,就可以根据自己研究方向及感兴趣的方向选择性的学习专题论文。对于CV常见的有OCR、GAN、知识蒸馏、目标检测、图像分割等等。对于NLP有文本分类,句子匹配,关系抽取等等

从中找到你想要研究的专题是很重要的,如果你在初期阶段,对细分专题没什么概念,你也可以初步都学习了解一下,找到自己感兴趣的专题,针对特定研究方向,深入学习

最后分享一些找论文的地址

1、如果大家想看中文论文,可以以这几个期刊发表的论文为主去看,非核心类论文可以不用看了。
https://shimo.im/sheets/wV3VV02XgoFdx03y/MODOC/ 《一些国内中文核心/EI期刊

2、【怎么查某个论文是SCI?EI?是几区的SCI?】http://www.letpub.com.cn/index.php?page=journalapp&view=search

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/164628.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

《后端技术面试 38 讲》学习笔记 Day 12

《后端技术面试 38 讲》学习笔记 Day 12 31 | 大数据架构:大数据技术架构的思想和原理是什么? 原文摘抄 大数据技术其实是分布式技术在数据处理领域的创新性应用,本质和我们此前讲到的分布式技术思路一脉相承:用更多的计算机组成…

smart-doc的使用

smart-doc的使用 目录 1. 什么是smart-doc 2. smart-doc的功能特性 3. smart-doc自定义注释tag 4. 通过引入依赖生成文档 5. 通过集成smart-doc的maven插件生成文档 6. 生成Postman json文件与导入Postman测试 1. 什么是smart-doc smart-doc是一款同时支持JAVA REST API和…

MySQL监控(二): Prometheus入门

1.官网 OpenTelemetry - CNCF Prometheus官方文档 安装包下载页 Prometheus安装官方文档指引 2.安装mysqld_exporter (1)下载 mysqld_exporter下载 (2)配置文件 my.cnf [client] hostxx.xx.xx.xx port31090 userroot passwordroot(3)启动 启动命令: nohup …

关于常见排序的一些细节的理解

最近复习了一下十种基本的排序算法,但是发现有很多的细节理解不到位,不是忘了而是根本没理解。就比如为啥有的排序是不稳定排序,而有的排序的时间复杂度高等等问题。一、不稳定排序的稳定性分析和复杂度常见排序算法中有4种排序是不稳定的。快…

详解最近公共祖先(LCA)

看本博客前建议先看一下ST算法解决BMQ问题详解一,LCA概念最近公共祖先(Lowest Common Ancestors, LCA)指有根树中距离两个节点最近的公共祖先。祖先指从当前节点到树根路径上的所有节点。u和v的公共祖先指一个节点既是u的祖先,又是v的祖先。u和v的最近公…

php网上书城|基于PHP实现网上书店商城藉项目

作者主页:编程指南针 作者简介:Java领域优质创作者、CSDN博客专家 、掘金特邀作者、多年架构师设计经验、腾讯课堂常驻讲师 主要内容:Java项目、毕业设计、简历模板、学习资料、面试题库、技术互助 收藏点赞不迷路 关注作者有好处 文末获取源…

3分钟秒懂,最简单通俗易懂的spring bean 生命周期介绍与源码分析,附上demo完整源码

文章写作背景 最近突然身边很多小伙伴问我有没有spring bean生命周期的通俗移动的介绍 起初不太理解为什么,后来才想明白,哦对了,年底了,快开始跳槽季了,这不就是java八股文面试 的题目嘛,不得不说&#xf…

【5G RRC】Master Information Block (NR-MIB)

博主未授权任何人或组织机构转载博主任何原创文章,感谢各位对原创的支持! 博主链接 本人就职于国际知名终端厂商,负责modem芯片研发。 在5G早期负责终端数据业务层、核心网相关的开发工作,目前牵头6G算力网络技术标准研究。 博客…

手把手教你分析 Linux 启动流程

下载 Linux 内核网址: https://www.kernel.org/ 常用 Linux 内核源码为 4.14、4.19、4.9、5.10、5.15、6.1 等版本,其中 4.14 版本源码压缩包大概 90+M,解压后 700+M,合计 61350 个文件。如此众多的文件,用 source insight 或者 VSCode 查看都会比较卡,所以可以采用在线…

计算机网络第四章

1.网络层主要任务是把分组从源端传到目的端,为分组交换网上的不同主机提供通信服务,网络层传输单位是数据报三个功能:路由选择与分组转发(最佳路径)异构网络互联拥塞控制数据交换方式三种交换方式:电路交换…

一动不动是王八?动态内存有话说

文章目录前言动态内存函数介绍mallocfreecallocrealloc柔性数组柔性数组特点柔性数组的优点方便内存释放提高我们的访问速度总结前言 一动不动是王八,出自2014年的春晚,小时候经常喜欢说这句话,那在我们C语言中,我们知道&#xf…

年度征文|一个业余电脑玩家的30年(1992-2022)

《论语为政》:“五十而知天命”。岁月真的是一把刀,一晃已过不惑之年,还有几天就要进入知非之年。不论知非还是知天命,反正是花甲将至而从心所欲了。年少时因某种不合机缘,错与IT界擦肩而过,每每想起就扼腕…

gradel学习+IDEA配置

Gradle的下载 Gradle下载地址如下 https://gradle.org/releases/ 我自己的下载的7.4.2 可以选择下载完整的压缩包,将压缩包解压到自己指定的目录中即可。 Gradle安装 1、配置系统变量 GRADLE_HOME 2、配置环境变量 %GRADLE_HOME%是获取变量名称为GRADLE_HOME的…

项目看板开发经验分享(一)——光伏绿色能源看板

今天新开一个系列,专门介绍近期工作中开发的几个比较酷炫的看板的开发思路与经验分享。第一节我们就来介绍下这个光伏绿色能源看板,整体浏览如下: 那就直接进入正题吧—— 0、可复用组件panel 在讲解各个模块之前,我们先来完成一…

Mybatis 框架下 SQL 注入攻击的 3 种方式

SQL注入漏洞作为WEB安全的最常见的漏洞之一,在java中随着预编译与各种ORM框架的使用,注入问题也越来越少。 新手代码审计者往往对Java Web应用的多个框架组合而心生畏惧,不知如何下手,希望通过Mybatis框架使用不当导致的SQL注入问…

Node.js学习笔记

Node.js学习笔记 浏览器的内核包括两部分核心:DOM渲染引擎、JavaScript解析引擎。脱离浏览器环境也可以运行JavaScript,只要有JavaScript引擎就可以。 Node.js是一个基于Chrome V8引擎的JavaScript运行环境。Node.js内置了Chrome的V8 引擎,…

SpringBoot项目部署

系列文章目录 Spring Boot[概述、功能、快速入门]_心态还需努力呀的博客-CSDN博客 Spring Boot读取配置文件内容的三种方式_心态还需努力呀的博客-CSDN博客 Spring Boot整合Junit_心态还需努力呀的博客-CSDN博客 Spring Boot自动配置--如何切换内置Web服务器_心态还需努力呀…

Open3D SOR滤波(Python版本)

文章目录一、简介二、实现代码三、实现效果参考资料一、简介 SOR滤波过程相对简单,其原理是通过查询点与邻域点集之间的距离统计判断来进行过滤离群点。假设一个点的邻近点集符合正太分布,因此我们可以通过计算出该点到它所有临近点的平均距离meanD和标准…

国内怎么体验openAI chatGPT

怎么体验openAI chatGPT 一,前提 1,先准备好一个gmai的邮箱,注册时要用 2,(懂得都懂) 3,ChatGPT:网址 二,开始注册 1,sign up,用Gmail注册,我…

洛谷P8942 Digital Fortress

题目大意 给定一个区间,构造一个单调不减的序列,使得其前缀异或和与后缀异或和均单调递减,判断这种序列是否存在并输出任意一种解。 思路 暴力 dfs 当然会 TLE,所以我们要仔细分析: ① 在什么情况下异或和能够单调不减&#x…