科研人必看入门攻略(收藏版)

news2024/11/18 9:31:26

来源:投稿 作者:小灰灰

编辑:学姐

本文主要以如何做科研,日常内功修炼,常见科研误区,整理日常‘好论文’四个部分做以介绍,方便刚入门的科研者进行很好的规划。

1.如何做科研

1.1 选方向

当我们刚步入科研的第一步时,首选就要选择课题和方向,那么面对实验室很多项目和课题,一般选择方向需要一定的积累,而且很多题目风险性很高,所以要做的就有两个点,一个是多跟老师讨论,还有一个笨方法就是关注一下目前最顶级的研究机构,关注目前的主流模型,他们在做什么,那么我们就可以选择这个方向,并且实时监控他们的科研进展。

那么方向有了,那么就可以关注一些顶级会议的方向:

  • IR(信息检索):人工智能领域智能信息检索方向最权威的顶级国际会议(SIGUIR),国际计算机学会信息与知识管理大会(CIKM)

  • NLP(自然语言处理):ACL,NAACL,EMNLP,IJCNLP

  • ML&AI:NeurIPS

  • DM(数据挖掘):知识发现与数据挖掘顶级会议(SIGKDD)

  • CV(计算机视觉):ICCV、CVPR、 AAAI

  • ……

1.2 查找文献

知道了顶级会议的方向,那么就是如何找参考文献了,选择好方向之后,想要更快的知道本领域的研究内容:

  1. 可以先从中文综述入手找到合适的英文论文

  2. 对知识点的理解,可以借助知乎,csdn等平台巩固知识点

  3. 文献的下载可以使用google scholar,百度学术去查找,一般最新的论文一般百度学术检索不到

  4. 从论文找论文

  5. 从被引论文找相关论文

一般推荐几个网站:

https://paperswithcode.com/ ---查看论文是否有代码的网站

https://www.aminer.cn/ ---由清华大学计算机科学与技术系建立,收录了sci,ccf优秀论文

https://www.semanticscholar.org/ ---语义学者(Semantic Scholar)是由微软联合创始人 Paul Allen 做的免费学术搜索引擎。

当然也可以从本校的图书馆进去查找相关文献。

1.3 读文献

1.那么我们查找了好多文献,下载了很多,读不懂怎么办呢,首先可以和师兄,老师整理一下,本领域的单词,同时也可以看下b站上,有关读论文的一些视频,比如李沐的视频:https://www.bilibili.com/video/BV1H44y1t75x/?spm_id_from=333.337.search-card.all.click

2.平时不断积累本领域的一些方法,模型

3.从论文中找到本论文中是根据哪篇论文中的研究点,解决了哪些问题。

1.4 建立模型

那么论文大概读懂了,怎么落实行动,依靠代码实现出来呢?就要建立模型。初学者建议从工具使用入手熟悉模型的输入输出,逐渐了解模型背后的原理,对于特定的问题进行整理代码。

那么拿到一篇论文,我们要做好复现,对于初学者就是找到有代码的论文,理清从数据到模型一系列的输入输出数据流,选择自己的工具(pytorch,tensorflow)搭建简单的模型框架,这个过程一定要亲自动手,进行搭积木,从而了解模型背后的数学原理,尤其对一些常用的模型了解背后的数学原理,做到魔改,尤其是本方向的特定任务,要非常熟悉,从而进行创新。

1.5 设计实验

一般读论文开始要格外关注实验的设计,评测指标是否选择合理,在跑实验的时候,发现效果不好,要思考,为什么不好,是什么原因导致这种效果,你选择的模型的假设是否和数据有什么冲突,特别是面对效果很好的时候要稍加注意。

不要放弃,如果做不下去,说不定可以找到一些衍生的点。一定要总结,发现问题。

1.6 如何写论文

那么实验有了,要整理实验,准备写论文,写好论文

  1. 首先要逻辑过关,保证基本的语法,找出研究领域内的高频词,常用词和通用词,可以做一次系统性的语法学习

  2. 大量阅读论文,摘抄经典句子,通用句子,优美句子,可以先不要看摘要,练习复写摘要

  3. 可以先给老师讲清楚创新点,防止出现逻辑的一些突然转折,不清楚的问题。

2.日常内功修炼

2.1 读论文

从大量的论文中,分析出粗读论文和精读论文,一般每周精读3-5篇相关论文。那么要读到什么地步呢,就要从一篇论文回答以下的内容:

  1. 记住作者的名字,进而follow

  2. 记住题目,主要是为了防止可以尽快找到

  3. 要非常容易的说出本篇论文有什么缺点,毛病

  4. 很容易用一句话说出本篇论文为什么新,很容易发表,他的贡献点是什么。

  5. 可以很容易说出和这篇论文有类似的若干篇论文

  6. 很容易说出本篇论文的技术细节

  7. 很容易说出本篇论文的实验细节

  8. 最难的是怎么想着把本篇论文的创新点应用到本方向。

2.2 学机器学习

  1. 没事可以学习机器学习的东西,决策树,SVM,了解其中的背后的数学原理,

  2. 经常参加学术报告

  3. 系统上过一门机器学习公开课

  4. 数学推导写出简单的笔记当作是最终的理解,可以用白板推导。

  5. 以代码实现为最终掌握

2.3 写代码

  1. 必须掌握一门语言,一般难度的模型应该三天左右可以复现

  2. 找一个成熟的工具包或者代码库入手进行拓展,而且练习时要做到良好的代码风格。

  3. 做到复用

  4. 一定要做到代码开源,结果能够复现就好,平时多做积累

2.4 观察数据,收集数据

  1. 可以清晰准确快速的了解一个数据集合和自己当前任务的关系,比如有100个实验,那么就要做100次实验吗,如果能够做到对数据了解,那么里面有的方法可以推翻,不需要做实验,或者做实验的过程中,就可以判断这个方法的好坏,清晰预判一个方法在一个数据上的正确结果,哪些方法可以适用,哪些不适应,自己一定要清楚。

  2. 能够发现实验结果中的一些问题,进而总结实验中的一些规律,多看一些bad case,总结规律。 总结一下,在三年或者四年的学习中,你是否具备了以下条件:
    1.掌握一门编程语言,可以自己动手完成一个模型的主干框架的开发。
    2.熟悉基本的机器学习基础,要做到能够白板推导出来。
    3.掌握自己本方向自己之前从未做过的任务
    4.能够独立发表一篇本方向的相关论文,做到独立科研
    5.能够带领低年级同学做科研。

3.常见科研误区

  1. 不要认为ccf-a,一区的论文就是最好的,要辩证的看法,不要在于来源,学会找准创新点

  2. 不要认为调参能找到好结果,如果是好的方法,调参不应该很艰难

  3. 如果有一组参数效果很好,但是其他组参数都不太好,需要高度注意

  4. 不要把模型弄的过于复杂,要想办法提取核心的创新点。

  5. 不要搭积木,一个好的创新点要好于三个分散的创新点。

  6. 在投稿前都应该问一下,本文在这个工作中解决了什么问题,技术创新是什么,别人读了会有什么收获。

  7. 学会讲故事,营造问题。

4.赏析好论文

可以Language Models are Unsupervised Multitask Learners Language Models are Few-Shot Learners 这两篇论文自己赏析一下,找到好的句子,温故知新。

 关注下方《学姐带你玩AI》🚀🚀🚀

论文资料+比赛方案+面试经验all in

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/485562.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码

【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 32页和40页论文及实现代码 相关链接 (1)建模方案 【2023年第十一届泰迪杯数据挖掘挑战赛】A题:新冠疫情防控数据的分析 建模方案及python代码详解 &#x…

【初学人工智能原理】【4】梯度下降和反向传播:能改(下)

前言 本文教程均来自b站【小白也能听懂的人工智能原理】,感兴趣的可自行到b站观看。 本文【原文】章节来自课程的对白,由于缺少图片可能无法理解,故放到了最后,建议直接看代码(代码放到了前面)。 代码实…

《LearnUE——基础指南:开篇—2》——准备工作

目录 0.2.1 UE的获取与创建项目 0.2.2 UE4编辑器界面布局 1. 编辑器介绍 2. 新建蓝图与蓝图拖动 3. 菜单介绍 4. 工具栏介绍 0.2.3 学习资料 0.2.1 UE的获取与创建项目 登录UE官网:www.unrealengine.com 点击“登录”,如果没有账号&#xff0…

自动驾驶——离散系统LQR的黎卡提方程Riccati公式推导与LQR工程化

1.LQR Question Background 之前写过连续系统的黎卡提方程Riccati推导,但是考虑到实际工程落地使用的是离散系统,于是又进行了离散黎卡提方程Riccati的公式推导。 2.Proof of Riccati Equation Formula for Discrete Systems 工程化落地,就是使用公式(2-14)实时计算控制率…

Windows编译安装AzerothCore魔兽世界开源服务端Lua脚本引擎Eluna和防作弊anticheat模块教程

Windows编译安装AzerothCore魔兽世界开源服务端Lua脚本引擎Eluna和防作弊anticheat模块教程 大家好,我是艾西今天和大家聊聊魔兽世界游戏内的脚步以及防作弊模块 Eluna是azerothcore服务端的Lua脚本引擎,可以在原有azerothcore的基础上实现很多拓展以及…

Linux操作系统指令(1)

目录 一、什么是Linux操作系统?二、Linux基本指令12.1 ls指令2.2 pwd指令2.3 cd指令2.4 touch指令2.5 mkdir指令(非常重要)2.6 rmdir指令 && rm 指令(十分重要)2.7 man指令(非常重要)2.…

基于松鼠算法的极限学习机(ELM)回归预测-附代码

基于松鼠算法的极限学习机(ELM)回归预测 文章目录 基于松鼠算法的极限学习机(ELM)回归预测1.极限学习机原理概述2.ELM学习算法3.回归问题数据处理4.基于松鼠算法优化的ELM5.测试结果6.参考文献7.Matlab代码 摘要:本文利用松鼠算法对极限学习机进行优化,并…

设计模式-创建型模式-(工厂、简单工厂、抽象工厂)

一、简单工厂模式 上代码 public class FoodFactory {public static Food makeFood(String name) {if (name.equals("noodle")) {Food noodle new LanZhouNoodle();noodle.addSpicy("more");return noodle;} else if (name.equals("chicken")…

Java中的注解和反射

注解 在Java程序中,我们可以在很多地方看到注解,如一下情况: 注解有检查和约束的作用 内置注解 当被Deprecated注解修饰的方法被使用的时候,方法会被画上杠: 元注解 当我们打开一个注解的时候,可以看到以下这些信…

一份标准的软件测试方案模板

第一章 概述 ​ 软件的错误是不可避免的,所以必须经过严格的测试。通过对本软件的测试,尽可能的发现软件中的错误,借以减少系统内部各模块的逻辑,功能上的缺陷和错误,保证每个单元能正确地实现其预期的功能。检测和排…

ROS 视觉建图不显示点云

I 乐视摄像头找不到彩色输出(供参考) 1.安装依赖 sudo apt install ros-$ROS_DISTRO-rgbd-launch ros-$ROS_DISTRO-libuvc ros-$ROS_DISTRO-libuvc-camera ros-$ROS_DISTRO-libuvc-ros2.进入ROS摄像机目录 cd /home/wheeltec/wheeltec_robot/src/ros_…

[计算机图形学]动画与模拟:关键帧动画、质点弹簧系统、运动学与绑定(前瞻预习/复习回顾)

一、动画的简要概念 动画和语言一样,一开始都是作为传达信息的工具。什么是动画呢?简单的理解就是让画面变成“活的”,也就是让它们能够动起来,其次需要一定的美观。在图形学上,我们可以把动画理解为建模或者是几何的一…

1.1 n阶行列式子的定义

学习目标: 掌握n阶行列式的定义和计算方法,并能够解决相关的数学问题。 学习步骤: 学习n阶行列式的定义,需要一定的抽象思维能力和数学基础。 了解基本概念和性质:在学习n阶行列式之前,需要先了解行列式…

设计模式——工厂模式(简单工厂、工厂方法、抽象工厂)

是什么? 工厂模式的目的是将创建对象的具体过程隐藏起来,从而达到更高的灵活性 工厂模式分为:简单工厂模式、工厂方法模式、抽象工厂模式; 为什么? 在Java中,万物皆是对象,我们在使用的时候…

(8) 支持向量机(下)(模型评估指标、ROC曲线)

文章目录 1 二分类SVC的进阶1.1 参数C的理解进阶1.2 二分类SVC中的样本不均衡问题:重要参数class_weight 2 SVC的模型评估指标2.1 混淆矩阵2.1.1 模型整体效果:准确率2.1.2 捕捉少数类的艺术:精确度,召回率和F1 score2.1.3 判错多…

【fluent】axial、radial、tangentia的含义和区别,axial/radial/tangentia coordination表达的意义

Reference 本文主要参考fluent的官方文档。 ANSYS FLUENT 12.0 User’s Guide - 31.2 Velocity Reporting Options 笛卡尔坐标系——Cartesian coordinate system 不管什么坐标系,都要讲究维数。这个维数根据问题难度确定,对于3D问题需要用三维坐…

魔兽服务端编译部署NPCBots和 Al机器人模块教程

魔兽服务端编译部署NPCBots和 Al机器人模块教程 大家好,我是艾西。在平时自己一个人玩魔兽的时候是不是会比较无聊,因为游戏机制或副本难度自己一个人无法进行快乐的玩耍。今天艾西教大家编译部署NPCBots和 Al机器人模块,直接一个人玩魔兽也…

Python研究生组蓝桥杯(省二)参赛感受

为什么参加蓝桥杯? 今年是读研的第一年,看着我简历上的获奖经历“优秀学生干部”“优秀志愿者”“优秀毕业生”......大学四年,我竟然没有一次竞赛类的经历,也没有拿得出手的项目,我陷入了深深的焦虑。 听说蓝桥杯的…

FLstudio21支持中文语言及水果最新版本功能特点

水果的话,我用的版本是去年刚更新的FLstudio21,目前支持中文挺友好的,算很新的版本了。打开软件进入主界面,会看到如下图所示。FL Studio 21版不仅拥有非常多的音频编辑功能,而且这款软件还内置了丰富多样的插件&#…

云服务器部署python项目

前言:相信看到这篇文章的小伙伴都或多或少有一些编程基础,懂得一些linux的基本命令了吧,本篇文章将带领大家服务器如何部署一个使用django框架开发的一个网站进行云服务器端的部署。 文章使用到的的工具 Python:一种编程语言&…