卷,卷,卷。在当下整个 AI 领域,一切价值衡量标准仿佛都在经历一场恶性的通货膨胀……
让我们想象这样一个角色:
一个来自普通家庭的学生刻苦努力的完成了自己的学业。他在领域内的顶级会议中发表了多篇论文,并且其论文的创新性也得到了同行们的认可;他在业界做出了不小的成绩,为多个知名的开源项目做出了贡献,其所提出的方法也被广泛应用于生产实践……
我们该怎么评价这样一个角色?一所大学的知名教授?一名出色的研究学者?还是一位杰出的工程师?然而,如果把这个角色放置于 AI 领域中呢?
这可能是一位AI博士申请者。
在最近,在 Reddit 论坛中,这样一则帖子收获了诸多关注。
帖主是一位AI领域的博士申请者,在很好的完成了自己的大学学业的同时,也在 NLP 和 AI 领域内的诸如 EMNLP、NeurIPS、ACM、ACL 等多个顶级会议中发表过论文,收获了上百的引用。他也在业界积极工作,曾经是所在公司的『最佳 NLP 研究员』,并且为如 Pytorch 和 HuggingFace 等多个开源项目做出过贡献,收获了许多 Star。
然而,在这样一份光鲜的履历之外,当帖主拿着这样一份成绩单去申请 CMU、申请 Standford,申请许多其他的名校时,却在不断的遭遇滑铁卢。
3.5研究测试:
hujiaoai.cn
4研究测试:
askmanyai.cn
Claude-3研究测试:
hiclaude3.com
尽管在评论区中,许多热心的网友都仔细帮忙分析了帖主的情况,譬如一二三:
申请的都是最顶级的院校本身难度就非常高
帖主的个人陈述与动机信有可能没有写作好
个性原因导致无法与教授有效沟通等等
从这个个例的问题出发,许多网友却都纷纷发现:“AI 领域的博士申请正在变的越来越卷……”
在另一则帖子里,一位来自斯坦福计算机科学博士生,作为圈内人发言:“很多人都不了解现在顶尖博士项目的招生竞争有多激烈......”
“事实上我并不感到惊讶。顶级项目不仅仅关注出版物。来自著名/受人尊敬的教授的令人难以置信的强烈 LOR 以及与您想要合作的教师的个人关系更为重要。根据他们所说的(他们如何自己完成论文并且没有良好的推荐),他们没有这两个最重要的东西......”
在一个个“六边形战士”的背后,在完美的标准化考试成绩之外,这些博士申请者们又被迫过于“早熟”的打造自己的学术简历,刷高自己的 h-index,参与一个个会议,又不断的社交试图建立 Connection……却只是为了竞争获得一个博士学位的入学资格。
这位斯坦福博士生还提到, 行业大佬的推荐信,和想合作老师的关系也极其重要,另外本科和硕士的学校背景也必不可少。
“博士招生的竞争非常激烈,尤其是在顶尖学校。如今,大多数顶尖 ML 博士项目的录取者都拥有多篇出版物、大量引用、来自受人尊敬的研究人员/教师的令人难以置信的强大 LoR、与他们想要合作的教师的个人关系、其他研究相关的活动和成就/奖项,除了良好的 GPA 之外,通常本科生/硕士来自顶尖学校。
入行需要三思而后行,当然也不是所有专业的竞争都激烈,“NLP 和视觉等领域的竞争非常激烈,但机器学习理论的竞争相对较少。”
不想吓到/劝阻您,只是完全诚实和透明。情况每年都变得更糟(竞争呈指数级增长),我通常鼓励那些刚刚进入机器学习研究(希望/目标是攻读博士学位)、没有现有经验和出版物的人三思而后行或考虑一下其他选项TBH。
评论区还有人发出了这样的提问,
这位亲历者表示:申请人与实验室/教授的研究契合程度对最终的录取起决定性作用。
对于那些询问质量而不是数量的人,我想说数量可以帮助你通过早期的录取阶段(因为申请者太多,所以他们必须使用“简单/可量化的指标”来过滤类似数量的论文 - 除非你有诸如来自知名研究人员的联系或强有力的信件之类的东西),但后来主要是质量和研究契合度,因为个别教师会审查学生的个人资料(甚至深入阅读他们的一些论文)并进行一对一的交流-1 次采访。因此,数量是帮助你进入后期阶段的一件事,但质量(不仅仅是你的论文,还有推荐信和你的实际经验/潜力)对于最终的录取决定更为重要。
总之,对于博士生的选拔和录用已经是一件难以言说又过度复杂的事情。
对于顶级ML博士招生来说最重要的事情是:
与教授的联系和研究契合 >= 推荐信(最好来自顶尖研究人员或目标教师熟悉的人)> 出版物(质量)>出版物(数量)>=你的整体研究经验和成就 > SOP(只要整体研究契合度、推荐信和个人简介都很强,在我看来,只要写得不差,这就不那么重要了)>>> GPA(只要是体面的并且可以正常完成学业)慷慨的截止值,你会没事的)>> GRE /无论什么考试成绩(通常也是基于截止值,我认为自从Covid以来,大多数博士课程不再需要它们)
对此,你是怎么认为的呢?
我们到底期待着什么样的博士教育?
借着 Sora 作者被大家发现读博期间仅仅发表两篇论文,我们就已经讨论过一个所谓『科研价值观』的问题(Sora 作者被曝读博期间仅发表两篇论文,我们是否需要重塑科研价值观?)。而这样一个博士申请的问题,似乎又构成了另一个姊妹问题——
我们到底期待着什么样的博士教育?
从最朴素的意义上来讲,博士教育在很多语境下几乎被约等于科研训练。而如果我们将科研训练等同于“如何又快又好的制造一篇论文”,并把教授或是大学的职责定位为『教育者』,那么显然当下“手握多篇顶会一作却申博失败”的现象就是荒诞的。
虽然许多教授与大学具有『教育者』的身份,但是“如何评估教育的质量”是一个非常难以回答的问题,因此他们不得不被许多其他的目标所左右。比如教授需要发表论文来评职称争项目,比如大学需要论文发表来进行学科建设并维持排名,在这些目标下,博士教育事实上又并不等同于简单的科研训练。
伴随着这种卷,卷,卷。在当下整个 AI 领域,一切价值衡量标准彷佛都在经历一场恶性的通货膨胀……
1975 年,经济学家古德哈特针对英国货币政策提出了著名的『古德哈特定律』:一旦出于控制目的对其施加压力,任何观察到的统计规律都将趋于崩溃。这一定律后来被描述为当一个政策变成目标,那么它将不再是一个好的政策
博士培养体系首先需要从无效的内卷空转与恶意的收割利用中解放,而第一步所需要的,就是必要真正正确的科研价值观的指导。
引用“Slow Science”的概念,我们提到“科学需要时间来思考,科学需要时间阅读、需要时间失败”。
回到最开始的话题,无论博士申请是被接受还是被拒绝,这都无法成为定义申请人优秀与否的判书。最后引用帖子里评论区的一段话:“**It’s neither necessary nor sufficient for any of those things.**”
参考资料
[1]https://www.reddit.com/r/MachineLearning/comments/1c2x5mx/d_folks_here_have_no_idea_how_competitive_top_phd/
[2]https://www.reddit.com/r/MachineLearning/comments/1c2pnam/d_multiple_firstauthor_papers_in_top_ml/?share_id=SCIfRyrtexeka80r8Fmhp&utm_content=1&utm_medium=ios_app&utm_name=ioscss&utm_source=share&utm_term=1