这段时间面试了很多家(共24家,9个offer,简历拒了4家,剩下是面试后拒的),也学到了超级多东西。
大模型这方向真的卷,面试时好多新模型,新paper疯狂出,东西出的比我读的快。
感觉比较硬核的岗位,尤其初创公司都是对好几个点都有要求的(应用,模型,框架,底层后端,硬件)。
目前大多数公司还是集中在语言模型,偏研究的方向会有多模态的预训练这意思。
多头注意力,频率太高了。coding轮,概念轮都考。复习的点包括:时间/空间复杂度,优化(kv-cache,MQA,GQA),手写多头代码。各种Norm,这个频率也不低,不过比较标准的内容,没有啥特意要说的,有的考手写,有的考概念和理解(为什么管用)。
还有BERT,GPT等比较主流大模型,一些细节,比如位置编码,训练loss,激活,架构些许不同这种。自回归重点。
我把它们都整理起来还有一份答案在后面,太多了,根本放不下
![在这里插入图片描述](https://i-blog.csdnimg.cn/direct/95eac36a976a47e294150563be8b4924.png)
这份《常考面试题总结》已经上传CSDN,还有完整版的大模型 AI 学习资料,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
PDF书籍: 完整版本链接获取
👉[CSDN大礼包🎁:《
常考面试题总结
》免费分享(安全链接,放心点击)]👈