最近我们技术群的一位小伙伴,分享了他面试理想汽车大模型算法工程师的经历与经验。
今天整理后分享给大家,如果你对这块感兴趣,可以文末加入我们的技术&面试讨论群
一面(1.5h,感觉有点难)
自我介绍,讲一下大模型应用项目(我讲的nl2sql的项目)
项目背景,总体思路,解决什么问题,指标是什么
细节拆分:
1.数据集怎么构建的,什么规模,有没有质量评估
2.模型底座是什么,这些不同底座什么区别,什么规模
3.训练方法,用的什么sft,有什么不同,有什么优缺点,原理上解释不不同方法的差别
4.评估指标是什么,这些指标存在哪些问题
5.模型推理是怎么做的,有没有cot,tot等等,还是单轮
6.模型可控性如何实现,怎么保证可控性
7.模型部署的平台,推理效率怎么样,如何提升推理效率
8.有没有上线,面临什么问题,怎么解决
9.给一个总的输入输出样例,每一步包含什么prompt,多轮推理每一步输出什么结果,模拟一下,数据集格式是否要调整成这样,数据形式是什么,怎么拆分成多轮形式等等。。
到这里项目差不多了大概问了45 min
然后是八股+开放式问题
1.大模型前景
2.大模型主要存在的问题和解决思路(幻觉,定向编辑,继续训练等等)
3.大模型加速框架了解多少,知不知道原理 如何进行加速优化
4.为什么要用大模型做传统结构化解析任务 你对用大模型做这些事有什么看法
到这差不多1小时
最后是对最新的研究了解多少,看过多少最新论文等等
我本以为要结束了,但是,最后我们来做一道题吧
一个迭代法求根的题,反正当时已经神志不清了,好像没ac
二面(三天后, 45min)
感觉是部门leader,简单问了问项目,普通八股,大模型上线会有什么问题,占用多少资源,怎么优化等等,比一面简单一些。
技术交流群
前沿技术资讯、算法交流、求职内推、算法竞赛、面试交流(校招、社招、实习)等、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企开发者互动交流~
我们建了大模型面试与技术交流群, 想要进交流群、需要源码&资料、提升技术的同学,可以直接加微信号:mlc2060。加的时候备注一下:研究方向 +学校/公司+CSDN,即可。然后就可以拉你进群了。
方式①、微信搜索公众号:机器学习社区,后台回复:加群
方式②、添加微信号:mlc2060,备注:技术交流
用通俗易懂方式讲解系列
- 用通俗易懂的方式讲解:自然语言处理初学者指南(附1000页的PPT讲解)
- 用通俗易懂的方式讲解:NLP 这样学习才是正确路线
- 用通俗易懂的方式讲解:28张图全解深度学习知识!
- 用通俗易懂的方式讲解:不用再找了,这就是 NLP 方向最全面试题库
- 用通俗易懂的方式讲解:实体关系抽取入门教程
- 用通俗易懂的方式讲解:灵魂 20 问帮你彻底搞定Transformer
- 用通俗易懂的方式讲解:图解 Transformer 架构
- 用通俗易懂的方式讲解:大模型算法面经指南(附答案)
- 用通俗易懂的方式讲解:十分钟部署清华 ChatGLM-6B,实测效果超预期
- 用通俗易懂的方式讲解:内容讲解+代码案例,轻松掌握大模型应用框架 LangChain
- 用通俗易懂的方式讲解:如何用大语言模型构建一个知识问答系统
- 用通俗易懂的方式讲解:最全的大模型 RAG 技术概览
- 用通俗易懂的方式讲解:利用 LangChain 和 Neo4j 向量索引,构建一个RAG应用程序
- 用通俗易懂的方式讲解:使用 Neo4j 和 LangChain 集成非结构化知识图增强 QA