2024 大模型面试指南:兄弟们,冲啊

news2024/10/7 2:30:05

前言

老宋这俩月又跳槽了,自从去年从百度出来来到新公司,躺了一年,最近因为大模型技术发展,重新有了奋斗的方向和动力。

大模型的诞生必然会重塑整个 NLP 方向,因此,必须参与到这波浪潮中,果然,这行就是得奋发向上,不然躺的时间久了真滴容易被时代抛弃。

话不多说,来聊聊这次的跳槽过程。

萌生跳槽想法


其实早在4月份左右就想跳槽,那时候其实想回大厂,但是当时题也没有刷,且在这家公司还没有呆够一年,于是迟迟没有下定决心跳槽,毕竟躺着是真舒服。

到了5月份,又发生了一些事情,整个人丧了下来,到了8月份才开始重整旗鼓,决定跳槽。当时跳槽的想法其实很简单:大模型这波浪潮必将引发生成式AI 接下来的发展,要是不懂大模型一整套东西,很容易被时代抛下。

面试过程


到了8月10号左右开始投简历,到10月初初步定了offer范围,这次战线拉的还是太长了,不过最后的结果符合我的预期。

整个的面试思路主要分为三个方向:

  • 方向1:先面试大模型应用方向,看看各个公司在应用端的思考

  • 方向2:面试大模型垂域基座方向,看看垂域的基座落地情况

  • 方向3:面试大模型基座方向,看看最顶级的基座是怎么做的

本次面试一大缺陷是,题是边面边刷的,前期很多面试都挂在题上了,后期倒是一面一个过。

第一波:8-9月


第一波主要投了一些中小厂公司,如知乎,360数科,新浪,伊对,面壁,以及阿里的几个NLP不强的部门如高德等。

第一波刚开始没有刷题,八股文也没怎么看,直接裸面,感觉很酸爽。

这一波主要还是积累面试经验,找找感觉,其中知乎和360数科很快发了offer,其余挂的原因如下:

  • 新浪:给不起钱挂了

  • 智谱:挂,题没做出来,不该这么早面的,这家水平蛮高的,值得重视。

  • 伊对:跟面试官气场不和,面试官有点傲气凌然的感觉,于是自己主动结束了面试

  • 面壁智能:题没做出来,挂了,这个不应该放在前期面,这家要求蛮高的,该好好准备的。猎头老催面试,真不能听猎头瞎说。

  • 阿里高德:三面挂,应该是我说不想做大模型在ner,分类方向的应用

  • 阿里优酷:题没做出来。

  • 天眼查:二面主动结束面试了。

  • 阿里 LAZADA:说不想做大模型在ner,分类的应用。

  • 作业帮:题没做出来。

  • 百度-语音语义一体化:跟大模型没关系,一面主动结束面试。

  • 百度电商:新部门,感觉风险大,二面主动结束面试。

  • 高途:二面主动结束面试

面了十多天,基本上俩offer,360数科和知乎,阿里一个没过也是出乎意料,打击了我的自信。跟知乎和360数科仔细聊了聊工作内容,果断拒掉了。

第二波:9-10月


此时,我注意到了刷题的重要性,开始迅速补齐短板,大概刷了200+道左右。接下来主要面了几家公司:

  • 阿里-夸克:挂,面了两次,题都出的忒偏了,出几何题,不知道是故意难为我还是就是这种风格,无缘。

  • 阿里淘天:三面主动结束面试,说是只有知识图谱方向了,我不想去。

  • 美团外卖:三面主动结束面试,非大模型基座方向。

  • 好未来:offer,大模型垂类基座,好未来有很强的转型需求,我蛮看好在教育场景落地的,没双减我就去了。

  • 字节-剪映:一面主动结束面试,去了做搜推,不太感兴趣。字节加班太多,因此我主要是以感受为主。

  • 中科创达:二面主动结束面试,车上的大模型,感觉风险有点大。

  • 金山云:offer。

  • 美团-语音交互部:二面主动结束面试。我有兄弟在里面,其实挺想去的,但是纠结了很久还是想做 50B 以上的model。

  • baichuan:一面主动结束面试,这家其实我很想去,因为我蛮看好的。但是跟面试官聊,面试官很着急,也不知道为啥,问的深度也不深,总是浅尝截止,还judge了我,我不太喜欢这种面试,就主动结束了。

  • 百度-文心一言 ernie 组:offer,本来非常想去。

拿完百度文心后,我就开始躺了,毕竟在我心中,百度文心是国内最顶级团队。但是跟经理聊了聊,发现做的方向不确定性很大,并且加班强度非常大,忍痛拒绝了。后面有其他非常好的团队约面我都拒绝了,面不动了。

总的来看,这次面试通过率前期比较低,主要还是挂在题上,后期基本都能过,主要是题刷够了。

还有一些非常牛逼的团队拒了我简历,因为我躺了一年,简历还是有所影响的,比如腾讯混元。

这次面试也有几个筛选标准,比如说太卷的不去如字节,太小的不去,钱少的不去等。

到此,面试就初步告一段落了,实在是面不动了,最后还是选了相对work-banlance的一家。

为啥不开卷?


这里有必要聊一聊我为啥不开卷。

首先就是奋斗的意义问题,众所周知,我国的税很高,五险也是税,那么涨工资的意义在哪呢?你累死累活都交税了,卷个屁啊。

其次就是生活问题,人这一辈子就活这么一次,总不能你回首往事时,发现自己的人生一大半都在学习和加班吧?

最后就是身体,懂得都懂。

本次面试教训总结


  • 要先刷够300道再面,不能直接裸面

  • 八股文先总结一遍,做到非常熟悉

  • 练手三家即可,圈定好核心面试的公司,别面太多家,太累了

  • 别去不知名的小厂,不然影响简历太严重

面试常见题


接下来我来讲讲面试中经常遇到的题,以及这些题的简单回答,主要包括:

  • 文本生成的重复问题

  • 介绍下 ChatGLM

  • 介绍下baichuan

  • 介绍下 CRF

  • 介绍下Deepspeed的zero

  • 介绍下 Adam的原理和思想

  • FP16,BP16区别

  • 介绍下 GLU 和 SwiGLU

  • 介绍下 Lora

  • 介绍下 Lamma 系列

  • 介绍下 Transformer

  • 介绍下 BART,以及 BART与T5的区别

  • BN 和 LN

  • 介绍下交叉熵

  • 几个位置编码的区别

  • 详细介绍下旋转位置编码

  • 简单介绍下分词方式

  • 用torch 实现欧氏距离

  • 三大并行方式

  • 大小王概率题

大家想要获得上述面试题的详细回答,可以下方获取

👉获取方式:

😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1589826.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HTTP快速面试笔记(速成版)

文章目录 1. HTTP概述1.1 HTTP简介1.2 HTTP的版本1.3 URL语法简介 2. HTTP报文2.1 HTTP报文格式2.2 HTTP的方法(Method)2.3 HTTP响应码2.4 HTTP请求头与响应头 3. HTTPS详解3.1 HTTPS介绍3.2 与HTTPS相关的加解密知识3.3 HTTPS交互流程 参考资料 1. HTTP…

2 万字 42 道Java经典面试题总结(2024修订版)- Java集合篇

目录 1、Java中常用的集合有哪些?2、Collection 和 Collections 有什么区别?3、为什么集合类没有实现 Cloneable 和 Serializable 接口?4、数组和集合有什么本质区别?5、数组和集合如何选择?6、list与Set区别7、HashMa…

基于深度学习的人脸表情识别系统(PyQT+代码+训练数据集)

基于深度学习的人脸表情识别系统(PyQT代码训练数据集) 前言一、数据集1.1 数据集介绍1.2 数据预处理 二、模型搭建三、训练与测试3.1 模型训练3.2 模型测试 四、PyQt界面实现 前言 本项目是基于mini_Xception深度学习网络模型的人脸表情识别系统&#x…

el-upload文件缩略图只显示一张图片

采用elementui库vue2版本,flask后端 el-upload组件上传一张图片之后不在出现新增加号 可以实现

基于公共转点的Alpha shapes有序边缘点提取

1、原理介绍 由Edelsbrunner H提出的alpha shapes算法是一种简单、有效的快速提取边界点算法。其克服了点云边界点形状影响的缺点,可快速准确提取边界点,其原理如下:对于任意形状的平面点云,若一个半径为a的圆,绕其进行滚动,其滚动的轨迹形成的点为轮廓点。需要注意的是,…

深入理解计算机系统 家庭作业 2.84

这题没有这个要求所以可以用 ? > : < 这种运算 以下代码用的是位级运算.因为我误解了题意 呜呜呜 想看用判断的代码请自行百度 ((((ux<<9>>9)<<((ux<<1>>24)-127)) - ((uy<<9>>9)<<((uy<<1>>24)-127)))>…

TMS320F280049 EPWM模块--TZ子模块(6)

下图是TZ子模块在epwm中的位置&#xff0c;可以看到TZ子模块接收内外部多种信号&#xff0c;经过处理后生成最终epwm波形&#xff0c;然后通过gpio向外发出。 TZ的动作有4个&#xff1a;拉高/拉低/高阻/不变。 TZ的内部框图见下图&#xff0c;可以看出&#xff1a; 1&#xf…

每日一题 — 水果成篮

思路&#xff1a; 通过阅读上面文字得出问题&#xff1a;就去只有两个种类的最大长度的连续子数组&#xff0c;这时我们可以想到用哈希表来存储数据&#xff0c;记录数据的种类和每个种类的数量。 解法一&#xff1a;暴力递归&#xff08;right每次遍历完都回退&#xff09; 解…

windows本地运行dreamtalk踩坑总结

dreamtalk是一个语音图片转视频的一个工具&#xff0c;就是给一段语音加一个头像图片&#xff0c;然后生成一段头像跟语音对口型的视频&#xff0c;其实还是很有意思的&#xff0c;最近阿里发布了一个类似的模型&#xff0c;但是还没开源&#xff0c;从展示视频看&#xff0c;阿…

Day31:贪心 LeedCode 455.分发饼干 376. 摆动序列 53. 最大子序和 蓝桥杯.填充

贪心算法一般分为如下四步&#xff1a; 将问题分解为若干个子问题找出适合的贪心策略求解每一个子问题的最优解将局部最优解堆叠成全局最优解 做题的时候&#xff0c;只要想清楚 局部最优 是什么&#xff0c;如果推导出全局最优&#xff0c;其实就够了。 假设你是一位很棒的家…

场景文本检测识别学习 day04(目标检测的基础概念)

经典的目标检测方法 one-stage 单阶段法&#xff1a;YOLO系列 one-stage方法&#xff1a;仅使用一个CNN&#xff0c;直接在特征图上预测每个物体的类别和边界框输入图像之后&#xff0c;使用CNN网络提取特征图&#xff0c;不加入任何补充&#xff08;锚点、锚框&#xff09;&…

QT系列教程(2) 创建项目和编译

新建Qt Widgets应用 我们启动qt creator 创建项目&#xff0c;选择Qt Widgets应用 接下来选择项目目录&#xff0c;项目名字就叫helloworld 构建系统选择qmake 我们创建一个名字为HelloDialog的类&#xff0c;继承于QDialog 构建套件选择你们安装的就行了&#xff0c;我这里选…

SV-704XT 100W网络有源音柱 校园广播音柱

SV-704XT 100W网络有源音柱 一、描述 SV-704XT是深圳锐科达电子有限公司的一款壁挂式网络有源音柱&#xff0c;具有10/100M以太网接口&#xff0c;可将网络音源通过自带的功放和喇叭输出播放&#xff0c;其采用防水设计&#xff0c;功率100W。SV-704XT作为网络广播播放系统的终…

嵌入式:第二天(C语言入门)

目录 一、基础语法 位运算符&#xff1a; & -&#xff08;与运算&#xff09; | -&#xff08;或运算&#xff09; ^ -&#xff08;异或运算&#xff09; ~ -&#xff08;取反运算&#xff09; << -&#xff08;左移运算符&#xff09; >> -&#xff0…

MyBatis 中的动态 SQL 的相关使用方法

为什么会有动态SQL&#xff0c;把SQL写死不是比较方便吗&#xff1f;其实有很多的举例&#xff0c;这里我那一个常见的来说&#xff0c;像我们用户注册&#xff0c;会有必填字段和非必填字段&#xff0c;有些传来的参数不一样&#xff0c;那对应的SQL也不一样&#xff0c;因此&…

【ctf.show】获得百分之百的快乐

1.打开靶场 2.根据页面代码&#xff0c;get请求值只能小于4位数&#xff0c;否则会回显hack&#xff01; 尝试后确实是这样的&#xff1a; 请求值小于4位数&#xff0c;页面无变化&#xff1a; 发送请求值ls查看内容 3.根据2返回的值&#xff0c;发送值为?1>nl 创建一个nl…

每日一练(力扣)

我的思路是暴力枚举: 情况1:相同&#xff0c;就让子串和原串同时后移继续比较 情况2:不相同&#xff0c;就只让原串后移 public int strStr(String haystack, String needle) {if (haystack.length() < needle.length()){return -1;}for (int i 0; i < h…

Java | Leetcode Java题解之第15题三数之和

题目&#xff1a; 题解&#xff1a; class Solution {public List<List<Integer>> threeSum(int[] nums) {int n nums.length;Arrays.sort(nums);List<List<Integer>> ans new ArrayList<List<Integer>>();// 枚举 afor (int first 0;…

Harmony鸿蒙南向外设驱动开发-Audio

Audio驱动概述 多媒体系统是物联网设备开发中不可缺少的一部分&#xff0c;Audio作为其中重要的一个模块&#xff0c;Audio驱动模型的构建显得尤为重要。 本文主要介绍基于HDF&#xff08;Hardware Driver Foundation&#xff09;驱动框架开发的Audio驱动&#xff0c;包括Aud…

2023年蓝桥杯——日期统计

目录 题目链接&#xff1a;1.日期统计 - 蓝桥云课 (lanqiao.cn) 题目描述 思路 代码思路 定义数据结构&#xff1a; 处理每一个月&#xff1a; 检查日期序列在num100中是否存在&#xff1a; 计数匹配的日期数&#xff1a; 输出结果&#xff1a; 代码实现 总结 题目链…