大模型LLM算法工程师技术面试指南

news2024/9/20 6:06:45

大模型LLM算法工程师技术面试指南

AI大模型全套学习资料
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】

在这里插入图片描述

写在前面

这个系列的笔记,将作为我过去一年多来在大模型领域一线实战的经验总结,以及作为大模型面试官的经验汇总,希望可以帮到更多打算踏入大模型算法领域的同学。

简要介绍一下自己的情况,8 年前通过自学入行人工智能,毕业加入阿里计算平台事业部,大规模机器学习系统,最近两年主要从事智能驾驶方向的大模型研究和实战。同时工作之余也做了一些算法教育相关的工作,辅导过一些学弟学妹。

为什么会想写这个系列

我是自学入行的,深知这里面的各种心酸,回想刚入门时,总是时不时在想,要是有人能将自己工作内容真实分享出来就好了。我准备面试时,也总是会想,要有个大佬能站在面试官的角度帮我分析一下这些题目就好了。

在我辅导过的学弟学妹中,大部分人也是同样的问题,因此才有了这个系列笔记的想法。我希望站在过来人的角度,给大家分享我的工作经验,还原大模型算法工作中用到的技术,以及从面试官的角度告诉你,为什么你的简历每次都石沉大海?为什么你每次面试都是炮灰?

为什么选择大模型方向

很简单,机会多,前景大

相比于深度学习等其他领域,大模型现在还处于洼地,有更大的需求。而且相比AI其他方向,大模型的优质资料实在太少,大多都是各种搬运和抄袭,很少有高质量的一线工作实战经验分享和面试总结

所以我会在24年重点做这一块,如果大家有什么好的建议,也可以私信我。

打算写哪些内容

目前的打算分成几个模块:工作实战、面试能力、技术概念、论文复现,大家有什么其他想看的,也可以私信我,尽量满足大家的需求

1. 工作实战

在工作实战这块,我会结合自己8年的算法工程师经验,给出一个大模型工程师的实际工作内容和技术要求

目前国内各家出了很多的国产大模型,但大部分公司做“基座”的并不多,更多的是聚焦大模型在各领域的落地

因此利用垂直领域数据+大模型微调是工作的重点

对于模型的选型,一定要结合公司的硬件架构水平来定,并不是越大越好

数据层面,大模型的微调对数据的质量要求非常高,这块花的时间往往占据60%以上

产品化层面,还要注重大模型的轻量化和大模型推理加速这些实战经验和技巧,平时多分析数据的badcase,总结问题,从业务数据的源头找到解决场景落地过程中问题的办法。

2. 面试能力

市面上有不少所谓的大模型面试题,不过说句实话,90%都比较垃圾,真实面试根本不会这么问

所以作为这个系列的重点,我会整理我作为面试官参与的多场大模型面试

精选出优质面试题目 【至少300道】 进行详细讲解

说明一下,这个讲解不仅仅是给个答案让你背下来那么简单,那样没多大意义

我会以面试官的视角告诉你,当面试官问出这个问题时,他想考察你什么?他期待的答案是什么?给你挖了哪些坑?在面试应该怎么引导面试官?

所谓知己知彼,搞清楚面试官的想法,你才能从更高维度去把控面试

很多同学看完之后就会恍然大悟,为什么你每次面试都被面试官血虐?为什么你每次面试都是炮灰?

3. 论文代码复现

很多同学可能认为进入产业界了,每天游走在各个繁忙的业务之间,根本没有时间看论文。

首先我想说,这个想法是极其错误的!

这么说吧,算法工程师是要求自我更新最快的一个工种。知识更新频率排序:算法工程师 > 软件工程师 > 硬件工程师

就拿大模型领域来说,如果你3个月没有追最新的论文,可能业界热点技术你就很难跟上了,除非花大量时间去恶补

对于我自己而言,基本每周都会follow最新论文列表,选择刷6~10篇不错的论文,花15~20分钟去速看

对于特别优秀的论文,我会花1个小时,甚至半天去精读,例如InstructGPT,DPO这种级别的,同时还会去复现论文思想,或者阅读相关的源码

如果看论文能理解到7分,那读完代码一定可以帮助你理解到9分

所以读到这里你不禁要问自己一个问题:为什么我掌握的深度不够?那一定是你论文读太少了。。

4. 技术概念

这块我会结合自己工作中的实际应用,尽可能的把大模型中的各种技术概念,做一个通俗易懂的讲解

大模型其实是很复杂的一个综合性领域,涉及的技术范围之广

首先你得会机器学习,还要会点深度学习,深度学习领域的NLP技术你必须得熟练掌握

然后就是大模型的预训练技术,提示工程技术,高效微调技术。。。

除了算法理论,你还得对工程架构和系统有所了解,因为随时有可能训练开发时遇到了问题要排查。

比如你要训练一个有几百亿参数的大模型,这时候你得上分布式来训练吧,所以就要了解分布式的通信技术,流水线技术,数据并行技术。

如果单个机器放不下,还需要用到模型并行技术,张量并行技术。如果发现训练速度太慢,一个任务要跑几个月,这肯定是不可接受的。这时候你还要会训练优化的技巧,比如访存优化相关的FlashAttention, PagedAttention, KV Cache,重计算等技术。

这还没完,模型距离真正产品上线还要做一个事儿,就是模型推理优化。达不到线上QPS怎么办?——优化你模型的模型延迟;吞吐率太小了怎么办?——优化你模型的并行度;模型太大了放不下怎么办?——减小模型的大小(量化/稀疏化/剪枝)。。把这些东西都完整的弄完了,这才算是一个合格的大模型产品上线了
在这里插入图片描述

第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
●大模型 AI 能干什么?
●大模型是怎样获得「智能」的?
●用好 AI 的核心心法
●大模型应用业务架构
●大模型应用技术架构
●代码示例:向 GPT-3.5 灌入新知识
●提示工程的意义和核心思想
●Prompt 典型构成
●指令调优方法论
●思维链和思维树
●Prompt 攻击和防范
●…
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
●为什么要做 RAG
●搭建一个简单的 ChatPDF
●检索的基础概念
●什么是向量表示(Embeddings)
●向量数据库与向量检索
●基于向量检索的 RAG
●搭建 RAG 系统的扩展知识
●混合检索与 RAG-Fusion 简介
●向量模型本地部署
●…
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
●为什么要做 RAG
●什么是模型
●什么是模型训练
●求解器 & 损失函数简介
●小实验2:手写一个简单的神经网络并训练它
●什么是训练/预训练/微调/轻量化微调
●Transformer结构简介
●轻量化微调
●实验数据集的构建
●…
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
●硬件选型
●带你了解全球大模型
●使用国产大模型服务
●搭建 OpenAI 代理
●热身:基于阿里云 PAI 部署 Stable Diffusion
●在本地计算机运行大模型
●大模型的私有化部署
●基于 vLLM 部署大模型
●案例:如何优雅地在阿里云私有部署开源大模型
●部署一套开源 LLM 项目
●内容安全
●互联网信息服务算法备案
●…
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2118273.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

防跌倒识别摄像机

防跌倒识别摄像机 是一种结合了人工智能技术和监控摄像技术的先进设备,旨在通过实时监测和分析监控画面中的行为动作,及时发现并预防跌倒事件的发生。这种摄像机在医疗、养老院、家庭等场所有着广泛的应用前景。 防跌倒识别摄像机在医疗领域具有重要意义…

社群空间站付费入群系统易支付版全套搭建教程

社群空间站9.9付费入群系统易支付版全套搭建教程 1.创建站点 2.搭建环境 php7.2 3.上传源码包 数据库批量修改sq9.dongge1.icu s10.dongge1.icu 改为你的域名 4.上传数据库 修改数据库文件/data/config/ 5.访问域名 6.账户密码 admin 123456 7.易支付修改地址是在/data…

SpringBoot2:请求处理原理分析-常用接口方法参数整理

文章目录 1、常用的原生API参数2、一些自带的复杂参数3、自定义Bean参数4、自定义参数转换服务5、总结 1、常用的原生API参数 作用说明:在接口方法参数放入一些原生API作为参数使用。 案例: 接口收参形式: RequestMapping("/test"…

16款facebook辅助工具,总有一款适合你!

Hey小伙伴们~👋 是不是想利用FB大展拳脚,却苦于不知道如何开始?别急,今天就给你们安利16个超实用的FB营销工具,涵盖了内容创建和发布的应用程序,以及数据追踪分析、商品销售等多个方面让你轻松get海外获客新…

浅谈:CDN下真实IP的暴露

免责声明:本文仅做分享! 目录 CDN简介: 国内常见CDN: 国外常见CDN: 判断CDN存在? 在线ping检测: nslookup: 寻找真实IP----> 1-DNS历史解析纪录 2-子域名查询 1.在线平台查询 2.工具爆破 3.搜索引擎 3-网站邮件头信息 4-S…

100个视频如何转换成1个二维码

使用场景描述:有50-100个视频,要实现扫一个二维码,就可以完整观看这50-100个视频的内容,这种情况下,可以使用列表专辑二维码功能来轻松实现。 使用步骤 STEP1 注册帐号 使用视频专辑列表二维码,您需要注册…

原生 iOS 引入 Flutter 报错 kernel_blob.bin 找不到

情况 在一次原生 iOS 项目中引入 Flutter 的过程中,在模拟器中运行出现报错: 未能打开文件“kernel_blob.bin”,因为它不存在。 如下图: 模拟器中一片黑 原因&解决方案 这个是因为 Flutter 的打包 iOS framework 命令中…

美国洛杉矶ip有哪些独特优势

美国洛杉矶的IP地址独特优势主要体现在以下几个方面,rak小编为您整理发布美国洛杉矶的IP地址独特优势,希望 对您选择服务器有帮助。 1. 丰富的IP资源:美国洛杉矶多IP服务器提供的IP数量从几十到几百不等,最多可提供多达511个独立I…

沃创云外呼系统有哪些具体的功能特点

沃创云 [云呼叫中心],新一代电销外呼系统 沃创云新一代电销外呼系统,提升接通率及降低封号率。 企业云通信-系统平台 沃创云电销外呼系统是一款适用于中小企业电话营销场景的云通信系统平台。 通过与中国移动、中国联通、中国电信三大运营商的紧密合…

Excel--不规则隔行填充底纹颜色

巧用条件格式快速给小计和总计行填充不同颜色。 先选择整个表格(选中第一行,按住Shift双击边框即可选中整个表格) 新建条件格式-使用公式确定要设置格式的单元格,输入$B3"小计:",设置格式&…

【go-zero】api与rpc使用etcd服务发现

准备代码 etcd先安装启动 目录结构 go mod init rpc/demo/v2 编写rpc 在user-rpc目录下 user.proto 文件 可使用goctl快速生成 goctl rpc -o user.proto syntax "proto3";option go_package"./pb"; package pb;message GetUserInfoReq {int64 id 1…

第二证券:怎么选出一只好股票?选对股票就能赚钱吗?

怎样选出好股票: 1、比较股票流动性,流动性是指股票成交的生动程度,能够通过股票成交量来判断。好的股票一般具有较高的流动性,这样能够下降流转成本。流动性差的股票在交易时价格可能存在较大的点差,这会添加出资者的…

ComfyUI【基础篇】:小白都可以学会的ComfyUI安装教程(秋叶版安装包)

大家好我是极客菌!!! 前面和大家分享过使用ComfyUI原生安装包在本地搭建ComfyUI环境。 今天和大家分享另一种在本地搭建ComfyUI环境的方式:使用秋叶大佬的安装包。 一. 秋叶大佬的安装包安装教程 (需要的同学可自行…

【个人博客hexo版】npm安装hexo时会出现的一些问题

目录 bug1 关于缓存地址和全局变量1.删除C:\Users\用户\下的.npmrc文件2.重新设置淘宝镜像 bug2 需要管理员权限解决办法 bug1 关于缓存地址和全局变量 之前修改过缓存地址和全局变量,卸载又安装了新版的nodejs,安装hexo时会弹出之前的缓存地址&#xf…

18057 ASCII码值之和的差

**思路**: 1. 读取两个字符串 s1 和 s2。 2. 计算每个字符串中所有字符的 ASCII 码值之和。 3. 计算两个字符串的 ASCII 码值之和的差。 4. 输出结果。 **伪代码**: 1. 读取字符串 s1。 2. 读取字符串 s2。 3. 初始化 sum1 和 sum2 为 0。 4. 对于 s1 中…

龙良曲pytorch笔记14-33

一、张量数据类型 张量维度含义0维标量1维向量2维矩阵3维时间序列数据 股价 文本数据 单张彩色图片(RGB) 例如,一个图像可以用三个字段表示: (width, height, channel) 3D 但是,在机器学习工作中,我们经常要处理不止一张图片或…

黑神话悟空幽魂怎么打?大头怪幽魂打法攻略!

黑神话悟空幽魂是第一章的一个非剧情头目,虽然不是妖王级别,但是实力强劲,一套小连招防不胜防,攻高血厚,稍不注意就会挑战失败,这里带来具体的打法技巧。 在游戏开始之前,我们必须要拥有一件完美…

Java 创建图形用户界面(GUI)入门指南(Swing库 JFrame 类)概述

概述 基本概念 Java Swing 的架构 Java Swing 是一个为 Java 设计的 GUI 工具包,是 JAVA 基础类的一部分,基于 Java AWT 构建,提供了一系列轻量级、可定制的图形用户界面(GUI)组件。 与 AWT 相比,Swing 提…

录课软件哪个好用?真人出镜微课,让知识生动起来

在数字化教育的浪潮中,录课软件成为了教师和教育工作者不可或缺的得力助手。它们不仅帮助教师高效录制课程,还能通过真人出镜、动画元素和实地拍摄等多种方式,让知识传授更加生动有趣,下面就一起看看具体的方法吧。 录课软件1&…

PCI Express 体系结构导读摘录(四)

系列文章目录 PCI Express 体系结构导读摘录(一) PCI Express 体系结构导读摘录(二) PCI Express 体系结构导读摘录(三) PCI Express 体系结构导读摘录(四) 文章目录 系列文章目录第…