写给LLM新手的建议,让你少走2年弯路!

news2024/11/15 6:55:02

大模型的爆火,在全球范围内引发了一场A1“狂也在业界点燃了一场百模大战。结合蕞近飙”,两年我在大模型领域的一些经验,分享一下在校学生/新人如何转到大模型阵营

在这里插入图片描述

1、大模型有哪些从业方向?

首先你可以在求职网站搜索一下“大模型关键词,看一下招聘JD,基本可以了解现在业内对大模型工程师的需求方向和能力要求,总结一下,大致可以分为4类:
1.做数据的(大模型数据工程师,爬虫/清洗/ETL/Data Engine
Pipeline)
2.做平台的(大模型平台工程师,分布式训练大模型集裙/工程基建)3.做应用的(大模型算法工程师,搜/广/推/对话机器人/AIGC)4.做部署的(大模型部署工程师,推理加速/跨平台/端zhi能/嵌入式)

从目前的业内情况来说,预训练大家基本不做了,因为太耗钱,且一直有更好的开源基座在推出,其它家只需要在基座上微调即可,没必要每家公司都做基座。

数据是每个算法工程师的基本能力,不管做什么算法方向都需要有数据的sense,这个就不多说了

评估方向,如果感兴趣,建议去智谱做,智谱出了很多benchmark,且智谱不算是商业公司,更多是学校和研究院的风格,不太卷,毕竟背靠清华

目前业界招人的大头,基座方向聚焦在后训练的人才,以SFT和DPO对齐为主,应用方向聚焦在Agent

2、大模型的入门学习路线应该是怎样的?

不同人的基础/背景/学习经历是不同的,针对
1.目前工作0-2年,想转行大模型的职场人
2.还在读书的学生,主动/被动转到大模型方向3.对大模型有兴趣,但仅仅想了解它的历史和发展,暂时还无转行想法,考虑考虑再决定
4.纯粹好奇世界上目前最火爆的技术

学习路线如下:

第一阶段:从大模型系统设计入手,讲解大模型的主要方法;第二阶段:在通过大模型提示词工程从Prompts角度入手更好发挥模型
的作用;
第三阶段:大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段:大模型知识库应用开发以LangChain框架为例,构建物流行
业咨询智能问答系统;
第五阶段:大模型微调开发借助以大健康、新零售、新媒体领域构建适
合当前领域大模型;第六阶段:以SD多模态大模型为主,搭建了文生图小程序案例;第七阶段:以大模型平台应用与开发为主,通过星火大模型,文心大型等成熟大模型构建大模型行业应用。

3、最后总结一下,给准备入场大模型的新人几点小的建议:

1.不要只关心微调,SFT,RLHF,作为系统性学习是OK的,切忌花太多精力。
2.想做应用的,建议集中到某个垂直领域比如对话机器人,问答系统,金融/医疗/教育方向,找一个具体的场景,把它做好,做深。3.多关心数据,数据管道,高质量训练/测试集的构建经验,对数据的感觉,是最直接,也是最适合用到未来工作当中的。4.大模型不只有算法,也可以有工程。大公司拼的都是基建,平台是对业务的支撑,牛逼的基础设施是大模型产品成功不可或缺的因素。

如何学习AI大模型?

大模型时代,火爆出圈的LLM大模型让程序员们开始重新评估自己的本领。 “AI会取代那些行业?”“谁的饭碗又将不保了?”等问题热议不断。

不如成为「掌握AI工具的技术人」,毕竟AI时代,谁先尝试,谁就能占得先机!

但是LLM相关的内容很多,现在网上的老课程老教材关于LLM又太少。所以现在小白入门就只能靠自学,学习成本和门槛很高

针对所有自学遇到困难的同学们,我帮大家系统梳理大模型学习脉络,将这份 LLM大模型资料 分享出来:包括LLM大模型书籍、640套大模型行业报告、LLM大模型学习视频、LLM大模型学习路线、开源大模型学习教程等, 😝有需要的小伙伴,可以 扫描下方二维码领取🆓↓↓↓

👉[CSDN大礼包🎁:全网最全《LLM大模型入门+进阶学习资源包》免费分享(安全链接,放心点击)]()👈

学习路线

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

在这里插入图片描述

👉学会后的收获:👈

• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。

在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2092601.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

重卡智能充电机器人

产品介绍 随着新能源电池行业的发展,越来越多码头、矿山等场景的重型卡车都改为新能源供电形式,由于新能源重卡充电电压为1.2MW,充电口离地1.8m,充电枪充电线缆重量为50kg,人工操作难度大、危险性大,所以我…

arcpy将数据库要素类添加到图层组以及创建要素收藏夹如何创建文件夹并将模板中的符号添加到文件夹中

🏆本文收录于《CSDN问答解惑-专业版》专栏,主要记录项目实战过程中的Bug之前因后果及提供真实有效的解决方案,希望能够助你一臂之力,帮你早日登顶实现财富自由🚀;同时,欢迎大家关注&&收…

算法基础-位运算

>> (右移运算) x >> y:表示将x的二进制值右移y位。 正数是直接右移y位,则高位(最左边)补y个0。 负数是求补码,然后右移y位,最高位补y个1,再求反码&#xff…

react|useState的异步渲染

useState 组件里面的变量可以用state来表示,setState函数是用来更新state的值的用法 let [age,setAge]useState(0); // 0是变量age的初始值异步渲染 setState是异步指定的。也就是setAge是异步执行的。执行但不是立刻渲染,而是进入到微任务队列。注意…

数值分析笔记(六)非线性方程求根

非线性方程求根 二分法 二分法是线性收敛的。 不动点 对于非线性方程 f ( x ) 0 f(x)0 f(x)0,将其转化为 x φ ( x ) x\varphi(x) xφ(x),若 x ∗ x^* x∗满足 f ( x ∗ ) 0 f(x^*)0 f(x∗)0,称 x ∗ x^* x∗为 φ ( x ) \varphi(x) φ…

基于ASO-BP原子探索优化BP神经网络实现数据预测Python实现

本文提出了一种基于ASO算法优化BP神经网络的数据预测方法。通过ASO算法对BP神经网络的权值和阈值进行优化,克服了BP神经网络易陷入局部最优解和对初始权值敏感的缺点。实验结果表明,优化后的BP神经网络在预测精度上得到了显著提升,为数据预测…

【数学建模学习手册】python基本入门使用

本专栏内容为:数学建模原理 记录学习数学建模 💓博主csdn个人主页:小小unicorn ⏩专栏分类:数学建模 🚚代码仓库:小小unicorn的代码仓库🚚 🌹🌹🌹关注我带你学…

【三维重建】三角网格中轴骨架线提取

三维网格中轴线提取 方法介绍实现提取 三维网格中轴线提取是计算机图形学和三维建模领域中的一个重要技术,它对于理解三维形状的拓扑结构和几何特性具有重要意义。 方法介绍 以下是几种常见的三维网格中轴线提取方法: 基于距离变换的方法 基本原理&…

海康二次开发笔记10-独立Group导入、导出及执行

独立Group导入、导出及执行 1. 界面设计 2. 添加引用 Group相当于VM中的模块,因此在调用相关接口函数前,需要引用对应的动态库IMVSGroupCs,同时将复制本地的属性改为False using IMVSGroupCs;3. 添加VmSingleModuleSetConfigControl控件 拖入控件后,设置Dock为Fill 4. 选择G…

算法的学习笔记—把数字翻译成字符串

😀前言 在日常生活中,我们经常会遇到各种编码和解码的问题。今天,我们将讨论一个有趣的问题:如何将一串数字翻译成字母,并计算出有多少种不同的翻译方法。 🏠个人主页:尘觉主页 文章目录 &#…

虚拟化设置和虚拟机相关的环境搭建

目录 0.首先声明 1.背景知识 ​编辑 2.虚拟化设置 3.安装vm15.5过程 4.安装虚拟系统 4.1下载centos7.6 4.2安装centos7.6 5.我的总结 6.我的体会 0.首先声明 我的这个教程参考的就是韩顺平老师的这个linux学习教程,但是这个韩老师的这个教程就是2020年的教…

算法如何应用,思路都在这

目录 01 问题定义 02 问题建模 03 特征工程 04 模型选择 05 模型融合 本文深入探讨了算法在不同领域的应用方法和背后的思考逻辑。作者夏师傅通过丰富的案例分析,揭示了算法如何助力产品决策、优化业务流程,并提供了实用的策略和技巧。无论您是技术专家还…

2024 年 Web 开发者必备的 30 款 CSS 工具

2024 年 Web 开发者必备的 30 款 CSS 工具 | 瑆箫博客 找到合适的 CSS 工具可能需要花费不少时间,但是这份 2024 年最棒的 30 款 CSS 工具清单,可以让你的选择变得轻松许多。无论你的 CSS 技能水平如何,这份清单都能提供调试、优化代码和提升…

Bazel 快速入门与核心知识

Bazel 快速入门与核心知识 Bazel 简介 Bazel 是一款与 Make、Maven 和 Gradle 类似的开源构建和测试工具。 它使用人类可读的高级构建语言。Bazel 支持多种语言的项目 (C/C, Java, Python, …),可为多个平台构建输出。Bazel 支持跨多个代码库和大量用户的大型代码…

2024怎么选蓝牙耳机性价比品牌?四款小白必看优选王炸机型推荐!

如今国人对蓝牙耳机的选择日益重视,蓝牙耳机作为智能的手机备件,普及率也是一升再升,但市面上很多品牌虽然宣传自己音质好和佩戴感舒适,其实性能不佳,那么2024怎么选蓝牙耳机性价比品牌?身为资深的蓝牙耳机…

复变函数在大模型中的应用

1. 导入 说来惭愧,我研究生时的研究方向是复分析,但毕业近十年来几乎没用到它。 我还记得实习时做自我介绍时,我说我的研究方向是复分析。面试官不太了解,我便解释说,这是关于对 -1 开平方得到的虚数 i 的研究。 在…

信号的捕捉

1.信号的产生 信号递达:实际执行信号的处理动作称为信号的递达 信号未决:信号从产生到递达之间的状态 进程可以阻塞某个信号 被阻塞的信号产生时将保持在未决状态,直到进程解除对此信号的阻塞,才执行递达的动作 注意,忽略和阻塞是不同的,只要信号阻塞就不会被递达,而忽略是递达…

【Apache Doris】数据均衡问题排查指南

原文阅读:【巨人肩膀社区博客分享】【Apache Doris】数据均衡问题排查指南 一、前提概要 当集群处于以下几种情况时,可参考本文进行问题排查。 •BE节点之间的数据不均 •单个BE节点上的多个磁盘之间的数据不均 •BE节点的上线和下线进度卡死&#…

《高等代数》两条线行列式

说明:此文章用于本人复习巩固,如果也能帮助到大家那就更加有意义了。 注:两条线行列式的固定做法为按照第一列展开。

Kafka分布式集群部署实战:跨越理论,直击生产环境部署难题与解决方案,性能调优、监控与管理策略大揭秘,轻松上手分布式消息中间件

本文介绍kafka的集群如何部署和安装,1-4章理论知识,第5章详解集群的部署,部署Kafka之前需要先部署好分布式的Zookeeper,不喜欢理论的可以直接看第5章,欢迎大家一起探讨技术! Zookeeper集群部署参考文章&…