必备指南:人人适用的AI大模型学习路径!

news2024/11/30 0:48:58

23年 AI 大模型技术狂飙一年后,24年 AI 大模型的应用已经在爆发,因此掌握好 AI 大模型的应用开发技术就变成如此重要,那么如何才能更好地掌握呢?一份 AI 大模型详细的学习路线就变得非常重要!

由于 AI 大模型应用技术比较新,业界也没什么参照标准,打造 AI 大模型技术的学习路线并非一件容易的事,我和团队花费了6个多月时间,边整理、边摸索、边实践打造了业界首份 AI 大模型学习路线。

这份完整的AI大模型学习路线,都已上传至CSDN,需要的小伙伴可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费

在这里插入图片描述

AGI大模型应用开发学习路线

第一阶段 · 大模型开发基础

第一章:AI新篇章
  1. 为什么要学习大模型开发?
  2. 需要准备的工具和环境
第二章:大模型的训练与应用
  1. 大模型发展史
  2. 从大模型预训练、微调到应用
  3. GPT结构剖析
  4. 大模型家族、类别、应用场景
  5. RAG,Agent与小模型
第三章:大模型实操与API调用
  1. 通过API调用大模型
  2. 单论对话与多轮对话调用
  3. 开源模型与闭源模型调用
  4. ChatGLM,Baichuan,Yi-34B调用
  5. GPT,LLaMA模型调用
  6. 模型的部署、容器化
第四章:提示工程技术(1)
  1. 提示词的常见结构
  2. 提示词的模版化
  3. Zero-shot与Few-shot
  4. In-context learning
  5. Chain of thought prompting
第五章:提示工程技术(2)
  1. Tree of thought prompting
  2. Graph of thought promting
  3. Self-consistency
  4. Active-prompt
  5. Prompt chaining

第二阶段 · RAG基础与架构

第六章:RAG基础与架构
  1. 为什么需要RAG?
  2. RAG的经典应用场景
  3. RAG的经典结构与模块
  4. 向量数据库
  5. 检索与生成
第七章:【项目实战】基于RAG的PDF文档助
  1. 产品介绍与核心功能
  2. 技术方案与架构设计
  3. 文档读取和解析
  4. 文档的切分和文档向量化
  5. query搜索与文档排序
  6. 提示模版与大模型API接入
  7. 模型部署与Web应用
第八章:文档切分常见算法
  1. 根据每个Sentence切分
  2. 根据固定字符数切分
  3. 根据固定sentence数切分
  4. 根据递归字符来切分
  5. 根据语义相似度来切分
第九章:向量数据库常见算法
  1. 常用向量数据库以及类别
  2. 向量数据库与索引算法
  3. 到排表与搜索优化
  4. KNN与近似KNN
  5. Product Quantization
第十章:向量数据库算法进阶- HSNW
  1. HSNW算法在索引中的重要性
  2. NSW算法解读
  3. NSW图中的搜索问题
  4. Skip List讲解
  5. 具有层次结构的NSW
第十一章:【项目实战】基于RAG的新闻推荐
  1. 推荐系统原理、应用场景以及架构剖析
  2. 传统推荐算法与基于LLM推荐算法
  3. 新闻数据的准备与整理
  4. 推荐中的召回与精排
  5. 精排与Prompt构建
  6. 模型部署与测试

第三阶段 · RAG与LangChain

第十二章:LangChain基础应用
  1. 为什么需要LangChain?
  2. 通过一个小项目快速理解各个模块
  3. LangChain调用模型
  4. PromptTemplate的应用
  5. 输出格式设定
  6. Pydantic Object设计
第十三章:理解Function Calling
  1. 什么是 Function Calling
  2. 自定义输出结构
  3. 基于OpenAI调用Function Calling
  4. Function Calling的稳定性
  5. LangChain与Function Calling
第十四章:LangChain与Retrieval组件
  1. Document Loaders
  2. Text Splitters
  3. Text Embedding模型
  4. 常用的向量数据库调用
  5. 常用的Retriever
第十五章:LangChain与Chain组件
  1. 为什么需要Chain?
  2. LLMChain, Sequential Chain
  3. Transform Chain
  4. Router Chain
  5. 自定义Chain
第十六章:Advanced RAG(1)
  1. 经典RAG的几个问题
  2. Self-querying retrieval
  3. MultiQuery retriever
  4. Step-back prompting
  5. 基于历史对话重新生成Query
  6. 其他Query优化相关策略
第十七章:Advanced RAG(2)
  1. Sentence window retrieval
  2. Parent-child chunks retrieval
  3. Fusion Retrieval
  4. Ensemble Retrieval
  5. RPF算法
第十八章:基于RAGAS的RAG的评估
  1. 为什么需要评估RAG
  2. RAG中的评估思路
  3. 评估指标设计
  4. 套用在项目中进行评估
  5. RAGAS评估框架的缺点
第十九章:实战基于Advanced RAG的PDF问答
  1. 需求理解和系统设计
  2. 经典RAG架构下的问题
  3. 检索器优化
  4. 生成器优化
  5. 系统部署与测试

第四阶段 · 模型微调与私有化大模型

第二十章:开源模型介绍
  1. 模型私有化部署的必要性
  2. 中英开源模型概览与分类
  3. ChatGLM, Baichuan,Yi等中文开源模型
  4. LLaMA,Mistral系列英文开源模型
  5. 微调所需要的工具和算力
第二十一章:模型微调基础
  1. 判断是否需要模型微调
  2. 模型微调对模型的影响和价值
  3. 选择合适的基座模型
  4. 数据集的准备
  5. 微调训练框架的选择
第二十二章:GPU与算力
  1. GPU与CPU
  2. GPU的计算特性
  3. 微调所需要的算力计算公式
  4. 常见GPU卡介绍与比较
  5. 搭建GPU算力环境
第二十三章:高效微调技术-LoRA
  1. 全量微调与少量参数微调
  2. 理解LoRA训练以及参数
  3. PEFT库的使用
  4. LoRA训练硬件资源评估
  5. 认识QLoRA训练
第二十四章:【项目实战】基于ChatGLM-6B+LoRA对话微调模型
  1. 理解ChatGLM模型家族以及特性
  2. 导入模型以及tokenizer
  3. 设计模型参数以及LoRA参数
  4. 训练以及部署微调模型
  5. 测试微调模型

第五阶段 · Agent开发

第二十五章:Agent开发基础
  1. 什么是Agent
  2. 什么是Plan, Action, Tools
  3. 经典的Agent开源项目介绍
  4. 编写简单的Agent程序
  5. Agent目前面临的挑战与机遇
第二十六章:自定义Agent工具
  1. LangChain所支持的Agent
  2. 什么需要自定义Agent
  3. @tool decorator的使用
  4. 编写自定义Agent工具
  5. 编写完整的Agent小项目
第二十七章:深入浅出ReAct框架
  1. 回顾什么是CoT
  2. CoT和Action的结合
  3. 剖析ReAct框架的Prompt结构
  4. 从零实现ReAct(from Scratch)
  5. ReAct框架的优缺点分析
第二十八章:【项目实战】开源Agent项目
  1. 开源Agent项目以及分类
  2. AutoGPT项目讲解
  3. MetaGPT项目讲解
  4. 其他开源项目
  5. Agent技术目前存在的问题
第二十九章:深度剖析Agent核心部件
  1. Agent的planning
  2. Agent的reasoning
  3. Agent的knowledge
  4. Agent的memory
  5. Agent的泛化能力
第三十章:【项目实战】基于Agent的AI模拟面试
  1. 需求设计和系统设计
  2. 工具的设计
  3. AI面试中的深度询问方案设计
  4. 提示工程设计
  5. Memory的设计
  6. 智能体开发与部署
第三十一章:Agent其他案例分享
  1. AI旅游规划师
  2. AI产品销售
  3. AI房租推荐
  4. AI图像处理
  5. AI网站开发
第三十二章:其他Agent前沿应用
  1. 多个Agent的协同
  2. Agent的group行为
  3. Agent Society
  4. Agent的Personality
  5. 斯坦福小镇案例

第六阶段 · 智能设备与“小”模型

第三十三章:智能设备上的模型优化基础
  1. 智能设备特性以及资源限制
  2. 模型优化的必要性
  3. 常见的模型压缩技术
  4. 轻量级模型架构介绍
  5. 开源小模型
第三十四章:模型在智能设备上的部署
  1. 多大的模型适合
  2. 部署流程概述
  3. 模型转换工具
  4. 模型部署实战
  5. 性能测试与优化
第三十五章:边缘计算中的大模型挑战与机遇
  1. 边缘计算的概念和重要性
  2. 模型所要满足的要求与性能上的平衡
  3. 模型在边缘设备上的应用案例
  4. 未来“小”模型发展趋势
  5. 24年“小”模型机会

第七阶段 · 多模态大模型开发

第三十六章:多模态大模型基础
  1. 什么是多模态模型
  2. 多模态的应用场景
  3. DALLE-3与Midjourney
  4. Stable Diffusion与ControlNet
  5. 语音合成技术概述
  6. 主流TTS技术剖析
第三十七章:多模态模型项目剖析
  1. 多模态大模型最新进展
  2. Sora对多模态大模型会产生什么影响
  3. 案例:MiniGPT-4与多模态问答
  4. 案例:BLIP与文本描述生成
  5. 案例:Video-LLaVA与多模态图像视频识别
第三十八章:大模型的挑战与未来
  1. 大模型技术局限性
  2. 大模型的隐私性和准确性
  3. 大模型和AGI未来
  4. GPT商城的机会
  5. 多模态的机会
  6. 对于开发工程师未来的启示

一般掌握到第四个级别,市场上大多数岗位都是可以胜任,但要还不是天花板,天花板级别要求更加严格,对于算法和实战是非常苛刻的。建议普通人掌握到L4级别即可。

在这里插入图片描述

大模型&AI产品经理如何学习

求大家的点赞和收藏,我花2万买的大模型学习资料免费共享给你们,来看看有哪些东西。

1.学习路线图

在这里插入图片描述

第一阶段: 从大模型系统设计入手,讲解大模型的主要方法;

第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;

第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;

第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;

第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;

第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;

第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。

2.视频教程

网上虽然也有很多的学习资源,但基本上都残缺不全的,这是我自己整理的大模型视频教程,上面路线图的每一个知识点,我都有配套的视频讲解。

在这里插入图片描述

在这里插入图片描述

(都打包成一块的了,不能一一展开,总共300多集)

因篇幅有限,仅展示部分资料,需要点击下方图片前往获取

3.技术文档和电子书

这里主要整理了大模型相关PDF书籍、行业报告、文档,有几百本,都是目前行业最新的。
在这里插入图片描述

4.LLM面试题和面经合集

这里主要整理了行业目前最新的大模型面试题和各种大厂offer面经合集。
在这里插入图片描述

👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;

• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;

• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;

• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
在这里插入图片描述

1.AI大模型学习路线图
2.100套AI大模型商业化落地方案
3.100集大模型视频教程
4.200本大模型PDF书籍
5.LLM面试题合集
6.AI产品经理资源合集

👉获取方式:
😝有需要的小伙伴,可以保存图片到wx扫描二v码免费领取【保证100%免费】🆓

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2191801.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

R语言绘制散点图

散点图是一种在直角坐标系中用数据点直观呈现两个变量之间关系、可检测异常值并探索数据分布的可视化图表。它是一种常用的数据可视化工具,我们通过不同的参数调整和包的使用,可以创建出满足各种需求的散点图。 常用绘制散点图的函数有plot()函数和ggpl…

图解IP分类及子网掩码计算实例

一、什么是IP地址 在网络世界中,人们为了通信方便给每一台计算机都事先分配一个类似电话号码一样的标识地址,即IP地址。根据TCP/IP协议,IP地址由32位二进制数组成,而且在INTERNET范围内是唯一的。假如某台计算机IP地址为11000000…

基于SpringBoot vue 医院病房信息管理系统设计与实现

博主介绍:专注于Java(springboot ssm 等开发框架) vue .net php python(flask Django) 小程序 等诸多技术领域和毕业项目实战、企业信息化系统建设,从业十五余年开发设计教学工作☆☆☆ 精彩专栏推荐订阅☆☆☆☆☆不然下次找…

SpringBoot+ElasticSearch7.12.1+Kibana7.12.1简单使用

案例简介 本案例是把日志数据保存到Elasticsearch的索引中,并通过Kibana图形化界面的开发工具给查询出来添加的日志数据,完成从0到1的简单使用 ElasticSearch职责用法简介 ElasticSearch用在哪 ElasticSearch在我这个案例中,不是用来缓解增…

牛市以一个什么视角看它?

这波指数行情连续上涨,我说过我没有任何情绪波动,我不想称之为牛市,而是一个增量周期,这样的话我的语言里尽量去除一些欲望和情绪的表达,有利于去给大家讲一些股市的客观存在规律;我们知道熊市的本质是什么…

重庆数字孪生工业互联网可视化技术,赋能新型工业化智能制造工厂

重庆作为西南地区的重要工业基地,正积极探索和实践数字孪生、工业互联网及可视化技术在智能制造领域的深度融合,致力于打造新型工业化智能制造工厂,为制造业的高质量发展注入强劲动力。 在重庆的智能制造工厂中,数字孪生技术被广…

为什么要学习大模型?AI在把传统软件当早餐吃掉?

前言 上周末在推特平台上有一篇写在谷歌文档里的短文,在国外的科技/投资圈得到了非常广泛的浏览,叫做 The End of Software(软件的终结), 作者 Chris Paik 是位于纽约市的风险投资基金 Pace Capital 的创始合伙人&…

【预备理论知识——2】深度学习:线性代数概述

简单地说,机器学习就是做出预测。 线性代数 线性代数是数学的一个分支,主要研究向量空间、线性方程组、矩阵理论、线性变换、特征值和特征向量、内积空间等概念。它是现代数学的基础之一,并且在物理学、工程学、计算机科学、经济学等领域有着…

字符串和字符数组(2)

6.求字符串长度 C语言中有一个库函数叫strlen,这个函数是专门用来求字符串长度的。strlen的使用需要包含一个头文件string.h。 strlen函数统计的是字符串中\0之前的字符个数,所以传递给strlen函数的字符串中必须得包含\0. 请看代码: #inc…

AFSim仿真系统 --- 系统简解_04 Mystic(“情报处理模块”或“智能决策支持系统”)

Mystic应用 Mystic应用(Mystic)是一个主要的WSF应用程序,用于可视化模拟结果和统计数据。 当在场景中提供event_pipe命令块时,模拟结果将被记录。event_pipe块会创建AFSIM事件录制文件(.aer),…

家政服务|基于springBoot的家政服务平台设计与实现(附项目源码+论文+数据库)

私信或留言即免费送开题报告和任务书(可指定任意题目) 目录 一、摘要 二、相关技术 三、系统设计 四、数据库设计 五、核心代码 六、论文参考 七、源码获取 一、摘要 现代经济快节奏发展以及不断完善升级的信息化技术,让传统数…

璞华科技×珠海采筑:通过SRM系统实现采购管理一体化和精细化

SRM供应商关系管理应该怎么做?如何实现采购管理一体化?近日,聚焦建材采购交易领域的服务商珠海采筑和SRM系统提供商璞华科技通过合作给出了一个现实的回答:通过SRM系统,聚焦使用者视角,以数据为主线&#x…

二分算法详解

1. 二分查找 704. 二分查找 这是一道单纯的朴素二分模版题&#xff0c;当 left right 时的这种情况也是需要考虑的&#xff0c;因为不排除数组中只有一个数的情况&#xff0c;或者是二分到数组中只剩一个数的情况&#xff0c;所以循环条件要写 left < right class Soluti…

批量复制文件技巧:高效管理,一键复制至指定位置

当需要处理大量文件时&#xff0c;批量复制功能能显著提升工作效率。通过文件管理器或专业的文件处理软件&#xff0c;用户可以一次性选择多个文件或文件夹进行复制操作&#xff0c;无需逐个手动操作&#xff0c;大大节省了时间。还可以实现更复杂的批量处理任务。 1.打开“文件…

Qt开发技巧(十四)文字的分散对齐,设置动态库路径,进度条控件的文本,文件对话框的卡顿,滑块控件的进度颜色,停靠窗体的排列,拖拽事件的坑

继续讲一些Qt开发中的技巧操作&#xff1a; 1.文字的分散对齐 有时候需要对文本进行分散对齐显示&#xff0c;相当于无论文字多少&#xff0c;尽可能占满整个空间平摊占位宽度&#xff0c;但是在对支持对齐方式的控件比如QLabel调用 setAlignment(Qt::AlignJustify | Qt::Align…

移动硬盘无法读取?详解原因与数据恢复方案

一、移动硬盘无法读取现象描述 在日常生活中&#xff0c;移动硬盘作为我们存储和传输数据的重要工具&#xff0c;扮演着不可或缺的角色。然而&#xff0c;有时我们会遇到移动硬盘无法读取的情况&#xff0c;这给我们的数据使用带来了极大的困扰。当我们将移动硬盘连接到电脑或…

LLM大模型学习精要系列(一):掌握基础,开启大模型之旅

1.前言 1.1 基础模型研究 2023 年&#xff0c;随着 LLM 技术的发展&#xff0c;中国模型研究机构的开源模型迎来了爆发式的增长&#xff1a; 2023 年 3 月&#xff0c;智谱 AI 首先在魔搭社区发布了 ChatGLM-6B 系列&#xff0c;ChatGLM-6B 是一个开源的、支持中英双语问答的…

【EXCEL数据处理】000001 案列 条件格式之大于,小于,介于,等于。使用的软件是微软的Excel操作的。处理数据的目的是让数据更直观的显示出来,方便查看。

【EXCEL数据处理】000001 案列 条件格式之大于,小于,介于,等于。使用的软件是微软的Excel操作的。处理数据的目的是让数据更直观的显示出来&#xff0c;方便查看。 &#x1f4da;一、直接上案例 &#x1f4d6;1.EXCEL条件格式之大于,案列。标记值大于1500000的值为粉红色。 &a…

【游戏模组】重返德军总部2009高清重置MOD,建模和材质全部重置,并且支持光追效果,游戏画质大提升

各位好&#xff0c;今天小编给大家带来一款新的高清重置MOD&#xff0c;本次高清重置的游戏叫《重返德军总部2009》2009年发布&#xff0c;我相信很多玩家已经玩过了&#xff0c;如果你还没有玩过我也可以和你简单介绍一下剧情&#xff0c;这款游戏故事背景接续在《重返德军总部…

memset二维数组

1135 用 sizeof d sizeof d[] sizeof N*4 都是错误的。 void dijkstra(int s,int d[]) {memset(d,0x3f,N*4);memset(st,0,sizeof st);d[s]0;priority_queue<PII,vector<PII>,greater<PII>>q;q.push({0,s});while(q.size()){auto tq.top();q.pop();in…