大家好,我是herosunly。985院校硕士毕业,现担任算法研究员一职,热衷于大模型算法的研究与应用。曾担任百度千帆大模型比赛、BPAA算法大赛评委,编写微软OpenAI考试认证指导手册。曾获得阿里云天池比赛第一名,CCF比赛第二名,科大讯飞比赛第三名。授权多项发明专利。对机器学习和深度学习拥有自己独到的见解。曾经辅导过若干个非计算机专业的学生进入到算法行业就业。希望和大家一起成长进步。
本文主要介绍了专栏《大模型微调部署实战及类GPT工具的高效使用》的核心内容,希望对使用大语言模型的同学们有所帮助。
文章目录
- 1. 前言
- 2. 专栏亮点
- 3. 你的收获
- 4. 详细目录
1. 前言
随着时间的齿轮转动到2024年,各种行业大模型
如雨后春笋般涌现。如何基于基座模型
和领域数据
构建行业大模型
成为了近期研究和落地的热点方向。因此基于大模型进行微调
和部署
成为了大多数企业的日常操作,但模型微调存在相当的技术门槛,稍有差池或者经验不足极易造成过拟合(严重的灾难性遗忘)、或者欠拟合(无法有效学习特定领域知识)的情形。
与此同时,善用AI的人利用各种GPT工具完成写文章、写总结、写代码、阅读论文、文本翻译等日常任务,极大提升了工作和生活的效率。为了帮助大家更好地理解和掌握上述内容,个人精心打造了全面且不断迭代的系统性课程。
但在大模型实践过程中,往往存在着各种各样的坑,不管是大模型的下载和使用,还是大模型的微调与部署,一个看似简单的小问题就需要花费非专业人士数个小时,更何况很多同学是刚入门不久的小白,所以很容易就从入门走向放弃。
但市面上的大模型实战课程质量参差不齐,要么步骤不够详细,要么只包含文字(没有必要的截图)。很多同学可能会卡在某个点上很长时间,从易到难比如:无法连接huggingface
、下载高速下载github
源码、微调前不知从何入手、微调过程中不知如何进行迭代和精进、微调后不知如何选择比较好的checkpoint、微调后无法判断是否达到了预期的效果。
本课程包括以下主要内容:首先,我们将深入解析大模型的基本概念,其中包括从入门到精进的提示工程、主流大模型的System Prompt、GPT和LLaMA模型的进化之路。大模型的部署与推理是模型微调的前提,所以详细介绍了huggingface高速下载模型的实战代码、多种部署大模型API的实战教程、不同语言及其代码(包括Text2SQL)大模型的部署方案。接着,我们将详细讲解大模型微调的技巧和实验方法,包括大模型微调数据集构建方法、大模型微调选择模型的实战技巧、LoRA微调调参的实战技巧、LLama Factory单机和多机微调等实战教程、Lora Adapter可视化的实战教程、判断大模型微调是否产生灾难性遗忘的实战方案、大模型微调出错的解决方案。除此之外,我们将详细讲解GPT工具在不同场景下的高效使用方法,包括智能搜索、阅读论文、文本翻译、代码生成等实际场景。为了让大家更好的使用工作流提升工作效率和接入业务场景,近期也在更新大模型工作流的相关文章。
本专栏致力于以图文并茂、通俗易懂、步骤详尽的形式对大模型重要知识点进行系统性讲解。 每一篇都是经过亲身的实践经历总结而来的,已订阅人数超过720+,已更新文章105+,并且将持续更新,近期更新频率为一周2~3篇。帮助多名同学解决大模型部署、微调及其测评等各类实战问题。
2. 专栏亮点
- 系统全面的大模型概念详解和实战应用课程,覆盖了大模型理论基础和实战应用的完整路径。
- 每一篇文章都是经过精心撰写而成的,文章平均质量分数为92(远超其他热门和同类专栏)。
- 实战文章均来自于亲身的实践经验,为了方便小白学习,通过图文的形式详细介绍了每一步的操作和正确执行结果,方便进行逐步的验证。
- 持续更新前沿文章,近期更新频率为一周2~3篇,已更新篇数为106篇,目标更新篇数为500篇。
3. 你的收获
- 掌握大模型的核心概念和应用实战,尤其是对大模型进行微调和部署。
- 掌握使用GPT工具的方法和技巧,早日成为善用AI的人。
- 高效学习精炼后的大模型前沿知识,有效提升学习效率。
- 购买专栏可加入大模型交流群学习,群里还有不定期抽奖送书等福利。
4. 详细目录
第一章:大模型的基础知识与核心概念
- ChatGPT启蒙之旅:弟弟妹妹的关键概念入门
- GPT内功心法:搜索思维到GPT思维的转换
- 从用户的角度谈GPT时代技术突破的两大关键逻辑
- AIGC提示(prompt)工程之开宗明义篇
- AIGC提示(prompt)飞升方法:走向专家之路
- GPT-4o模型介绍和使用方法
- Claude3系统解读与使用测评
- LLaMA模型系统解读
- 多图详解LLaMA 3的使用方法和进化之路
- Meta大佬亲授LLaMA 3的奥秘
- 从System Prompt来看Claude3、Kimi和ChatGLM4之间的差距
- 从System Prompt来看GPT-3.5到GPT-4的进化
- 详解OpenAI大佬每日读物: The Bitter Lesson
- 如何从宏观层面构建优秀的大语言模型
- 大模型训练数据多样性的重要性
- 大模型量化方法总结
- 查看大模型对应的准确参数量和网络结构的实战代码
- 详解LangChain Agents
- baichuan 2模型使用的注意事项
- baichuan(百川)1和2的tokenizer的比较
第二章:大模型的部署与推理
- huggingface连接不上的解决方案(持续更新)
- github连接不上的解决方案
- huggingface高速下载模型的实战代码
- 计算huggingface模型占用硬盘空间的实战代码
- FP16、BF16、INT8、INT4精度模型加载所需显存以及硬件适配的分析
- 部署大模型API的实战教程
- 大模型推理加速框架vllm部署的实战方案
- 详解FastChat部署大模型API的实战教程
- 本地部署GPT的实战方案
- ChatGPT API实现多轮对话的实战代码
- Qwen2本地部署的实战教程
- GLM-4本地部署的实战教程
- Llama3本地部署的解决方案
- 中文开源模型Command R+的在线使用和本地部署的解决方案
- ChatDoctor本地部署应用的实战方案
- 通义千问7B本地部署的实战方案
- baichuan2(百川2)本地部署的实战方案
- CodeLlama本地部署的实战方案
- ChatGLM2本地部署的实战方案
- ChatGLM3 本地部署的解决方案
- ChatGLM3设置角色和工具调用的解决方案
- GLM-130B本地部署的实战方案
- MiniGPT-4本地部署的实战方案
- Vicuna本地部署的实战方案
- CPM-Bee本地部署的实战方案
- 天鹰340亿(AquilaChat2-34B-16K)本地部署的解决方案
- Orion-14B-Chat-RAG本地部署的解决方案
- Orion-14B-Chat-Plugin本地部署的解决方案
- Orion-14B-Chat-Plugin [model server error]解决方案
- 下载马斯克Grok-1模型的实战代码
- 大模型推理速度测评的实战代码
- LLaMA Factory在预测阶段时添加原有问题的实战代码
第三章:大模型的微调与优化
- 大模型微调数据集构建方法(持续更新)
- 大模型LoRA微调调参的实战技巧(持续更新)
- 大模型微调选择模型的实战技巧(持续更新)
- 模型全参数训练和LoRA微调所需显存的分析
- LLaMA Factory单机微调的实战教程
- LLaMA Factory多卡微调的实战教程
- 基于大模型的Text2SQL微调的实战教程
- 基于大模型的Text2SQL微调的实战教程(二)
- Lora Adapter可视化的实战教程
- 大模型自我认知微调的实战教程
- ChatGLM LoRA微调实战方案
- ChatGLM ptuning 的实战方案
- 判断大模型微调是否产生灾难性遗忘的实战方案
- 大模型微调和RAG的应用场景
- 大模型微调出错的解决方案
- 大模型提问中包括时间的实战方案
第四章:Text2SQL
- Text2SQL基座模型选择的实战教程
- 最强开源Text2SQL大模型本地部署的解决方案
- 基于大模型的Text2SQL微调的实战教程(新)
- Text2SQL中不同数据库SQL之间转换的实战代码
- Langchain+本地大语言模型进行数据库操作的实战代码
- Text2SQL提问中包括时间的实战方案
- Text2SQL中反思纠错的实战方案
第五章:GPT工具的高效使用方法
- AIGC时代高效阅读论文实操
- AIGC高效进行网页总结的工具使用
- 高效翻译工具GPT插件的使用教程
- 国内智能搜索工具实战教程
- 基于GPT-3.5和GPT-4的免费代码生成工具
- 搜索神器Perplexity的详细使用方法
- 搜索神器Phind的详细使用方法
- 探寻大模型回答9.9和9.11犯错的根本原因
- 不同问题来评测百度、谷歌、ChatGPT、Phind、GPT-4
- 速评谷歌开源大模型Gemma 7B
- 使用AIGC工具巧用Linux系统
- 使用AIGC工具提升论文阅读效率
- 使用ChatGPT工具阅读文献的实战教程
- 使用ChatGPT设计选择题
- 使用ChatGPT提升记忆效率
- 用好GPT关键诀窍之上下文学习
- 用好ChatGPT之准确分配角色
- 使用范例调教ChatGPT
- ChatGPT和GPT-4帮你写人物传记
- ChatGPT和GPT-4带你选笔记本电脑
- 大模型生成人物关系思维导图的实战教程
- 图文详解GPT-4最强对手Claude2的使用方法
- Claude2轻松解决代码Bug的实战方案
第六章:大模型工作流(正在更新中)
- 通过命令行工作流提升工作效率的实战教程(持续更新)
- 使用工作流产生高质量翻译内容的实战教程