前言
大模型领域既是繁星点点的未知宇宙,也是蕴含无数可能的广阔天地,正是这一独特的魅力,令无数的探索者为之倾倒,为之奋斗。随着大模型应用逐渐走入人们的日常生活,支撑它的深度学习技术也开始登上更为广阔和深远的人工智能大舞台。
本书将揭示大模型ChatGLM3的本地化实战应用,带领读者领略ChatGLM3的高级应用之美.书中不仅详细如何进行ChatGLM3的私有云部署、开发应用、构建思维链以及在有限资源条件下的微调方法,为了让读者更深入地了解ChatGLM3的模型架构,还将解析GLM系列模型的源码,并完成一项文本生成任务。
本书涉及的深度学习编程方法与技巧以PyTorch为主。PyTorch因其易用性和普及性而成为深度学习领域的翘楚。
本书作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,不仅延续了《PyTorch 2.0深度学习从零开始学》中的核心理念与知识体系,更将深度学习引向了一个新的高度,专注于大模型的本地化研究与应用。本书将帮助读者深入理解深度学习与大模型的精髓,探寻其背后的思维逻辑和创新精神。在这个过程中,读者不仅能学习到理论知识,更能感受到大模型背后的力量与智慧,从而为自己在这一领域的研究和实践提供有力的支撑。
下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇
本书特点
- 内容与结构的系统性:本书延续了《PyTorch 2.0深度学习从零开始学》的知识体系,精心设计了内容与结构,结合深度学习基础知识和大模型的具体方向,逐步引导读者走进大模型高级应用和微调场景。每个章节都按照逻辑顺序展开,确保读者在学习过程中能够循序渐进地掌握相关知识和技能。
- 理论与实践的紧密结合:本书不仅关注理论知识,更注重实践应用。通过丰富的实战案例讲解,读者可以亲手进行操作和实践,深入了解深度学习和大模型在实际问题中的应用方法和解决方案。
- 大模型本地化部署领域的专业洞察:本书对大模型本地化部署领域进行深入研究和专业洞察,涵盖了目前最新的研究成果、模型架构和应用场景。读者通过阅读本书,可以紧跟学术前沿,全面了解大模型的发展趋势和实际应用。
- 注重培养解决问题的能力:本书以实际项目为导向,注重培养读者解决问题的能力。通过深入分析实际案例和提供实战代码,读者可以逐步提升自己的实践能力和创新能力,为未来的实际工作做好充分准备。
- 优美的语法和丰富的实例:本书采用优美的语法和丰富的实例进行讲解,让读者在学习过程中感受深度学习的魅力和大模型的智慧。通过生动的比喻、形象的描述和实用的技巧,读者可以更好地理解和掌握深度学习和大模型的核心概念和方法。
- 笔者的专业背景和实战经验:作为深度学习专家和畅销图书作者,笔者具有深厚的学术背景和丰富的实践经验。在撰写本书的过程中,笔者以实际项目中遇到的问题为导向,注重知识体系的完整性和实用性,力求使本书成为一本具有参考价值的重要著作。
本书适合人群
本书适合学习人工智能、深度学习、大模型开发应用以及PyTorch算法的人员阅读,也适合作为高等院校或高职高专大模型相关课程的教材。
目录
第1章 大模型时代的开端 1
- 1.1 大模型的历史与发展 1
- 1.2 为什么要使用大模型 6
- 1.3 本章小结 10
第2章 PyTorch 2.0深度学习环境搭建 11
- 2.1 安装Python开发环境 12
- 2.2 安装PyTorch 2.0 19
- 2.3 Hello ChatGLM3 23
- 2.4 本章小结 31
第3章 基于gradio的云上自托管ChatGLM3部署实战 32
- 3.1 gradio的基本使用详解 32
- 3.2 基于gradio的猫狗分类可视化训练与预测实战 59
- 3.3 基于网页端的ChatGLM3部署和使用 69
- 3.4 基于私有云服务的ChatGLM3部署和使用 72
- 3.5 本章小结 74
第4章 使用ChatGLM3与LangChain实现知识图谱抽取和智能问答 75
- 4.1 当ChatGLM3遇见LangChain 76
- 4.2 ChatGLM3+ LangChain搭建专业问答机器人 84
- 4.3 使用ChatGLM3的LLM终端搭建知识图谱抽取与智能问答 89
- 4.4 本章小结 92
第5章 适配ChatGLM3终端的Template与Chain详解 93
- 5.1 基于输入模板的人机交互 93
- 5.2 Template中示例的最佳选择 97
- 5.3 使用Chain提高ChatGLM3的能力 100
- 5.4 LangChain中的记忆功能 102
- 5.5 基于ChatGLM3终端撰写剧情梗概、评论与宣传文案实战 105
- 5.6 本章小结 111
第6章 ChatGLM3多文本检索的增强生成实战 112
- 6.1 使用自然语言处理方法对目标进行查找 113
- 6.2 基于LLM终端完成文本内容抽取与文本问答 118
- 6.3 使用LLM终端完成反向问题推断 127
- 6.4 本章小结 131
第7章 构建以人为本的ChatGLM3规范化Prompt提示工程 132
- 7.1 提示工程模板构建的输入与输出格式 132
- 7.2 提示工程模板高级用法 138
- 7.3 结合提示工程的网页搜索服务实战 142
- 7.4 本章小结 145
第8章 使用ChatGLM3的思维链构建 146
- 8.1 思维链初探 146
- 8.2 思维链详解及其实战 149
- 8.3 本章小结 152
第9章 GLM源码分析与文本生成实战 153
- 9.1 GLM组件详解 154
- 9.2 GLM整体架构详解与文本生成实战 159
- 9.3 本章小结 167
第10章 低资源单GPU微调ChatGLM3实战 168
- 10.1 什么是大模型微调 168
- 10.2 ChatGLM3大模型微调的准备内容 171
- 10.3 虚拟客服多轮问答实战 180
- 10.4 加速的秘密:accelerate训练方法与模型量化详解 191
- 10.5 更快的量化训练方案:QLoRA基础内容详解 200
- 10.6 QLoRA微调文本生成实战 207
- 10.7 本章小结 215
第11章 会使用工具的ChatGLM3 216
- 11.1 ChatGLM3调用工具源码详解与实战 216
- 11.2 ChatGLM3官方工具注册与调用源码分析与实战 231
- 1.3 ChatGLM3实战:构建个人助理之美妆助手 240
- 11.4 本章小结 247
第12章 上市公司财务报表非结构化信息抽取实战 249
- 12.1 超长文本处理功能的ChatGLM3与真实财务报表的处理 250
- 12.2 单报表非结构化信息抽取实战 253
- 12.3 本章小结 256
第13章 上市公司财务报表智能问答与财务预警实战 257
- 13.1 基于ChatGLM3的非结构化数据抽取与大规模财务报表数据库的建立 257
- 13.2 基于自然语言的上市公司财务报表智能问答与财务预警实战 264
- 13.3 本章小结 272
附录 大模型的“幻觉” 273
下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇