【精选书籍】ChatGLM3大模型本地化部署、应用开发与微调的全面解析

news2024/11/16 3:26:26

前言

大模型领域既是繁星点点的未知宇宙,也是蕴含无数可能的广阔天地,正是这一独特的魅力,令无数的探索者为之倾倒,为之奋斗。随着大模型应用逐渐走入人们的日常生活,支撑它的深度学习技术也开始登上更为广阔和深远的人工智能大舞台。

在这里插入图片描述

本书将揭示大模型ChatGLM3的本地化实战应用,带领读者领略ChatGLM3的高级应用之美.书中不仅详细如何进行ChatGLM3的私有云部署、开发应用、构建思维链以及在有限资源条件下的微调方法,为了让读者更深入地了解ChatGLM3的模型架构,还将解析GLM系列模型的源码,并完成一项文本生成任务。

本书涉及的深度学习编程方法与技巧以PyTorch为主。PyTorch因其易用性和普及性而成为深度学习领域的翘楚。
  
本书作为《PyTorch 2.0深度学习从零开始学》的姊妹篇,不仅延续了《PyTorch 2.0深度学习从零开始学》中的核心理念与知识体系,更将深度学习引向了一个新的高度,专注于大模型的本地化研究与应用。本书将帮助读者深入理解深度学习与大模型的精髓,探寻其背后的思维逻辑和创新精神。在这个过程中,读者不仅能学习到理论知识,更能感受到大模型背后的力量与智慧,从而为自己在这一领域的研究和实践提供有力的支撑。

下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

本书特点

  • 内容与结构的系统性:本书延续了《PyTorch 2.0深度学习从零开始学》的知识体系,精心设计了内容与结构,结合深度学习基础知识和大模型的具体方向,逐步引导读者走进大模型高级应用和微调场景。每个章节都按照逻辑顺序展开,确保读者在学习过程中能够循序渐进地掌握相关知识和技能。
  • 理论与实践的紧密结合:本书不仅关注理论知识,更注重实践应用。通过丰富的实战案例讲解,读者可以亲手进行操作和实践,深入了解深度学习和大模型在实际问题中的应用方法和解决方案。
  • 大模型本地化部署领域的专业洞察:本书对大模型本地化部署领域进行深入研究和专业洞察,涵盖了目前最新的研究成果、模型架构和应用场景。读者通过阅读本书,可以紧跟学术前沿,全面了解大模型的发展趋势和实际应用。
  • 注重培养解决问题的能力:本书以实际项目为导向,注重培养读者解决问题的能力。通过深入分析实际案例和提供实战代码,读者可以逐步提升自己的实践能力和创新能力,为未来的实际工作做好充分准备。
  • 优美的语法和丰富的实例:本书采用优美的语法和丰富的实例进行讲解,让读者在学习过程中感受深度学习的魅力和大模型的智慧。通过生动的比喻、形象的描述和实用的技巧,读者可以更好地理解和掌握深度学习和大模型的核心概念和方法。
  • 笔者的专业背景和实战经验:作为深度学习专家和畅销图书作者,笔者具有深厚的学术背景和丰富的实践经验。在撰写本书的过程中,笔者以实际项目中遇到的问题为导向,注重知识体系的完整性和实用性,力求使本书成为一本具有参考价值的重要著作。

本书适合人群

本书适合学习人工智能、深度学习、大模型开发应用以及PyTorch算法的人员阅读,也适合作为高等院校或高职高专大模型相关课程的教材。

目录

第1章 大模型时代的开端 1

  • 1.1 大模型的历史与发展 1
  • 1.2 为什么要使用大模型 6
  • 1.3 本章小结 10

第2章 PyTorch 2.0深度学习环境搭建 11

  • 2.1 安装Python开发环境 12
  • 2.2 安装PyTorch 2.0 19
  • 2.3 Hello ChatGLM3 23
  • 2.4 本章小结 31

第3章 基于gradio的云上自托管ChatGLM3部署实战 32

  • 3.1 gradio的基本使用详解 32
  • 3.2 基于gradio的猫狗分类可视化训练与预测实战 59
  • 3.3 基于网页端的ChatGLM3部署和使用 69
  • 3.4 基于私有云服务的ChatGLM3部署和使用 72
  • 3.5 本章小结 74

第4章 使用ChatGLM3与LangChain实现知识图谱抽取和智能问答 75

  • 4.1 当ChatGLM3遇见LangChain 76
  • 4.2 ChatGLM3+ LangChain搭建专业问答机器人 84
  • 4.3 使用ChatGLM3的LLM终端搭建知识图谱抽取与智能问答 89
  • 4.4 本章小结 92

第5章 适配ChatGLM3终端的Template与Chain详解 93

  • 5.1 基于输入模板的人机交互 93
  • 5.2 Template中示例的最佳选择 97
  • 5.3 使用Chain提高ChatGLM3的能力 100
  • 5.4 LangChain中的记忆功能 102
  • 5.5 基于ChatGLM3终端撰写剧情梗概、评论与宣传文案实战 105
  • 5.6 本章小结 111

第6章 ChatGLM3多文本检索的增强生成实战 112

  • 6.1 使用自然语言处理方法对目标进行查找 113
  • 6.2 基于LLM终端完成文本内容抽取与文本问答 118
  • 6.3 使用LLM终端完成反向问题推断 127
  • 6.4 本章小结 131

第7章 构建以人为本的ChatGLM3规范化Prompt提示工程 132

  • 7.1 提示工程模板构建的输入与输出格式 132
  • 7.2 提示工程模板高级用法 138
  • 7.3 结合提示工程的网页搜索服务实战 142
  • 7.4 本章小结 145

第8章 使用ChatGLM3的思维链构建 146

  • 8.1 思维链初探 146
  • 8.2 思维链详解及其实战 149
  • 8.3 本章小结 152

第9章 GLM源码分析与文本生成实战 153

  • 9.1 GLM组件详解 154
  • 9.2 GLM整体架构详解与文本生成实战 159
  • 9.3 本章小结 167

第10章 低资源单GPU微调ChatGLM3实战 168

  • 10.1 什么是大模型微调 168
  • 10.2 ChatGLM3大模型微调的准备内容 171
  • 10.3 虚拟客服多轮问答实战 180
  • 10.4 加速的秘密:accelerate训练方法与模型量化详解 191
  • 10.5 更快的量化训练方案:QLoRA基础内容详解 200
  • 10.6 QLoRA微调文本生成实战 207
  • 10.7 本章小结 215

第11章 会使用工具的ChatGLM3 216

  • 11.1 ChatGLM3调用工具源码详解与实战 216
  • 11.2 ChatGLM3官方工具注册与调用源码分析与实战 231
  • 1.3 ChatGLM3实战:构建个人助理之美妆助手 240
  • 11.4 本章小结 247

第12章 上市公司财务报表非结构化信息抽取实战 249

  • 12.1 超长文本处理功能的ChatGLM3与真实财务报表的处理 250
  • 12.2 单报表非结构化信息抽取实战 253
  • 12.3 本章小结 256

第13章 上市公司财务报表智能问答与财务预警实战 257

  • 13.1 基于ChatGLM3的非结构化数据抽取与大规模财务报表数据库的建立 257
  • 13.2 基于自然语言的上市公司财务报表智能问答与财务预警实战 264
  • 13.3 本章小结 272

附录 大模型的“幻觉” 273

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

下载当前版本: 完整PDF书籍链接获取,可以扫描下方二维码免费领取👇👇👇

  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2144105.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C++】日期类基础题

个人主页:CSDN_小八哥向前冲~ 所属专栏:C入门 一些C基础题目,帮你巩固一下! 目录 关于内存问题 栈和堆基础问题 计算日期到天数的转换 日期差值 日期累加 打印日期 关于内存问题 答案:D B 第一题&#xff…

java重点学习-JVM类加载器+垃圾回收

12.7类加载器 JVM只会运行二进制文件,类加载器的作用就是将字节码文件加载到JVM中,从而让Java程序能够启动起来。 类加载器有哪些 启动类加载器(BootStrap ClassLoader):加载JAVA HOME/jre/lib目录下的库扩展类加载器(ExtClassLoader):主要加载JAVA HOME…

Tensorflow—第五讲卷积神经网络

本讲概述 卷积实际上就是特征提取。本讲我们先了解学习卷积神经网络基础知识,再一步步地学习搭建卷积神经网络,最后会运用卷积神经网络对cifar10 数据集分类。在本讲的最后附上几个经典卷积神经网络:LeNet、AlexNet、VGGNet、InceptionNet和…

开发小程序

由于之前购入的阿里云ECS放着落灰,碰巧又看到个有趣的项目,于是就做了个生成头像的小程序…由于第一次完整发布小程序,记录一下遇到的问题 小程序名称:靓仔创意头像 😂 关于小程序 接口请求,在开发过程中…

少儿编程小游戏 | Scratch 射击游戏《开枪!》

在线玩:Scratch射击游戏 : “开枪!” 免费下载-小虎鲸Scratch资源站 随着科技的飞速发展,编程已经成为孩子们未来必备的技能之一。而Scratch作为一款专为少儿设计的编程工具,通过可视化的编程方式,让孩子们在玩游戏的过…

JAVA-集合相关

HashMap如何解决哈希冲突的? 计算hash值,基于hashCode计算冲突之后,先是使用链式寻址法当链表长度大于8,且hash表的容量大于60的时候,再添加元素则转化成红黑树 为什么计算hash值是,是将hash地址的值右移1…

代码随想录训练营 Day62打卡 图论part11 Floyd 算法 A * 算法

代码随想录训练营 Day62打卡 图论part11 Floyd 算法 例题:卡码97. 小明逛公园 题目描述 小明喜欢去公园散步,公园内布置了许多的景点,相互之间通过小路连接,小明希望在观看景点的同时,能够节省体力,走最短…

C++速通LeetCode中等第3题-字母异位词分组

双指针法:两个指针分别指向左右边界,记录最大面积,由于面积由短板决定,两个指针中较短的短指针向内移动一格,再次记录最大面积, 直到两指针相遇,得出答案。 class Solution { public:int maxAr…

PyQt / PySide + Pywin32 + ctypes 自定义标题栏窗口 + 完全还原 Windows 原生窗口边框特效项目

项目地址: GitHub - github201014/PyQt-NativeWindow: A class of window include nativeEvent, use PySide or PyQt and Pywin32 and ctypesA class of window include nativeEvent, use PySide or PyQt and Pywin32 and ctypes - github201014/PyQt-NativeWindow…

切换淘宝最新npm镜像源

文章目录 一、前言二、切换淘宝最新npm镜像源2.1 查询最新镜像源2.2 两种方式切换npm镜像源2.2.1 通过npm配置2.2.1 通过cnpm配置 三、总结 一、前言 NPM(Node Package Manager),是NodeJs的模块依赖管理工具,用于nodejs模块的安装…

java多线程模拟多个售票员从同一个票池售票

程序功能 这段代码模拟了多个售票员从一个有限的票池中售票的过程。主要功能如下: 票池共有50张票,多个售票员(线程)并发进行售票。 使用同步机制确保线程安全,避免多个售票员同时出售同一张票。 每个售票员不断检查票…

5.内容创作的未来:ChatGPT如何辅助写作(5/10)

引言 在信息爆炸的时代,内容创作已成为连接品牌与受众、传递信息与知识、以及塑造文化与观念的重要手段。随着数字媒体的兴起,内容创作的需求日益增长,对创作者的写作速度和质量提出了更高的要求。人工智能(AI)技术的…

PHP全程可视化防伪溯源一体化管理系统小程序源码

全程可视化,防伪溯源新篇章 —— 揭秘一体化管理系统的力量 🔍 开篇:透视未来,从源头到终端的安心之旅 在这个信息透明化时代,每一件商品都承载着消费者的信任与期待。而“全程可视化防伪溯源一体化管理系统”&#x…

【网络安全 | 代码审计】PHP无参数RCE

未经许可,不得转载。 文章目录 无参数RCE代码审计1、利用Session ID实现无参数RCE2、利用get_defined_vars ()函数实现无参数RCE3、利用getallheaders()实现无参数RCE4、利用getenv()实现无参数RCE5、利用scandir()实现无参数RCE靶场实例无参数RCE 一般情况下,RCE需要通过传…

Nuxt3部署遇到的问题归纳

fetch Headers is not a constructor 和 _fetch is not a function 这两个问题,本质上都是fetch在服务器上无法正常使用的问题,需要检查本地node版本与线上服务器node版本是否一致。否则在依赖安装上会产生依赖版本差异导致应用无法正常运行。 以下是wi…

若依-原理

1.代码生成器 1.1源码分析 代码生成器分为两个部分: 第一部分涉及将业务表结构导入到系统中 第二部分是点击生成按钮,系统将根据表结构生成相应的前后端代码,并提供下载。 1.表结构说明 gen_table:存储业务表的基本信息 &am…

事件循环event loop入门(基于ESP-IDF)

主要参考资料: 事件循环库: https://docs.espressif.com/projects/esp-idf/zh_CN/stable/esp32/api-reference/system/esp_event.html Event Loop 大白话版: https://www.bilibili.com/video/BV1FD4y1j79J/?spm_id_from333.999.0.0&vd_sourcedd284033cd0c4d1f3…

盘点常见网络安全术语(建议收藏)

1、黑帽 为非法目的进行黑客攻击的人,通常是为了经济利益。他们进入安全网络以销毁,赎回,修改或窃取数据,或使网络无法用于授权用户。这个名字来源于这样一个事实:老式的黑白西部电影中的恶棍很容易被电影观众识别&…

在linux用docker部署MySQL失败

Unable to find image mysql:latest locally docker: Error response from daemon: Get "https://registry-1.docker.io/v2/": dial tcp 128.121.243.107:443: i/o timeout. See docker run --help. 从网上找解决问题一直说是镜像问题,我原来的镜像是从自…

8-----手机机型维修工具助手 功能较全 涵盖解锁 刷机 修复等选项 维修推荐

上图是一款功能较全的维修加密狗。目前可以无限制 任何人使用。看图片可以了解其中涵盖刷机 解锁 修复分区 查看短接图 安装驱动 修复基带等等选项。而且其中有针对各个机型型号的对应功能操作。以及一些rec5.0相关的操作选项。 通过此博文了解 ★★★★★此工具涵盖的一些…