ChatGLM2本地部署方法

ChatGLM2本地部署方法

news2025/4/19 15:17:23

chatglm2部署在本地时，需要从huggingface上下载模型的权重文件（需要科学上网）。下载后权重文件会自动保存在本地用户的文件夹上。但这样不利于分享，下面介绍如何将chatglm2模型打包部署。

一、克隆chatglm2部署

这个项目是chatglm2的部署和实现方式，将模型以网页demo的形式呈现，其并不包含模型的结构。

git clone https://github.com/THUDM/ChatGLM2-6B

二、克隆chatglm2模型

这个项目包含了模型的结构。GIT_LFS_SKIP_SMUDGE=1的意思是把大文件的大小都压缩为1KB。所以pytorch_model-00001到pytorch_model-00007这个七个文件和tokennizer.model下载后大小均为1KB。

假设该项目的路径是D:\\model。

GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/THUDM/chatglm2-6b

三、下载权重文件和语料库

从官方云盘里下载权重文件和tokennizer并对上述文件进行替换。官方模型权重

四、路径替换

更改下述代码中的路径"THUDM/chatglm2-6b"

tokenizer = AutoTokenizer.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True)
model = AutoModel.from_pretrained("THUDM/chatglm2-6b", trust_remote_code=True).cuda()

在第二节中假设路径为D:\\model，那么在这里就将其改成：

tokenizer = AutoTokenizer.from_pretrained("D:\model", trust_remote_code=True)
model = AutoModel.from_pretrained("D:\model", trust_remote_code=True).cuda()

部署成功！

五、其它问题

部署的过程中会出现各种各样的问题。这里建议新建一个conda环境，然后再pip install -r requirements.txt安装依赖，将代码置于该环境下执行。此外，安装时务必注意cuda cudunn和python的对应关系。这样就可以尽量避免报错。

有关cuda的安装可以看这篇：

Windows10下ChatGLM2-6B模型本地化安装部署教程图解_chatglm本地部署-CSDN博客

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1551607.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Go singleflight 第三方库在防止缓存击穿中的重要作用

Go singleflight 第三方库在防止缓存击穿中的重要作用

参考： Go并发——singleflight - 知乎十一. Go并发编程–singleflight - failymao - 博客园一、背景介绍：Go的singleflight库提供了一个重复的函数调用抑制机制。场景：适用于并发读请求量较大的后台服务，以降低存储层的压力…

阅读更多...

I.MX6ULL_Linux_驱动篇(55)linux 网络驱动

I.MX6ULL_Linux_驱动篇(55)linux 网络驱动

网络驱动是 linux 里面驱动三巨头之一， linux 下的网络功能非常强大，嵌入式 linux 中也常常用到网络功能。前面我们已经讲过了字符设备驱动和块设备驱动，本章我们就来学习一下linux 里面的网络设备驱动。嵌入式网络简介网络硬件接口首先…

阅读更多...

Linux（3）软件安装-Centos 8.1安装-硬盘分区方案对比-linux上运行jar包-File上传下载

Linux（3）软件安装-Centos 8.1安装-硬盘分区方案对比-linux上运行jar包-File上传下载

四、软件安装 1、Centos 8.1安装 1.1 安装过程 1、下载 CentOS 8.1 ISO 镜像文件访问 CentOS 官方网站的下载页面。选择适当的版本，例如 CentOS Linux 8.1 (Linux Kernel 5.10.0-36)。根据您的硬件架构下载对应的 ISO 镜像文件（如 CentOS-8.1-x86_6…

阅读更多...

MySQL：十二类查询汇总（源码+解析超全超详解！！！）

MySQL：十二类查询汇总（源码+解析超全超详解！！！）

目录一、全列查询二、指定列查询三、查询的字段为表达式四、别名查询五、去重查询：DISTINCT 六、排序查询：ORDER BY 七、条件查询：WHERE 注意： 范例： 1、基本查询 2、AND 与 OR 3、BETWEEN … AND ……

阅读更多...

华为OD机试 - 考古问题 - 回溯、全排列问题（Java 2024 C卷 200分）

华为OD机试 - 考古问题 - 回溯、全排列问题（Java 2024 C卷 200分）

华为OD机试 2024C卷题库疯狂收录中，刷题点这里专栏导读本专栏收录于《华为OD机试（JAVA）真题（A卷B卷C卷）》。刷的越多，抽中的概率越大，每一题都有详细的答题思路、详细的代码注释、样例测试…

阅读更多...

外包干了4年，技术退步明显。。。。

外包干了4年，技术退步明显。。。。

说一下自己的情况，本科生，19年通过校招进入上海某软件公司，干了接近4年的功能测试，今年年初，感觉自己不能够在这样下去了，长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试&a…

阅读更多...

Github万星项目lobe-chat，连接GPT4GPTs，平替chatgpt-plus

Github万星项目lobe-chat，连接GPT4GPTs，平替chatgpt-plus

简介 Lobe Chat - 一个开源、高性能的聊天机器人框架，支持语音合成、多模态和可扩展的函数调用插件系统。支持一键免费部署您的私人 ChatGPT/LLM Web 应用程序。项目地址： GitHub - lobehub/lobe-chat: 🤯 Lobe Chat - an open-source, mo…

阅读更多...

【学习】企业为什么要做性能测试？性能测试有何优势？

【学习】企业为什么要做性能测试？性能测试有何优势？

性能测试是一种软件测试，可确保应用程序在工作负载下运行良好。性能测试的目标不是发现错误，而是消除性能瓶颈，同时度量系统关键指标。一、为什么要做性能测试 1.性能测试向利益相关者告知其应用程序的速度、可扩展性和稳定性。 2.它揭示了…

阅读更多...

第5章.零、单例与小样本提示词的编写之道

第5章.零、单例与小样本提示词的编写之道

零提示、单个提示和小样本提示是用于从ChatGPT中生成文本的技术。在数据匮乏或任务全新、定义模糊之时，我们用微妙的提示，让ChatGPT从无到有，生成文本。面对任务，空无一例：模型凭借对任务的广泛理解，独辟…

阅读更多...

【MongoDB】一问带你深入理解什么是MongDB，MongoDB超超详细保姆级教程

【MongoDB】一问带你深入理解什么是MongDB，MongoDB超超详细保姆级教程

目录 1、MongoDB概述2、MongoDB 主要特点2.1、文档2.2、集合2.3、数据库2.4、数据模型 3、Windows安装MongoDB3.1、下载MongoDB3.2、安装MongoDB3.3、配置MongoDB 4、Linux安装MongoDB4.1、下载MongoDB4.2、解压安装4.3、安装一个可视化工具 5、MongoDB基本操作及增删改查5.1、…

阅读更多...

数据结构进阶篇之【二叉树链序存储】的整体实现讲解

数据结构进阶篇之【二叉树链序存储】的整体实现讲解

封建迷信我嗤之以鼻，财神殿前我长跪不起一、二叉树链式结构的实现 1.二叉树的创建 1.1 手动创建 1.2 前序递归创建 2.二叉树的遍历 2.1 前序，中序以及后序遍历概念 2.2 层序遍历概念 2.3 前序打印实现 2.4 中序打印实现 2.4 后序打印实现 2.…

阅读更多...

YOLOv9改进策略：neck优化 | 路径融合GFPN，小目标到大目标一网打尽 | 轻骨干重Neck的轻量级目标检测器GiraffeDet

YOLOv9改进策略：neck优化 | 路径融合GFPN，小目标到大目标一网打尽 | 轻骨干重Neck的轻量级目标检测器GiraffeDet

💡💡💡本文改进内容：设计了一种新的路径融合GFPN：包含跳层与跨尺度连接，改进思路来自ICLR2022 GiraffeDet的核心思想。 💡💡💡GFPN和六个检测头结合，这种跳层…

阅读更多...

Git命令及GUI基本操作

Git命令及GUI基本操作

不习惯使用Git命令的可移步下面Git GUI基本操作 Git 常用命令 git branch 查看本地所有分支 git status 查看当前状态 git commit 提交 git branch -a 查看所有的分支 git branch -r 查看本地所有分支 git commit -am "init" 提交并且加注释 git remote add orig…

阅读更多...

20个超实用Python魔法方法

20个超实用Python魔法方法

大家好！今天我们要一起探索Python世界的神秘角落——那些被称为“魔法方法”的特殊成员方法。它们就像是编程中的魔法咒语，赋予你的类各种神奇特性，让你的代码更加简洁、强大且有趣味！ __init__：这是每个对象出生时都要…

阅读更多...

Python爬虫实战—探索某网站电影排名

Python爬虫实战—探索某网站电影排名

文章目录 Python爬虫实战—探索某网站电影排名准备工作编写爬虫代码代码解析运行情况截图进一步优化和说明完整代码总结说明：本案例以XXX网站为例，已隐去具体网站名称与地址。 Python爬虫实战—探索某网站电影排名网络爬虫是一种自动化程序&#xff0…

阅读更多...

多线程的学习1

多线程的学习1

多线程线程是操作系统能够进入运算调度的最小单位。它被包含在进程之中，是进程中的实际运作单位。进程：是程序的基本执行实体。并发：在同一个时刻，有多个指令在单个CPU上交替执行。并行：在同一时刻&#xff0c…

阅读更多...

js改变图片曝光度(高亮度)

js改变图片曝光度(高亮度)

方法一： 原理： 使用canvas进行滤镜操作，通过改变图片数据每个像素点的RGB值来提高图片亮度。缺点当前项目使用的是svg，而不是canvas 调整出来的效果不是很好，图片不是高亮，而是有些发白效果代码 …

阅读更多...

OC对象 - Block解决循环引用

OC对象 - Block解决循环引用

文章目录 OC对象 - Block解决循环引用前言1. 循环引用示例1.1 分析 2. 解决思路3. ARC下3.1 __weak3.2 __unsafe_unretained3.3 __block 4. MRC下4.1 __unsafe_unretain....4.1 __block 5. 总结5.1 ARC下5.2 MRC下 OC对象 - Block解决循环引用前言本章将会通过一个循环引用…

阅读更多...

GitHub如何验证2FA，烦人的认证，看完几分钟解锁

GitHub如何验证2FA，烦人的认证，看完几分钟解锁

序言今天需要使用GitHub，还是不能用，需要2FA认证，没办法，还是让2FA认证流程来，一一解决，在解决这认证问题之前，先说说2FA认证是什么？ 什么是2FA 2FA 是指两步验证（Two…

阅读更多...

用搜索引擎收集信息-常用方式

用搜索引擎收集信息-常用方式

1，site csdn.net （下图表示只在csdn网站里搜索java） 2，filetype:pdf （表示只检索某pdf文件类型） 表示在浏览器里面查找有关java的pdf文件 3，intitle:花花 （表示搜索网页标题里面有花…

阅读更多...

推荐文章

最新文章