ChatGLM2-6b本地部署

news2025/7/14 15:56:51

chatglm2-6m模型
git 地址 https://github.com/THUDM/ChatGLM2-6B
模型百度网盘地址：链接：https://pan.baidu.com/s/1-LFcPB0H23RSpTKOECsjxw?pwd=5e3d
提取码：5e3d

1 模型简介

ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型，基于 General Language Model (GLM) 架构，具有 62 亿参数。

chatglm对显存的要求最低为6GB
显存要求

2 模型使用

2.1 预训练准备：

模型加载：使用transformers 自动加载模型，网速限制，加载比较慢
本地下载模型，① Hugging Face Hub 网址：https://huggingface.co/THUDM/chatglm2-6b/tree/main
② 清华镜像源下载模型：地址：https://cloud.tsinghua.edu.cn/d/674208019e314311ab5c/
③ 本人百度网盘整理：链接：https://pan.baidu.com/s/16VwlyCrLlpbEsNP0oPh2xg?pwd=0982
提取码：0982

2.2 代码下载及环境安装

1 代码下载
① 使用git ： git clone https://github.com/THUDM/ChatGLM2-6B
②直接下载压缩包，在上面网址直接download zip
2 环境安装
① 安装conda虚拟环境（可选项）conda create -n chatglm python=3.7
② 安装依赖包，进入ChatGLM2-6B目录，pip install -r requirements.txt

2.3 模型使用

模型加载
根据自己的显卡内存，修改模型加载项，如下，由于我的电脑是12G显存，使用原始的模型，内存不够，因此添加了.quantize(8)
model_path，为上面下载的预训练好的模型（可以使用百度网盘分享的）

model_path=r"E:\download\chatglm2-6b"
model = AutoModel.from_pretrained(model_path, trust_remote_code=True).quantize(8).cuda()

模型运行
方式一：自建测试文件

from transformers import AutoTokenizer, AutoModel

# model_path=r"E:\download\chatglm2-6b-int4"
model_path=r"E:\download\chatglm2-6b"

tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)
# model = AutoModel.from_pretrained(model_path, trust_remote_code=True, device='cuda')
# 按需修改，目前只支持 4/8 bit 量化
model = AutoModel.from_pretrained(model_path, trust_remote_code=True).quantize(8).cuda()
# model = AutoModel.from_pretrained(model_path,trust_remote_code=True).cuda()
model = model.eval()
response, history = model.chat(tokenizer, "你好", history=[])
print(response)

response, history = model.chat(tokenizer, "晚上睡不着应该怎么办", history=history)
print(response)

方式二：
使用web_demo.py
直接运行即可
方式三：使用streamlit
需要先找到streamlit所在文件，再执行以下命令

D:\pythonapp\anacondas\envs\chatglm\Scripts\streamlit  run web_demo2.py

3 模型效果：

在这里插入图片描述
鸡兔同笼问题

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/734069.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

ChatGLM2-6b本地部署

1 模型简介

2 模型使用

2.1 预训练准备：

2.2 代码下载及环境安装

2.3 模型使用

3 模型效果：

相关文章

【高级程序设计语言C++】类与对象

Java新特性：Lambda表达式

第五章——循环和关系表达式

107、基于51单片机多路无线调频对讲机系统设计(程序+原理图+PCB源文件+参考论文+外文翻译+任务书+开题报告+硬件设计资料+元器件清单等)

深度理解 JAVA序列化

Android 热修复一

极速上手k8s，Kubernetes 从入门到摸鱼系列-理论篇

「已解决」模块““umi“” ““@umijs/max“” 没有导出的成员“useRequest” “request” 问题的所有方法汇总

用JShaman本地部署版，加密2.7MB的Webpack生成的JS文件

unordered_map模拟实现｜STL源码剖析系列｜开散列

点云最小外包矩形计算

[工业互联-19]：如何在QT中增加SOEM主站

用OpenCV创建一张灰度黑色图像并设置某一列为白色

【算法 -- LeetCode】（13）罗马数字转整数

哈希表和字符串专题1—205. 同构字符串 1002. 查找共用字符 925. 长按键入 844.比较含退格的字符串 C++实现

AI绘画：StableDiffusion炼丹Lora攻略-实战萌宠图片生成

管理类联考——逻辑——记忆篇——数字编码——公式

MySQL练习题(2)

Coverity 2021.9 for win Coverity 2022.6 for linux

JVM04-优化JVM内存分配以及内存持续上升问题和CPU过高问题排查