快速在WIN11中本地部署chatGLM3

news2025/1/9 1:18:25

具体请看智谱仓库github：GitHub - THUDM/ChatGLM3: ChatGLM3 series: Open Bilingual Chat LLMs | 开源双语对话语言模型

或者Huggingface:https://huggingface.co/THUDM/chatglm3-6b

1. 利用Anaconda建立一个虚拟环境：

conda create -n chatglm3 python=3.11 (版本太低安装streamlit会出问题)
conda activate chatglm3

2. 安装torch的GPU版：

根据自己本地计算机显卡和系统选择官方上相应的指令：

conda install pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c nvidia

这块安装时间较长，耐心等待，反复尝试，直到安装成功为止。其中，需要测试一下GPU的CUDA功能是否可以正常使用：

print(torch.version.cuda)	#查看cuda版本
print(torch.cuda.is_available())  # 查看cuda是否可用
print(torch.cuda.device_count())  # 查看可行的cuda数目

如果以上指令运行没问题，显示True，说明可以GPU可以正常使用。

3.开始安装ChatGLM3，根据以上官网地址的说明进行如下操作：

选择D盘或者其他盘建立一个本地文件，利用管理员权限打开一个cmd窗口运行如下命令：

git clone https://github.com/THUDM/ChatGLM3
cd ChatGLM3

然后使用 pip 安装依赖：

pip install -r requirements.txt

此外，使用 Code Interpreter 还需要安装 Jupyter 内核：

ipython kernel install --name chatglm3-demo --user

然后，进入basic_demo目录下，实现三种新的样例测试

1）案例1——指令窗口

运行如下指令：

python cli_demo.py

指令对话窗口案例2：

2）案例2——Gradio

运行如下命令：

python web_demo.py

注意：如果不输出结果，是由于Gradio的版本过高，建议安装pip install gradio==3.40版本。太低会报错，比如3.39版本。

3) 案例3——streamlit

运行如下命令：

streamlit run web_demo2.py

其中，需要修改一下路径，将下载好的模型放到本目录下，将第6行程序改为

将MODEL_PATH = os.environ.get('MODEL_PATH', 'THUDM/chatglm3-6b')改为
MODEL_PATH = os.environ.get('MODEL_PATH', '../chatglm3-6b')

这样所有的程序和模型都在一起，方便管理。

程序启动之后，浏览器显示如下：

安装过程中一些注意事项：

遇到“RuntimeError: nvrtc: error: failed to open nvrtc-builtins64_121.dll.
Make sure that nvrtc-builtins64_121.dll is installed correctly.”

需要将虚拟环境下的“nvrtc-builtins64_121.dll”文件拷贝到C:\Windows\System32目录下，即可解决。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1245244.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

快速在WIN11中本地部署chatGLM3

相关文章

U盘启动制作工具Rufus

DB2中实现数据字段的拼接（LISTAGG() 与 xml2clob、xmlagg）

【论文阅读笔记】Smil: Multimodal learning with severely missing modality

SpringBoot整合Redis，redis连接池和RedisTemplate序列化

DALSA.SaperaLT.SapClassBasic无法加载，试图加载格式不正确的程序,c#

【LeetCode刷题-链表】--61.旋转链表

【OJ比赛日历】快周末了，不来一场比赛吗？ #11.25-12.01 #17场

Linux(Centos)上使用crontab实现定时任务(定时执行脚本)

案例018:基于微信小程序的实习记录系统

Java核心知识点整理大全10-笔记

服务器流量包扣减规则

HTB Napper WriteUp

Linux文件查看命令

设计模式——行为型模式（一）

Java基层卫生健康云综合管理（云his）系统源码

对tensor的处理函数：expand_as（尺寸扩展），nonzero（获取非零元素索引）

一款专为POS机设计的芯片解决方案

HOOPS Web平台助力开发3D应用，实现超大规模3D web轻量化渲染与数据格式转换！

案例015:Java+SSM+uniapp基于微信小程序的校园防疫系统

基于JavaWeb+SpringBoot+Vue医院管理系统小程序的设计和实现