ChatGLM3 Linux 部署

ChatGLM3 Linux 部署

news2025/7/4 20:40:45

1.首先需要下载本仓库：

git clone https://github.com/THUDM/ChatGLM3

2.查看显卡对应的torch 版本

官方文档说明： Start Locally | PyTorch

例如：

a. 先查看显卡的CUDA版本

nvcc --version

查看对应版本

Previous PyTorch Versions | PyTorch

例如cuda 12.1 对应的torch 2.2.0

修改对应的torch版本

3.安装依赖

pip install -r requirements.txt

4.下载模型到本地

推荐在魔塔社区下载，相对比较快

魔搭社区

下载方式

在当前目录创建一个demo.py 文件

from modelscope import snapshot_download
model_dir = snapshot_download("ZhipuAI/chatglm3-6b", revision = "v1.0.0")

如下所示

安装依赖modelscope

pip install modelscope 后

运行demo.py文件

等待下载，下载后一般在这目录下

/root/.cache/modelscope/hub/ZhipuAI/chatglm3-6b/

配置环境变量

在root目录下找到

.bashrc文件

在最后添加上MODEL_PATH，跟py代码中环境变量名保持一致

然后保存退出重新加载一下该文件保证生效

source ~/.bashrc

然后进入项目地址 basic_demo 目录后运行web_demo_gradio.py

python web_demo_gradio.py

启动web_demo_gradio.py的话需要安装几个依赖

1、安装 peft

pip install peft

2、安装 gradio

pip install gradio

然后再启动

启动如果要内网映射到外网端口

在web_demo_gradio.py 代码最后

demo.launch(server_name="127.0.0.1", server_port=7870, inbrowser=True, share=False)

改成

demo.launch(server_name="0.0.0.0", server_port=7870, inbrowser=True, share=False)

如

启动后如图：

---如果要启动api_server.py

需要下载

BAAI/bge-large-zh-v1.5

下载方式和下载模型一致

在当前目录创建一个demo2.py 文件

from modelscope import snapshot_download
model_dir = snapshot_download("AI-ModelScope/bge-large-zh-v1.5", revision='master')

下载完成后，地址跟模型地址差不多

新增一个

EMBEDDING_PATH

环境变量

方法

在root目录下找到

.bashrc文件

在最后添加上MODEL_PATH，跟py代码中环境变量名保持一致

然后保存退出重新加载一下该文件保证生效

source ~/.bashrc

重新进入api_server.py目录

启动api_server.py

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1537629.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Error:No such property: GradleVersion for class: JetGradlePlugin

Error:No such property: GradleVersion for class: JetGradlePlugin

Gradle版本对照表 Android Gradle 插件版本在项目的根目录（不是App目录）下的build.gradle文件中，如图插件所需的Gradle 版本在gradle目录下的gradle-wrapper.properties文件中，如图

阅读更多...

安全认证|CISSP认证是什么证书？考了有什么用？能做什么工作？

安全认证|CISSP认证是什么证书？考了有什么用？能做什么工作？

很多人总是听说CISSP是顶级的信息安全证书，在国内或者国外都有盛誉，那么CISSP到底是个什么样的证书，本期就给大家介绍下！ 什么是CISSP CISSP（Certification for Information System Security Professional&#xff0…

阅读更多...

三份天注定，七分靠XX？

三份天注定，七分靠XX？

文 | 螳螂观察作者 | 陈小江 1988年，中国宝岛台湾，蒋经国过世后，社会运动风起云涌。在所谓“解严”的时代氛围里，人们对前途虽然迷茫，但却充满打拼的热情。那时节，40岁的台湾歌手叶启田，开…

阅读更多...

【消息队列开发】实现消费者订阅消息

【消息队列开发】实现消费者订阅消息

文章目录 🍃前言🌳关于订阅消息方法参数解析🎋如何实现将消息推送给消费者🎍消费者类🍀消费消息的流程🎄如何实现消息确认呢？⭕总结 🍃前言本次开发任务实现消费者订阅消息 &am…

阅读更多...

公司内部局域网怎么适用飞书？

公司内部局域网怎么适用飞书？

随着数字化办公的普及，企业对于内部沟通和文件传输的需求日益增长。飞书作为一款集成了即时通讯、云文档、日程管理、视频会议等多种功能的智能协作平台，已经成为许多企业提高工作效率的首选工具。本文将详细介绍如何在公司内部局域网中应用飞书&#xf…

阅读更多...

电脑Wi-Fi无法连接如何排查

电脑Wi-Fi无法连接如何排查

Wi-Fi是一个神奇的东西，总是能在某一天莫名其妙的连不上让我们疯狂糟心！！！ 呉師傅准备了几个解决方法来帮助大家解决连不上Wi-Fi的问题； 1、疑难解答功能系统自带的【疑难解答】功能不妨试一试，也能一定…

阅读更多...

【AAAI 2024】M2Doc：文档版面分析的可插拔多模态融合方法

【AAAI 2024】M2Doc：文档版面分析的可插拔多模态融合方法

一、文章介绍文档版面分析任务是文档智能的一个关键任务。然而，现有的很多文档版面分析研究方法都基于通用目标检测方法，忽视了文档的文本特征而仅仅只关注于视觉特征。近年来，基于预训练的文档智能模型在很多文档下游任务中都取得了成功&a…

阅读更多...

左旋字符串功能的实现

左旋字符串功能的实现

实现一个函数，可以左旋字符串中的k个字符。例如： #1ABCD左旋一个字符得到BCDA #2ABCD左旋两个字符得到CDAB 由此图可知，其字符串长度为4，每次经历四次左旋后又回到了初始位置，所以是以字符串长度len为一个循环&…

阅读更多...

Echarts Demo集

Echarts Demo集

地址

阅读更多...

微服务cloud--抱团取暖吗 netflix很多停更了

微服务cloud--抱团取暖吗 netflix很多停更了

抱团只会卷，卷卷也挺好的 DDD 高内聚低耦合服务间不要有业务交叉通过接口调用分解技术实现的复杂性，围绕业务概念构建领域模型；边界划分业务中台： 数据中台： 技术中台： 核心组件 eureka&#x…

阅读更多...

(done) ROC曲线和 AUC值分别是什么？

(done) ROC曲线和 AUC值分别是什么？

来源：https://www.bilibili.com/video/BV1wz4y197LU/?spm_id_from333.337.search-card.all.click&vd_source7a1a0bc74158c6993c7355c5490fc600 在二分类问题下，我们的模型通常会输出一个概率值，通过判断概率值和阈值threshold 的大小…

阅读更多...

docker 安装部署 jenkins

docker 安装部署 jenkins

今天小☀ 给大家普及一下什么是 jenkins！！ Jenkins是一个开源软件项目，基于Java开发的持续集成工具。它提供了一个开放易用的软件平台，使软件项目可以进行持续集成。Jenkins起源于Hudson，主要用于持续、自动地构建、…

阅读更多...

动态内存数组（malloc、calloc、realloc、free）

动态内存数组（malloc、calloc、realloc、free）

一、为什么要创建动态内存数组动态内存，顾名思义就是说在内存中非固定的申请数组在学习该项方法前我们申请内存的方法无非就两种：直接创建变量/通过创建数组的方式来申请空间。那么直接创建变量/通过创建数组的方式来申请空间的缺点就是一旦创建成…

阅读更多...

基于python+vue拍卖行系统的设计与实现flask-django-nodejs-php

基于python+vue拍卖行系统的设计与实现flask-django-nodejs-php

拍卖行系统的目的是让使用者可以更方便的将人、设备和场景更立体的连接在一起。能让用户以更科幻的方式使用产品，体验高科技时代带给人们的方便，同时也能让用户体会到与以往常规产品不同的体验风格。与安卓，iOS相比较起来，拍卖行…

阅读更多...

2024学习鸿蒙开发，未来发展如何？

2024学习鸿蒙开发，未来发展如何？

一、前言想要了解一个领域的未来发展如何，可以从如下几点进行，避免盲从： 国家政策落地情况就业市场如何学习通过上述三点，就能分析出一个行业的趋势。大家可以看到，我上面的总体逻辑就是根据国家政策来分析未来方…

阅读更多...

大数据技术在工厂生产数字转型中的应用与价值

大数据技术在工厂生产数字转型中的应用与价值

hello宝子们...我们是艾斯视觉擅长ui设计和前端开发10年经验！希望我的分享能帮助到您！如需帮助可以评论关注私信我们一起探讨！致敬感谢感恩！ 随着大数据技术的快速发展，越来越多的企业开始关注并应用大数据技术&#x…

阅读更多...

第6讲-MIPS处理器（3）MIPS单周期处理器设计

第6讲-MIPS处理器（3）MIPS单周期处理器设计

三. MIPS单周期处理器设计 1.单周期数据通路设计

阅读更多...

联合国通过首个全球人工智能决议草案

联合国通过首个全球人工智能决议草案

当地时间3月21日，联合国大会一致通过了全球第一个关于人工智能（AI）的决议草案，以期能够保护个人数据、保障人权，并能有效监控其安全风险。该决议由美国提出，包括中国在内的其他121个国家共同参与了制定&am…

阅读更多...

移动硬盘故障解析：解决无法访问且位置不可用问题

移动硬盘故障解析：解决无法访问且位置不可用问题

在我们日常的工作和生活中，移动硬盘已成为存储和传输数据的重要工具。然而，有时我们会遇到移动硬盘无法访问且位置不可用的情况，这无疑给数据的存储和访问带来了极大的困扰。本文将深入探讨这一问题，分析其原因，并给出…

阅读更多...

提升交付效率：Booking.com 金融技术团队的成功实践

提升交付效率：Booking.com 金融技术团队的成功实践

Booking.com 金融技术业务部门的团队对其平台的后端和前端实施了一系列改进措施，并通过 DORA 指标将交付性能提高了一倍。此外，还使用了微前端 (MFE) 模式，将单体 FE 应用程序分解为多个可单独部署的分解应用程序。 2022 年年中，B…

阅读更多...

推荐文章

最新文章