使用丹摩DAMODEL平台进行ChatGLM-6B-部署与使用

使用丹摩DAMODEL平台进行ChatGLM-6B-部署与使用

news2025/7/8 2:25:24

实例创建

1.先进入官网https://doc.damodel.com
进行注册，新用户可以免费送代金券，实名注册后一共可以得到50块钱，现在4090还搞活动，1.5左右一个钟。

2.创建后进入DAMODEL控制台创建实例：
如下：
在这里插入图片描述
这里创建实例，还需要创建密钥对，这个很简单，直接创建并保存在本地主机即可，然后再选这个密钥对就好。
如下：

接着就等待一小会就可以看到新建好的实例了。

ChatGLM-6B-部署

官方教程

官方教程其实也十分详细，下面贴出链接：
https://doc.damodel.com/profile/best_practice/ChatGLM-6B/cglm6b.html

个人教程与实际操作

下载ChatGLM-6B代码

在命令行里直接git：
git clone https://gitcode.com/applib/ChatGLM-6B.git
cd 进入ChatGLM-6B
pip install -r requirements.txt 装这个demo所需要的一些配置
如下图：

下载ChatGLM-6B模型

这里是我和官方教程不一样的地方，我选了魔塔社区的下载教程，并且全部下载了模型和一些文件。
官方教程是先下载到本地，然后再上传到服务器。
我是直接下载到云服务器。

我这里是先:

pip install modelscope
新建一个python文件，代码如下：
#模型下载
from modelscope import snapshot_download
model_dir = snapshot_download(‘ZhipuAI/chatglm3-6b’)
查看模型文件路径
/root/.cache/modelscope/hub/ZhipuAI/chatglm3-6b
如下图所示：

调用ChatGLM-6B模型

首先修改cli_demo.py中的模型路径
cli_demo.py中有俩行代码如下：
tokenizer = AutoTokenizer.from_pretrained(“THUDM/chatglm-6b”, trust_remote_code=True)
model = AutoModel.from_pretrained(“THUDM/chatglm-6b”, trust_remote_code=True).half().cuda()

需要修改为：
tokenizer = AutoTokenizer.from_pretrained(“/root/.cache/modelscope/hub/ZhipuAI/chatglm3-6b”, trust_remote_code=True)
model = AutoModel.from_pretrained(“/root/.cache/modelscope/hub/ZhipuAI/chatglm3-6b”, trust_remote_code=True).half().cuda()

在终端直接调用pythoncli_demo.py

如下图：
在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/2152843.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

在vue中:style 的几种使用方式

在vue中:style 的几种使用方式

在日常开发中:style的使用也是比较常见的： 亲测有效 1.最通用的写法 <p :style"{fontFamily:arr.conFontFamily,color:arr.conFontColor,backgroundColor:arr.conBgColor}">{{con.title}}</p> 2.三元表达式 <a :style"{height:…

阅读更多...

Hive企业级调优[4]——HQL语法优化之分组聚合优化

Hive企业级调优[4]——HQL语法优化之分组聚合优化

HQL语法优化之分组聚合优化优化说明在 Hive 中，未经优化的分组聚合通常通过一个 MapReduce Job 实现。Map 端负责读取数据，并按分组字段进行分区，通过 Shuffle 将数据发送至 Reduce 端，在 Reduce 端完成最终的聚合运算。 Hiv…

阅读更多...

进程和线程问题解答

进程和线程问题解答

线程和进程的概念、区别进程是操作系统进行资源分配的基本单位，拥有独立的地址空间，包括代码、数据、堆、栈等。进程间的切换开销较大。线程是进程中的一个执行单元，是系统中最小的执行单位，共享进程的资源，如代码…

阅读更多...

利士策分享，中日核污染水排海问题共识背后的深思

利士策分享，中日核污染水排海问题共识背后的深思

利士策分享，中日核污染水排海问题共识背后的深思近日，中日两国在应对福岛第一核电站核污染水排放问题上达成了重要共识，这一进展无疑值得肯定。然而，这背后所引发的关于金钱、责任与利益的讨论，却值得我们深入探究。…

阅读更多...

使用宝塔部署项目在win上

使用宝塔部署项目在win上

项目部署注意： 前后端部署项目，需要两个域名（二级域名，就是主域名结尾的域名，需要在主域名下添加就可以了），前端一个，后端一个思路：访问域名就会浏览器会加载前端的代…

阅读更多...

什么是3D展厅？有何优势？怎么制作3D展厅？

什么是3D展厅？有何优势？怎么制作3D展厅？

一、什么是3D展厅？ 3D展厅是一种利用三维技术构建的虚拟展示空间。它借助虚拟现实（VR）、增强现实（AR）等现代科技手段，将真实的展示空间数字化，呈现出逼真、立体、沉浸的展示效果。通过3D展厅&a…

阅读更多...

剪映草稿批量自动化导出教程实操演示

剪映草稿批量自动化导出教程实操演示

如何批量自动导出草稿？今天我来实操演示。首先打开谷歌剪映助手如果没有安装谷哥剪映助手的可以自行搜索下载，打开后找到批量导出多个草稿自动化导出。接着在右侧输入你要导出草稿的数量，其他的选项根据需求自行选择，最后点击立即…

阅读更多...

【网络安全 | 靶机搭建】解决虚拟机联网问题（NAT模式）

【网络安全 | 靶机搭建】解决虚拟机联网问题（NAT模式）

背景：在电脑上下载并使用VMware虚拟机后，重装VMware时可能会遇到虚拟机无法联网的问题（例如，ping www.baidu.com 无法通畅）。这种情况可能是网络适配器被删除导致的。本文将通过添加网络、安装网络适配器以及切换网络连接方式等步骤解决虚拟机的联网问题，具体步骤如下：…

阅读更多...

笔记：将WPF中可视化元素（Visual）保存为图像，如PNG,JPEG或BMP的方法简介

笔记：将WPF中可视化元素（Visual）保存为图像，如PNG,JPEG或BMP的方法简介

一、目的：将WPF中可视化元素（Visual）保存为图像，如PNG,JPEG或BMP的方法简介 BitmapEncoder 是 WPF 中用于将图像数据编码为特定格式的基类。它提供了将 BitmapSource 对象保存为各种图像格式（如 PNG、JPEG、BMP 等&…

阅读更多...

Android 空气质量刻度

Android 空气质量刻度

效果 attrs.xml <attr name"textSpace" format"dimension|reference" /><attr name"barSpace" format"dimension|reference" /><attr name"scaleHeight" format"dimension|reference" /><at…

阅读更多...

armbian debian 系统安装overlayroot后无法启用

armbian debian 系统安装overlayroot后无法启用

千盼万盼终于debian12可以用了它终于也跟ubuntu 系统一样可以安装overlayroot了但是满怀欣喜的装完了发现压根没法启动这。。。。。原因吗也简单。。。默认的映像里没有busybox......... 而它有这个要求。。。 overlayroot 包中有一个小错误：它要求 gr…

阅读更多...

微服务远程调用（nacos及OpenFeign简单使用）

微服务远程调用（nacos及OpenFeign简单使用）

问题：在微服务中，每个项目是隔离开的，当有一个项目请求其他项目中的数据时，必须发起网络请求，本文即对此问题展开讨论。 1.使用restTemplate发送请求 //发送请求ResponseEntity<List<ItemDTO>> response …

阅读更多...

影刀RPA实战：网页爬虫之药品数据

影刀RPA实战：网页爬虫之药品数据

1 实战目标这次给大家带来的实战示例是采集中国医药信息平台上的药品数据，主要获取药品名称，介绍，药品类型，处方类型，医保类型，参考价格，药品成分，性状，适应病症&#…

阅读更多...

Qt断点调试

Qt断点调试

Qt断点操作与调试窗口介绍_哔哩哔哩_bilibili 下图来自上面的视频！！！ 1.断点调试常用的快捷键 ShiftF11：单步退出所在的那个函数，进行下一步 2.查看函数的调用情况 3.监视变量的值（当前断点时的变量值&am…

阅读更多...

《操作系统 - 清华大学》第 0 章：操作系统概述 —— 内容概述

《操作系统 - 清华大学》第 0 章：操作系统概述 —— 内容概述

介绍一下有关操作系统的一个基本的一个概述： 比如说什么是操作系统？为什么要学习操作系统，以及如何学好操作系统？然后接下来会介绍一下，当前操作系统一些实例以及操作系统的历史，它的演变的一个过程。最后…

阅读更多...

wsl2桥接网络 ubuntu到弃坑到又跳坑

wsl2桥接网络 ubuntu到弃坑到又跳坑

搜索Hyper-V image.png 如下图进入虚拟交换机管理器 image.png image.png C:\Users\Administrator下存放 ; 这是 WSL 2 的配置文件 [wsl2] processors4 ; 设置 WSL 2 可以使用的最大 CPU 核心数为 4，自行修改 memory4GB …

阅读更多...

使用 KMeans 聚类算法对鸢尾花数据集进行无监督学习的简单示例

使用 KMeans 聚类算法对鸢尾花数据集进行无监督学习的简单示例

代码功能主要功能： 加载数据集： 代码使用 load_iris() 函数加载了鸢尾花数据集（Iris dataset）。这个数据集包含 150 条样本，每条样本有 4 个特征，对应于 3 种不同的鸢尾花。 KMeans 聚类： 使用…

阅读更多...

Flowable基础篇

Flowable基础篇

Flowable基础篇课程环境说明： JDK8Flowable6.7.2MySQL8 一、基础知识科普 1.工作流发展 BPM(BusinessProcessManagement)，业务流程管理是一种管理原则，通常也可以代指BPMS(BusinessProcessManagementSuite)，是一个实现整合不同…

阅读更多...

JAVA毕业设计178—基于Java+Springboot+vue的智能家具管理系统(源代码+数据库+万字论文)

JAVA毕业设计178—基于Java+Springboot+vue的智能家具管理系统(源代码+数据库+万字论文)

毕设所有选题： https://blog.csdn.net/2303_76227485/article/details/131104075 基于JavaSpringbootvue的智能家具管理系统(源代码数据库万字论文)178 一、系统介绍本项目前后端分离(可以改为ssm版本)，分为用户、管理员两种角色 1、用户&#xff1…

阅读更多...

从HarmonyOS升级到HarmonyOS NEXT-环信SDK数据迁移

从HarmonyOS升级到HarmonyOS NEXT-环信SDK数据迁移

2024年6月21日 HarmonyOS NEXT （后续称之为 NEXT） 正式发布，随着 NEXT 稳定版的逐渐临近，各个应用及SDK正在忙于适配 NEXT 系统，同样也面临着系统升级时如何对数据的迁移适配。本文通过使用环信 SDK 介绍如何从 Harmon…

阅读更多...

推荐文章

最新文章