趋动云GPU云平台部署ChatGLM-6B

趋动云GPU云平台部署ChatGLM-6B

news2026/2/15 14:19:02

目录

ChatGLM-6B是什么？

模型部署

Step1. 创建项目并上传代码

Step2. 环境准备

Step3. 加载模型

ChatGLM-6B是什么？

ChatGLM-6B是一个基于GLM的生成式对话模型。由清华大学团队开发，旨在改进对话机器人的生成质量和逻辑。

模型部署

模型部署过程按照Dtatawhale文档给出的教程就可以。

如何用免费GPU线上跑AI项目实践 - 飞书云文档 (feishu.cn)

Step1. 创建项目并上传代码

进入趋动云用户工作台，选择：当前空间，请确保当前所在空间是注册时系统自动生成的空间。
点击：快速创建，选择创建项目，创建新项目。
填写相关的项目信息，镜像及数据集选择如下。

项目名称：可自定义，如 “ChatGLM2-6B广告文案创作”。
代码：选择本地代码。
镜像：选择官方镜像 PyTorch 2.0.0。
数据：选择社区 > 全部下的 AdvertiseGen 数据集；再选择公开下的 chatglm2-6b（作者为 “趋动云小助手”）。

4. 单击创建，创建成功，同时弹出上传代码框。

5. 点击已获取的代码 (opens new window)下载压缩包，然后直接拖拽至 “上传代码” 框中，随后单击 “确定”。

Step2. 环境准备

左侧导航栏选择开发，随后单击初始化开发环境实例。
资源配置选B1.large，镜像中先点x，再点添加镜像,选择公开中的 ChatGLM2-6B_PyTorch2.0.1（作者为“趋动云小助手”）,然后点击确认
点击添加端口，内部端口数字可自由填写，如77。确认无误后，点击右下角的确认
环境初始化好以后，点击进入开发环境
左侧目录进入 ChatGLM2-6B/requirements.txt，增加如下内容并保存：

rouge_chinese

nltk

jieba

datasets

6. 切换至网页终端，并执行如下命令。等待约 1-2 分钟执行完，执行过程中无 error 报错，则安装成功。

pip install -r ChatGLM2-6B/requirements.txt -i https://pypi.virtaicloud.com/repository/pypi/simple

Step3. 加载模型

以命令行形式加载模型并进行问答测试，来确认环境是否准备成功。

切换至 JupyterLab。修改 cli_demo.py 中模型的地址，将 THUDM/chatglm2-6b 替换为 /gemini/data-2 （即模型实际挂载到环境的地址）
切换至网页终端。执行如下命令唤醒交互式对话。等待最终 Loading checkpoint shards: 100% 且返回 用户： 字样。。
```
python ChatGLM2-6B/cli_demo.py
```
在 用户： 行输入您的问题并回车，等待 ChatGLM 回答您的问题。 ChatGLM： 行若有相应信息返回，则成功。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1043185.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

React Native搭建Android开发环境

React Native搭建Android开发环境

React Native搭建Android开发环境搭建Android开发环境一、下载JDK二、安装Android Studio2.1 配置 ANDROID_HOME 环境变量三、初始化项目搭建Android开发环境我的电脑是windows系统，所以只能搭建Android，如果电脑是mac，既可以搭建Androi…

阅读更多...

Repurposing Segmentation as a Practical LVI-NULL Mitigation in SGX【USENIX`22】

Repurposing Segmentation as a Practical LVI-NULL Mitigation in SGX【USENIX`22】

目录摘要引言贡献背景瞬态执行攻击负载值注入LVI-NULL Intel SGX虚拟内存与分段对象重新定位威胁模型硬件软件摘要负载值注入（LVI）在类似Spectre的混乱代理攻击中使用Meltdown类型的数据流。LVI已经在对英特尔SGX飞地的实际攻击中得到了证明&#…

阅读更多...

【深度学习实验】卷积神经网络（三）：自定义二维卷积层：步长、填充、输入输出通道

【深度学习实验】卷积神经网络（三）：自定义二维卷积层：步长、填充、输入输出通道

目录一、实验介绍二、实验环境 1. 配置虚拟环境 2. 库版本介绍三、实验内容 0. 导入必要的工具包 1. 步长、填充 a. 二维互相关运算（corr2d） b. 二维卷积层类（Conv2D） c. 模型测试 d. 代码整合 2. 输入输出通道 a…

阅读更多...

面试打底稿④ 专业技能的第四部分

面试打底稿④ 专业技能的第四部分

简历原文抽查部分了解Python的使用（第一篇关于Python升级版本bug解决的文章斩获6W阅读），用python实现了几篇图像信息隐藏领域论文的复现（博客中有提及）； 了解Django基本框架，写过Django框架的…

阅读更多...

手把手教你实现法玛三因子模型

手把手教你实现法玛三因子模型

数量技术宅团队在CSDN学院推出了量化投资系列课程欢迎有兴趣系统学习量化投资的同学，点击下方链接报名： 量化投资速成营（入门课程） Python股票量化投资 Python期货量化投资 Python数字货币量化投资 C语言CTP期货交易系统开…

阅读更多...

xxl-job 执行器注册成功，但是xxl-admin 不显示

xxl-job 执行器注册成功，但是xxl-admin 不显示

问题：项目启动成功后，日志显示执行器注册成功，但是xxl-job-admin 管理页面后台确无法查看到执行器信息。经过百度后并结合官方文档说明，执行器客户端启动完成后，数据只会放在注册表xxl_job_registry 中。而执行器管…

阅读更多...

隐语 Meetup 北京站｜精彩时刻大盘点！新品发布、行业案例、专家解读......欢迎围观

隐语 Meetup 北京站｜精彩时刻大盘点！新品发布、行业案例、专家解读......欢迎围观

“隐语”是开源的可信隐私计算框架，内置 MPC、TEE、同态等多种密态计算虚拟设备供灵活选择，提供丰富的联邦学习算法和差分隐私机制开源项目 github.com/secretflow gitee.com/secretflow 9月23日，隐语开源社区 Meetup 北京专场顺利举行&am…

阅读更多...

sox音频处理和ffmpeg评测

sox音频处理和ffmpeg评测

ffmpeg音频处理不如sox，ffmpeg切分，最低切分是0.1秒，而sox可以切分更小单位0.001这种 ffmpeg处理视频等功能更全。命令 ffmpeg -i 2.wav -y -ss 0.01 -acodec copy test.wav sox 2.wav output2.wav trim 0.01

阅读更多...

redis部署与管理

redis部署与管理

目录一、关系数据库与非关系型数据库： 1. 关系型数据库： 2.非关系型数据库： 二、关系型数据库和非关系型数据库区别： （1）数据存储方式不同： （2）扩展方式不同&#xf…

阅读更多...

【100天精通Python】Day67：Python可视化_Matplotlib 绘制动画，2D、3D 动画示例+代码

【100天精通Python】Day67：Python可视化_Matplotlib 绘制动画，2D、3D 动画示例+代码

1 绘制2D动画（animation） Matplotlib是一个Python绘图库，它提供了丰富的绘图功能，包括绘制动画。要绘制动画，Matplotlib提供了FuncAnimation类，允许您创建基于函数的动画。下面是一个详细的Matplotlib动画示…

阅读更多...

Django — 类视图和中间件

Django — 类视图和中间件

目录一、类视图1、基于类的结构2、常见的类视图基类3、类视图的优点4、代码案例二、中间件1、定义2、工作原理3、自带中间件4、中间件开发流程5、自定义中间件6、案例一、类视图类视图（Class-Based Views）是 Django 中用于处理 HTTP 请求和生成 HTT…

阅读更多...

24届近3年河海大学自动化考研院校

24届近3年河海大学自动化考研院校

⚜️所谓又专又精，专是指我们售后群团队上百人都是自动化研究生，精是指我们只做自动化这一门专业学科7年了，研究到极致！ 🔉今天学长给大家带来的是河海大学控制考研分析满满干货～还不快快点赞收藏目录…

阅读更多...

XC9700 单通道限流电流负载开关低内阻负载开关

XC9700 单通道限流电流负载开关低内阻负载开关

XC9700是一种低成本、低电压、单P-MOSFET负载开关，为自供电和总线供电的通用串行总线（USB）应用进行了优化。该开关的输入范围从2.4V到5.5V，使它非常适合3V和5V系统。该开关的低RDS（ON），80mΩ&am…

阅读更多...

怒刷LeetCode的第16天（Java版）

怒刷LeetCode的第16天（Java版）

目录第一题题目来源题目内容解决方法方法一：迭代方法二：模拟方法三：循环模拟方法四：传递第二题题目来源题目内容解决方法方法一：回溯方法二：枚举优化第三题题目来源题目…

阅读更多...

Unity之NetCode多人网络游戏联机对战教程(3)--NetworkObject组件讲解

Unity之NetCode多人网络游戏联机对战教程(3)--NetworkObject组件讲解

文章目录 NetworkObjectAlways Replicate As RootSynchronization TransformActive Scene SynchronizationScene Migration SynchronizationSpawn With ObserversDont Destroy With OwnerAuto Object Parent Sync 后话 NetworkObject 为了复制任何Netcode感知属性或发送/接收R…

阅读更多...

Linux生产者和消费者模型条件变量信号量

Linux生产者和消费者模型条件变量信号量

/*条件变量类型 pthread_cond_tint pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);int pthread_cond_destory(pthread_cond_t * cond);int pthread_cond_wait(pthread_cond_t *restrict cond, const pthread_mutex_t *restrict …

阅读更多...

人生第一个java项目学生管理系统

人生第一个java项目学生管理系统

开始编程建类开始主要部分 main()部分方法部分

阅读更多...

Nodejs+vue高校机房设备管理系统jt07u

Nodejs+vue高校机房设备管理系统jt07u

开发语言 node.js 框架：Express 前端:Vue.js 数据库：mysql 数据库工具：Navicat 开发软件：VScode 集成IDE对高校机房设备管理系统统进行开发,整合系统的各个模块。拟开发的高校机房设备管理系统通过测试,确保在最大负载的情况下…

阅读更多...

新型crypt勒索病毒，都有哪些特征？勒索病毒解密，数据恢复

新型crypt勒索病毒，都有哪些特征？勒索病毒解密，数据恢复

近日，云天数据恢复中心在接受用户咨询的过程中发现，市场上悄然出现了一种新型的勒索病毒——crypt勒索病毒，接下来我们将这种类型的勒索病毒做一个全面的分析。一，中了crypt勒索病毒的特征在桌面以及多个文件夹中都有一个名称为…

阅读更多...

matlab产生指定功率的噪声信号、固定SNR的信号

matlab产生指定功率的噪声信号、固定SNR的信号

randn函数产生噪声信号首先要理解信号的幅度和功率，例如信号的幅度为 U U U，那么信号的功率就是 U 2 U^2 U2，他们之间是平方的关系。 matlab中randn函数用法，产生正态分布的随机数或矩阵的函数。 randn：产生均值为0…

阅读更多...

推荐文章

最新文章