趋动云GPU云平台部署ChatGLM-6B

news2024/11/25 1:04:21

目录

ChatGLM-6B是什么?

模型部署

Step1. 创建项目并上传代码

Step2. 环境准备

Step3. 加载模型

ChatGLM-6B是什么?

ChatGLM-6B是一个基于GLM的生成式对话模型。由清华大学团队开发,旨在改进对话机器人的生成质量和逻辑。

模型部署

模型部署过程按照Dtatawhale文档给出的教程就可以。

如何用免费GPU线上跑AI项目实践 - 飞书云文档 (feishu.cn)

Step1. 创建项目并上传代码

  1. 进入趋动云用户工作台,选择:当前空间,请确保当前所在空间是注册时系统自动生成的空间。

  2. 点击:快速创建,选择创建项目,创建新项目。

  3. 填写相关的项目信息,镜像数据集选择如下。

  • 项目名称:可自定义,如 “ChatGLM2-6B广告文案创作”。

  • 代码:选择 本地代码。

  • 镜像:选择 官方 镜像 PyTorch 2.0.0。

  • 数据:选择 社区 > 全部 下的 AdvertiseGen 数据集;再选择 公开 下的 chatglm2-6b(作者为 “趋动云小助手”)。

        4. 单击 创建,创建成功,同时弹出 上传代码 框。

        5. 点击已获取的代码 (opens new window)下载压缩包,然后直接拖拽至 “上传代码” 框中,随后单击 “确定”。

Step2. 环境准备

  1. 左侧导航栏选择 开发,随后单击 初始化开发环境实例

  2. 资源配置选B1.large,镜像中先点x,再点添加镜像,选择 公开 中的 ChatGLM2-6B_PyTorch2.0.1(作者为“趋动云小助手”),然后点击确认

  3. 点击添加端口,内部端口数字可自由填写,如77。确认无误后,点击右下角的确认

  4. 环境初始化好以后,点击进入开发环境

  5. 左侧目录进入 ChatGLM2-6B/requirements.txt,增加如下内容并保存:

        rouge_chinese

        nltk

        jieba

        datasets

        6. 切换至网页终端,并执行如下命令。等待约 1-2 分钟执行完,执行过程中无 error 报错,则安装成功。

pip install -r ChatGLM2-6B/requirements.txt -i https://pypi.virtaicloud.com/repository/pypi/simple

Step3. 加载模型

以命令行形式加载模型并进行问答测试,来确认环境是否准备成功。

  1. 切换至 JupyterLab。修改 cli_demo.py 中模型的地址,将 THUDM/chatglm2-6b 替换为 /gemini/data-2 (即模型实际挂载到环境的地址)

  2. 切换至 网页终端。执行如下命令唤醒交互式对话。等待最终 Loading checkpoint shards: 100% 且返回 用户: 字样。。

    python ChatGLM2-6B/cli_demo.py
  3. 用户: 行输入您的问题并回车,等待 ChatGLM 回答您的问题。 ChatGLM: 行若有相应信息返回,则成功。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1043185.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

React Native搭建Android开发环境

React Native搭建Android开发环境 搭建Android开发环境一、下载JDK二、安装Android Studio2.1 配置 ANDROID_HOME 环境变量 三、初始化项目 搭建Android开发环境 我的电脑是windows系统,所以只能搭建Android,如果电脑是mac,既可以搭建Androi…

Repurposing Segmentation as a Practical LVI-NULL Mitigation in SGX【USENIX`22】

目录 摘要引言贡献 背景瞬态执行攻击负载值注入LVI-NULL Intel SGX虚拟内存与分段对象重新定位 威胁模型硬件软件 摘要 负载值注入(LVI)在类似Spectre的混乱代理攻击中使用Meltdown类型的数据流。LVI已经在对英特尔SGX飞地的实际攻击中得到了证明&#…

【深度学习实验】卷积神经网络(三):自定义二维卷积层:步长、填充、输入输出通道

目录 一、实验介绍 二、实验环境 1. 配置虚拟环境 2. 库版本介绍 三、实验内容 0. 导入必要的工具包 1. 步长、填充 a. 二维互相关运算(corr2d) b. 二维卷积层类(Conv2D) c. 模型测试 d. 代码整合 2. 输入输出通道 a…

面试打底稿④ 专业技能的第四部分

简历原文 抽查部分 了解Python的使用(第一篇关于Python升级版本bug解决的文章斩获6W阅读),用python实现了几篇图像信息隐藏领 域论文的复现(博客中有提及); 了解Django基本框架,写过Django框架的…

手把手教你实现法玛三因子模型

数量技术宅团队在CSDN学院推出了量化投资系列课程 欢迎有兴趣系统学习量化投资的同学,点击下方链接报名: 量化投资速成营(入门课程) Python股票量化投资 Python期货量化投资 Python数字货币量化投资 C语言CTP期货交易系统开…

xxl-job 执行器注册成功,但是xxl-admin 不显示

问题:项目启动成功后,日志显示执行器注册成功,但是xxl-job-admin 管理页面后台确无法查看到执行器信息。 经过百度后并结合官方文档说明,执行器客户端启动完成后,数据只会放在注册表xxl_job_registry 中。 而执行器管…

隐语 Meetup 北京站|精彩时刻大盘点!新品发布、行业案例、专家解读......欢迎围观

“隐语”是开源的可信隐私计算框架,内置 MPC、TEE、同态等多种密态计算虚拟设备供灵活选择,提供丰富的联邦学习算法和差分隐私机制 开源项目 github.com/secretflow gitee.com/secretflow 9月23日,隐语开源社区 Meetup 北京专场顺利举行&am…

sox音频处理和ffmpeg评测

ffmpeg音频处理不如sox,ffmpeg切分,最低切分是0.1秒,而sox可以切分更小单位0.001这种 ffmpeg处理视频等功能更全。 命令 ffmpeg -i 2.wav -y -ss 0.01 -acodec copy test.wav sox 2.wav output2.wav trim 0.01

redis部署与管理

目录 一、关系数据库与非关系型数据库: 1. 关系型数据库: 2.非关系型数据库: 二、关系型数据库和非关系型数据库区别: (1)数据存储方式不同: (2)扩展方式不同&#xf…

【100天精通Python】Day67:Python可视化_Matplotlib 绘制动画,2D、3D 动画 示例+代码

1 绘制2D动画(animation) Matplotlib是一个Python绘图库,它提供了丰富的绘图功能,包括绘制动画。要绘制动画,Matplotlib提供了FuncAnimation类,允许您创建基于函数的动画。下面是一个详细的Matplotlib动画示…

Django — 类视图和中间件

目录 一、类视图1、基于类的结构2、常见的类视图基类3、类视图的优点4、代码案例 二、中间件1、定义2、工作原理3、自带中间件4、中间件开发流程5、自定义中间件6、案例 一、类视图 类视图(Class-Based Views)是 Django 中用于处理 HTTP 请求和生成 HTT…

24届近3年河海大学自动化考研院校

⚜️所谓又专又精,专是指我们售后群团队上百人都是自动化研究生,精是指我们只做自动化这一门专业学科7年了,研究到极致! 🔉今天学长给大家带来的是河海大学控制考研分析 满满干货~还不快快点赞收藏 目录…

XC9700 单通道限流电流负载开关 低内阻负载开关

XC9700是一种低成本、低电压、单P-MOSFET负载开关,为自供电和总线供电的通用串行总线(USB)应用进行了优化。该开关的输入范围从2.4V到5.5V,使它非常适合3V和5V系统。该开关的低RDS(ON),80mΩ&am…

怒刷LeetCode的第16天(Java版)

目录 第一题 题目来源 题目内容 解决方法 方法一:迭代 方法二:模拟 方法三:循环模拟 方法四:传递 第二题 题目来源 题目内容 解决方法 方法一:回溯 方法二:枚举优化 第三题 题目来源 题目…

Unity之NetCode多人网络游戏联机对战教程(3)--NetworkObject组件讲解

文章目录 NetworkObjectAlways Replicate As RootSynchronization TransformActive Scene SynchronizationScene Migration SynchronizationSpawn With ObserversDont Destroy With OwnerAuto Object Parent Sync 后话 NetworkObject 为了复制任何Netcode感知属性或发送/接收R…

Linux生产者和消费者模型 条件变量 信号量

/*条件变量类型 pthread_cond_tint pthread_cond_init(pthread_cond_t *restrict cond, const pthread_condattr_t *restrict attr);int pthread_cond_destory(pthread_cond_t * cond);int pthread_cond_wait(pthread_cond_t *restrict cond, const pthread_mutex_t *restrict …

人生第一个java项目 学生管理系统

开始编程 建类 开始主要部分 main()部分 方法部分

Nodejs+vue高校机房设备管理系统jt07u

开发语言 node.js 框架:Express 前端:Vue.js 数据库:mysql 数据库工具:Navicat 开发软件:VScode 集成IDE对高校机房设备管理系统统进行开发,整合系统的各个模块。 拟开发的高校机房设备管理系统通过测试,确保在最大负载的情况下…

新型crypt勒索病毒,都有哪些特征?勒索病毒解密,数据恢复

近日,云天数据恢复中心在接受用户咨询的过程中发现,市场上悄然出现了一种新型的勒索病毒——crypt勒索病毒,接下来我们将这种类型的勒索病毒做一个全面的分析。 一,中了crypt勒索病毒的特征 在桌面以及多个文件夹中都有一个名称为…

matlab产生指定功率的噪声信号、固定SNR的信号

randn函数产生噪声信号 首先要理解信号的幅度和功率,例如信号的幅度为 U U U,那么信号的功率就是 U 2 U^2 U2,他们之间是平方的关系。 matlab中randn函数用法,产生正态分布的随机数或矩阵的函数。 randn:产生均值为0…