大模型部署手记（5）ChatGLM2+Jetson AGX Orin

大模型部署手记（5）ChatGLM2+Jetson AGX Orin

news2025/10/26 5:49:33

1.简介：

组织机构：智谱/清华

代码仓：https://github.com/THUDM/ChatGLM2-6B

模型：THUDM/chatglm2-6b

下载：https://huggingface.co/THUDM/chatglm2-6b

镜像下载：https://aliendao.cn/models/THUDM/chatglm2-6b

硬件环境：Jetson AGX Orin

2.代码和模型下载

cd /home1/zhanghui

下载代码仓：

git clone https://github.com/THUDM/ChatGLM2-6B

git clone https://huggingface.co/THUDM/chatglm2-6b

查看 https://github.com/git-lfs/git-lfs/blob/main/INSTALLING.md

貌似是要安装git-lfs

sudo apt-get install git-lfs

重来：

git clone https://huggingface.co/THUDM/chatglm2-6b

GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/THUDM/chatglm2-6b

看来huggingface.co是怎么都连不上了。

查看镜像站：https://aliendao.cn/models/THUDM/chatglm2-6b

从镜像下载模型的方法如下：

cd /home1/zhanghui/aliendao

python3 model_download.py --mirror --repo_id THUDM/chatglm2-6b

实验表明镜像站下载大的模型文件大概率还是会会出现下载卡住的情形。

还是使用huggingface官网下载到本地的方式吧！

下载完毕后，可将下载好的文件移动到 /home1/zhanghui/ChatGLM2-6B/THUDM/chatglm2-6b 目录下（gitattributes文件可以改名为 .gitattributes)

3.安装依赖

做一个pytorch 2.0，python 3.8的conda环境。

conda create -n torch2.0 python=3.8

conda activate torch2.0

cd /home1/zhanghui

这个是jetson设备，需要安装专门的whl包。

打开https://forums.developer.nvidia.com/t/pytorch-for-jetson-version-1-10-now-available/72048

下载pytorch jetson专用安装包：

cd ..

下载pytorch 2.1版本：

wget https://developer.download.nvidia.cn/compute/redist/jp/v512/pytorch/torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl

下载pytorch 2.0版本：

wget https://nvidia.box.com/shared/static/i8pukc49h3lhak4kkn67tg9j4goqm0m7.whl

mv i8pukc49h3lhak4kkn67tg9j4goqm0m7.whl torch-2.0.0+nv23.05-cp38-cp38-linux_aarch64.whl

安装pytorch 2.1的版本试试：

pip3 install ./torch-2.1.0a0+41361538.nv23.06-cp38-cp38-linux_aarch64.whl

cd ChatGLM2-6B

安装依赖包：

修改requirements.txt文件，注释掉torch

pip3 install -r requirements.txt

4.部署验证

启动基于 Gradio 的网页版 demo

python web_demo.py

浏览器打开 http://192.168.199.181:7860/

在Jetson Orin的桌面上打开试试：

好像可以的。

提个问题试试：

查看GPU运行情况：

换个问题：

（全文完，谢谢阅读）

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1062996.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

Java日期的学习篇

Java日期的学习篇

关于日期的学习目录关于日期的学习JDK8以前的APIDate Date常用APIDate的API应用 SimpleDateFormatSimpleDateFormat常用API测试反向格式化(逆操作)测试训练案例需求(秒杀活动)实现 Calendar需求痛点常见API应用测试 JDK8及以后的API(修改与新增)为啥学习(推荐使用)新增的AP…

阅读更多...

ArcGIS Engine：鹰眼图的拓展功能-点击和矩形+坐标状态栏

ArcGIS Engine：鹰眼图的拓展功能-点击和矩形+坐标状态栏

目录 01 前言 02 鹰眼图的控制功能 03 显示当前鼠标的地理坐标 01 前言说是拓展，不过是忘记了实验还有附加实验.这里补上. 前文不再赘述,上一节查看：ArcGIS Engine：视图菜单的创建和鹰眼图的实现_炒茄子的博客-CSDN博客这里加上三个功能…

阅读更多...

unity脚本_Vector3 c#

unity脚本_Vector3 c#

接下来学习相对世界坐标首先我们给场景物体一个空物体修改新建空物体名字为GameObjectFather 修改GameObjectFather坐标修改GameObject2坐标然后将GameObjectFahter设置成GameObject2的父物体我们观察到子物体的坐标改变了但是运行显示的相对世界坐标this.transform.po…

阅读更多...

R语言教程课后习题答案（持续更新中~~）

R语言教程课后习题答案（持续更新中~~）

R语言教程网址如下 https://www.math.pku.edu.cn/teachers/lidf/docs/Rbook/html/_Rbook/index.html 目录 source()函数可以运行保存在一个文本文件中的源程序 R向量下标和子集数值型向量及其运算日期功能 R因子类型 source()函数可以运行保存在一个文本文件中的源程序…

阅读更多...

学信息系统项目管理师第4版系列18_采购管理

学信息系统项目管理师第4版系列18_采购管理

1. 协议 1.1. 合同 1.1.1. 国际合作的项目经理应牢记，无论合同规定如何详尽，文化和当地法律对合同及其可执行性均有影响 1.2. 服务水平协议（SLA） 1.3. 谅解备忘录 1.4. 协议备忘录（MOA） 1.5. 订购单 …

阅读更多...

十天学完基础数据结构-第八天（哈希表（Hash Table））

十天学完基础数据结构-第八天（哈希表（Hash Table））

哈希表的基本概念哈希表是一种数据结构，用于存储键值对。它的核心思想是将键通过哈希函数转化为索引，然后将值存储在该索引位置的数据结构中。哈希函数的作用哈希函数是哈希表的关键部分。它将输入（键）映射到哈希表的索引位…

阅读更多...

Python常用功能的标准代码

Python常用功能的标准代码

后台运行并保存log 1 2 3 4 5 6 7 8 9 nohup python -u test.py > test.log 2>&1 & #最后的&表示后台运行 #2 输出错误信息到提示符窗口 #1 表示输出信息到提示符窗口, 1前面的&注意添加, 否则还会创建一个名为1的文件 #最后会把日志文件输出到test.log文…

阅读更多...

卷积神经网络-池化层和激活层

卷积神经网络-池化层和激活层

2.池化层根据特征图上的局部统计信息进行下采样，在保留有用信息的同时减少特征图的大小。和卷积层不同的是，池化层不包含需要学习的参数。最大池化(max-pooling)在一个局部区域选最大值作为输出，而平均池化(average pooling)计算一个局部区…

阅读更多...

卷积神经网络-卷积层

卷积神经网络-卷积层

卷积神经网络卷积神经网络（convolutional neural network，CNN）是一类包含卷积计算且具有深度结构的前馈神经网络，是深度学习的代表算法之一。卷积神经网络具有表征学习能力，能够按其阶层结构对输入信息进行平移不变分…

阅读更多...

H5移动端购物商城系统源码小型商城全新简洁风格全新UI 支持易支付接口

H5移动端购物商城系统源码小型商城全新简洁风格全新UI 支持易支付接口

一款比较简单的 H5 移动端购物商城系统源码，比较适合单品商城、小型商城使用。带有易支付接口。源码下载：https://download.csdn.net/download/m0_66047725/88391704 源码下载2：评论留言或私信留言

阅读更多...

【Spring笔记03】Spring依赖注入各种数据类型

【Spring笔记03】Spring依赖注入各种数据类型

这篇文章，详细介绍一下Spring框架中如何注入各种数据类型，包含：注入基本数据类型、数组、集合、Map映射、Property属性、注入空字符串、注入null值、注入特殊字符等内容，以及如何使用命名空间进行依赖注入。目录一、注入各种数据…

阅读更多...

云原生Kubernetes：简化K8S应用部署工具Helm

云原生Kubernetes：简化K8S应用部署工具Helm

目录一、理论 1.HELM 2.部署HELM2 3.部署HELM3 二、实验 1.部署 HELM2 2.部署HELM3 三、问题 1.api版本过期 2.helm初始化报错 3.pod状态为ImagePullBackOff 4.helm 命令显示 no repositories to show 的错误 5.Helm安装报错 6.git命令报错 7.CentOS 7 下git c…

阅读更多...

互联网Java工程师面试题·Elasticsearch 篇·第一弹

互联网Java工程师面试题·Elasticsearch 篇·第一弹

目录 1、elasticsearch 了解多少，说说你们公司 es 的集群架构，索引数据大小，分片有多少，以及一些调优手段。 1.1 设计阶段调优 1.2 写入调优 1.3 查询调优 1.4 其他调优 2、elasticsearch 的倒排索引是什么 3、elastic…

阅读更多...

ToDoList使用自定义事件传值

ToDoList使用自定义事件传值

MyTop与MyFooter与App之间传递数据涉及到的就是子给父传递数据，MyList和MyItem与App涉及到爷孙传递数据。之前的MyTop是使用props接收App传值，然后再在methods里面调用，现在使用自定义事件来处理子组件和父组件之间传递数据。图是之前的…

阅读更多...

新款UI动态壁纸头像潮图小程序源码

新款UI动态壁纸头像潮图小程序源码

新款UI动态壁纸头像潮图小程序源码，不需要域名服务器，直接添加合法域名，上传发布就能使用。可以对接开通流量主，个人也能运营，不需要服务器源码完整。整合头像，动态壁纸，文案功能齐全。源码…

阅读更多...

代码随想录Day12 二叉树 LeetCode T102二叉树的层序遍历 T226 翻转二叉树 T101 对称二叉树

代码随想录Day12 二叉树 LeetCode T102二叉树的层序遍历 T226 翻转二叉树 T101 对称二叉树

本文思路和详细讲解来自于:代码随想录 (programmercarl.com) LeetCode T102 二叉树的层序遍历题目链接:102. 二叉树的层序遍历 - 力扣（LeetCode） 题目思路: 本题使用队列辅助完成,讲解主要函数CheckOrder:首先判断root是否为空,是就直接返回,然后创建…

阅读更多...

芯驰D9评测（3）--建立开发环境

芯驰D9评测（3）--建立开发环境

1. 建立交叉编译链接环境官网下载的SDK包中就有交叉工具链，米尔提供的这个 SDK 中除了包含各种源代码外还提供了必要的交叉工具链，可以直接用于编译应用程序等。用户可以直接使用次交叉编译工具链来建立一个独立的开发环境，可单独编译…

阅读更多...

发光文字跟随鼠标

发光文字跟随鼠标

效果展示 CSS / JavaScript 知识点 background-image 绘制网格背景filter 属性的运用onmousemove 事件运用getBoundingClientRect 方法的运用实现页面基础结构  <div class"cursour"></div>实现网格背景样式 body {min-height: …

阅读更多...

如何用 Tana AI 一站式批量润色整理音频笔记？

如何用 Tana AI 一站式批量润色整理音频笔记？

（注：本文为小报童精选文章，已订阅小报童或加入知识星球「玉树芝兰」用户请勿重复付费） 用好 Tana AI Builder ，充分体验和发挥 AI 工作流的强大性能。痛点作为一个足够懒惰的写作者，我对音频转文本这事儿…

阅读更多...

智慧公厕如何实现？

智慧公厕如何实现？

随着城市化进程的加速，人们对公共设施的需求也日益增长。而公厕，作为城市基础设施的一部分，扮演着重要的角色。然而，传统的公厕存在着诸多问题，例如管理不善、环境脏乱等，给人们的生活带来了不便。为了改善…

阅读更多...

推荐文章

最新文章