Windows 部署ChatGLM3大语言模型

news2024/12/23 22:06:06

一、环境要求

硬件

内存:>= 16GB

显存: >= 13GB(4080 16GB)

硬盘:60G

软件

python 版本推荐3.10 - 3.11

transformers 库版本推荐为 4.36.2

torch 推荐使用 2.0 及以上的版本,以获得最佳的推理性能

二、部署步骤

1、新建python3.10虚拟环境

使用pycharm建虚拟环境

2、设置镜像源

pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple

3、升级pip

python -m pip install --upgrade pip

4、安装项目依赖

pip install -r requirements.txt

5、安装Demo依赖

pip install -r composite_demo/requirements.txt

6、下载模型

安装git-lfs
sudo apt-get install git-lfs

git clone https://huggingface.co/THUDM/chatglm3-6b

如果从 HuggingFace 下载比较慢,也可以从 ModelScope 中下载。

git clone https://www.modelscope.cn/ZhipuAI/chatglm3-6b.git

7、运行demo

streamlit run basic_demo/web_demo_streamlit.py

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1602427.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

docker安装EelasticSearch、目录权限修改、并安装IK 中文分词器

文章目录 docker安装EelasticSearch、目录权限修改、并安装IK 中文分词器1、docker安装ES2、docker ps发现容器没有正常启动,docker logs 容器id 查看日志发现是挂载目录的权限不足3、修改目录的权限4、使用docker restart 容器id重新启动刚才没有启动成功的容器5、…

人工智能揭示矩阵乘法的新可能性

人工智能揭示矩阵乘法的新可能性 数学家酷爱漂亮的谜题。当你尝试找到最有效的方法时,即使像乘法矩阵(二维数字表)这样抽象的东西也会感觉像玩一场游戏。这有点像尝试用尽可能少的步骤解开魔方——具有挑战性,但也很诱人。除了魔方…

嵌入式工程师如何摸鱼?

有老铁问我,做嵌入式开发要加班吗? 也不知道搞什么鬼,现在的年轻人对加班这么抵触。 我刚做开发那会,啥也不懂,每天基本都要加班到晚上7-9点不等,我并不抵触加班,因为早早回家,也没什…

【文献分享】PCCP:机器学习 + 分子动力学 + 第一性原理 + 热学性质 + 微观结构

分享一篇关于机器学习 分子动力学 第一性原理 热学性质(密度、粘度、扩散系数) 微观结构的文章。 感谢论文的原作者! 关键词: 1. Machine learning, 2. Deep potential, 3. Molecular dynamics 4. Molten salt, 5. Thermo…

10-菜刀连接木马

找到了漏洞后,并且上传了木马之后才能使用的两款工具 中国菜刀和冰蝎 想办法获取别人的cookie,cookie中有session-id 一、中国菜刀 1、必须提前已经完成木马植入然后才能使用 2、木马必须是POST请求,参数自定义,在菜刀里给出…

苹果系统如何使用CorelDRAW?coreldraw苹果版使用指南

有不少粉丝使用的是苹果的电脑或者笔记本,想要利用最新的M系列芯片带来的长续航便利,实现外出时进行创意设计的工作。 那如何才能在苹果系统使用CorelDRAW?2个方法分享给大家: 一、购买Mac版CorelDRAW 从2020版开始&#xff0c…

预分region解决热点问题(面试题)

一、题目:如何解决hbase中遇到的热点问题? 1、问题引入 在默认的拆分策略中 ,region的大小达到一定的阈值以后才会进行拆分,并且拆分的region在同一个regionserver中 ,只有达到负载均衡的时机时才会进行region重分配!并且开始如果有大量的数据进行插入操…

【HormonyOS4+NEXT】TypeScript基础语法详解

🙋‍ 一日之际在于晨 ⭐本期内容:TypeScript基础语法详解 🏆系列专栏:鸿蒙HarmonyOS4NEXT:探索未来智能生态新纪元 文章目录 前言变量与类型函数类与接口类(Class)接口(Interface&am…

基于51单片机点滴输液控制系统LCD显示( proteus仿真+程序+设计报告+讲解视频)

基于51单片机点滴输液控制系统LCD显示 1. 主要功能:2. 讲解视频:3. 仿真设计4. 程序代码5. 设计报告6. 设计资料内容清单&&下载链接 基于51单片机点滴输液控制系统LCD显示( proteus仿真程序设计报告讲解视频) 仿真图proteus7.8及以上…

Ubuntu上安装Chrome浏览器

安装步骤 1.下载安装chrome安装包 wget https://dl.google.com/linux/direct/google-chrome-stable_current_amd64.deb2.安装Chrome浏览器 sudo dpkg -i google-chrome-stable_current_amd64.debsudo apt-get -f install3.启动Chrome浏览器 查看收藏夹里的Chrome图标 单击C…

【已开源】​基于stm32f103的爬墙小车

​基于stm32f103的遥控器无线控制爬墙小车,实现功能为可平衡在竖直墙面上,并进行移动和转向,具有超声波防撞功能。 直接上: 演示视频如:哔哩哔哩】 https://b23.tv/BzVTymO 项目说明: 在这个项目中&…

前端开发攻略---从源码角度分析Vue3的Propy比Vue2的defineproperty到底好在哪里。一篇文章让你彻底弄懂响应式原理。

1、思考 Vue的响应式到底要干什么? 无非就是要知道当你读取对象的时候,要知道它读了。要做一些别的事情无非就是要知道当你修改对象的时候,要知道它改了。要做一些别的事情所以要想一个办法,把读取和修改的动作变成一个函数&#…

ESXi 无法启动NTP守护进程

在VMware ESXi环境中如果遇到无法启动NTP(Network Time Protocol)守护进程的问题,可以通过以下步骤进行排查和解决: 步骤1:检查与修复配置文件 登录到ESXi Shell(SSH)。编辑 /etc/ntp.conf 配…

北京InfoComm展推出500款新品,覆盖30个市场,助力行业未来

【2024年4月17日——北京讯】亚太区首屈一指的专业视听和集成体验解决方案展北京InfoComm China 2024 今天在北京的国家会议中心 (CNCC) 盛大开幕,展开为期三天的商贸展会和高峰会议。作为行业产品发布的首要平台,北京InfoComm China吸引众多展商携新品推…

使用vite从头搭建一个vue3项目(二)创建目录文件夹以及添加vue-router

目录 一、创建 vue3 项目 vite-vue3-project-js二、创建项目目录三、创建Home、About组件以及 vue-router 配置路由四、修改完成后页面 一、创建 vue3 项目 vite-vue3-project-js 使用 vite 创建一个极简 vue3 项目请参考此文章:使用vite从头搭建一个vue3项目&…

Android 使用ping命令判断当前网络状态

一. 介绍 ping命令是用来测试和诊断网络连接问题的基本命令,当然我们的终端设备(手机/平板/车机)都可以用这个命令来判断当前网络是否有流量的状态,本篇文章主要介绍Linux的ping命令,因为Android系统也是使用了Linux内…

Latex学习(从入门到入土)2

第一章 :插图 在LaTeX中插入插图可以通过graphicx宏包来实现,这个宏包提供了强大的图像处理功能。以下是如何使用graphicx宏包插入图像的基本步骤: ### 1. 加载宏包 在文档的序言部分(\begin{document}之前)&#x…

char和varchar的区别?

一、问题解析 char和varchar都是用于在数据库中存储字符串的数据类型。它们之间的主要区别在于存储空间的使用方式: char是一种定长的数据类型,它的长度固定且在存储时会自动在结尾添加空格来将字符串填满指定的长度。char的长度范围是0-255&#xff0c…

Redis之路系列(3)纸上得来终觉浅(下)

03 纸上得来终觉浅(下) 基于Redis6,本章节主要介绍了Rdis的一些主要应用场景,包含了:大数据的过滤,分布式锁设计,并讲解了有趣的布隆过滤器原理,HyperLogLog 原理,二进制位数与存储大小计算的常…

MinlO以及阿里云OSS对象存储服务

MinlO MinIO是一个开源的对象存储系统,专为云原生和容器化环境而设计。它使用分布式架构来存储和管理大规模的非结构化数据,例如图片、视频、日志文件等。MinIO基于Amazon S3协议,并提供了与S3兼容的API,这使得它能够与现有的S3生…