ChatGLM3本地部署运行(入门体验级)

news2024/12/24 22:58:16

文章目录

  • 前言
  • 零 硬件
  • 小白基知填坑
    • eForce Game Ready驱动程序
    • CUDA常用命令
  • 环境准备
    • NVIDIA驱动更新
    • CUDA安装
  • 部署
  • 补充内容
  • 体验

前言

  • 学习自B站up主技术爬爬虾,感谢up主提供的整合包!

零 硬件

  • 6GB以上显存的NVIDIA显卡(品质越高,效果越好)

小白基知填坑

eForce Game Ready驱动程序

  • 使用NVIDIA GeForce Game Ready驱动程序可以通过提供更好的图形处理能力和稳定性来增强AI任务的性能。
  • GeForce Game Ready驱动程序的功能:
  1. 性能优化:驱动程序通过针对不同的AI任务优化图形处理单元(GPU)的使用,提供更高效的计算能力,从而提高AI学习和大模型部署的性能。
  2. 兼容性支持:驱动程序经过测试和优化,以确保其与最新的AI框架和库以及相关软件的兼容性。这有助于确保您可以顺利运行和部署AI模型。
  3. 稳定性和可靠性:GeForce Game Ready驱动程序经过严格测试,以确保在AI任务中提供稳定的运行环境,减少崩溃或错误的可能性。
  4. 额外的功能:驱动程序可能包含一些额外的功能或工具,例如GPU性能监控、优化设置和调试工具,可帮助您更好地管理和优化AI任务的执行。

CUDA常用命令

  • 当使用CUDA进行并行计算时,可以使用一些基本的CUDA命令来管理和监控GPU设备。
  1. nvcc:用于编译CUDA源代码并生成可执行文件。
    • 它是CUDA的编译器驱动程序,可以接受CUDA源代码文件(.cu)作为输入,并生成可在GPU上执行的二进制文件。
  2. nvprof:用于性能分析和性能调优。
    • 它可以跟踪CUDA应用程序的运行时间和内存使用情况,并提供详细的性能指标和分析报告,帮助开发者找到性能瓶颈并优化CUDA代码。
  3. nvcc -arch:用于指定CUDA代码的目标架构。
    • 该命令选项后面可以跟随所需的GPU架构代号,例如sm_30(Kepler架构)或sm_61(Pascal架构),以确保CUDA代码能够在指定的GPU上正确编译和运行。
  4. nvidia-smi:用于监视和管理GPU设备。
    • 该命令提供了有关GPU的详细信息,如驱动程序版本、显卡型号、温度、功耗以及当前运行的进程列表等。此外,nvidia-smi还提供了一些选项,如设置GPU的功耗限制等。
  5. cuda-memcheck:用于内存错误检测。
    • 检测CUDA应用程序中的内存访问错误、泄漏以及其他内存相关问题。通过运行cuda-memcheck命令,可以检查CUDA应用程序的内存健康状况并提供详细的错误报告。
  6. cuda-gdb:用于CUDA应用程序的调试。
    • cuda-gdb是一个支持CUDA的调试器,可以通过命令行界面来调试CUDA代码。它提供了一些常见的调试功能,如断点、变量查看、单步执行等。

环境准备

NVIDIA驱动更新

  • 打开GeForce Experience软件,选择更新NVIDIA GeForce Game Ready驱动程序

在这里插入图片描述

CUDA安装

  • CUDA下载地址

  • CUDA(Compute Unified Device Architecture)是由NVIDIA开发的一种并行计算平台和编程模型。CUDA驱动程序是安装在计算机上的软件,用于支持和管理使用CUDA技术的NVIDIA GPU。

  • CUDA驱动程序是一种支持和管理使用CUDA技术的NVIDIA GPU的软件。它提供了GPU管理、并行计算支持、性能优化和兼容性支持等功能,使开发者能够利用GPU的并行计算能力进行高性能的计算任务。

CUDA驱动程序的主要功能:

  1. GPU管理:CUDA驱动程序负责识别和管理计算机中的NVIDIA GPU。它与操作系统交互,为每个GPU分配计算资源,并确保GPU与其他系统组件正确通信。

  2. 并行计算支持:CUDA驱动程序使开发者能够使用CUDA编程模型,通过并行计算在NVIDIA GPU上运行计算密集型任务。它提供了CUDA API和工具,使开发者能够编写并行代码,并在GPU上执行高性能计算。

  3. GPU性能优化:CUDA驱动程序提供了一些功能和工具,用于优化GPU的性能。例如,它可以进行GPU频率调整、内存访问优化和并行任务调度,以最大程度地发挥GPU的计算能力。

  4. 兼容性支持:CUDA驱动程序与CUDA工具包共同工作,为开发者提供了对最新CUDA功能和库的支持。它确保CUDA驱动程序与使用CUDA编写的应用程序和库的兼容性,并提供与操作系统和其他驱动程序的适配。
    在这里插入图片描述

在这里插入图片描述

  • 安装完CUDA后,电脑会自动重启,重启后验证CURD的安装
nvidia-smi
Mon Nov 13 19:56:29 2023
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 546.01                 Driver Version: 546.01       CUDA Version: 12.3     |
|-----------------------------------------+----------------------+----------------------+
| GPU  Name                     TCC/WDDM  | Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |         Memory-Usage | GPU-Util  Compute M. |
|                                         |                      |               MIG M. |
|=========================================+======================+======================|
|   0  NVIDIA GeForce RTX 3060      WDDM  | 00000000:03:00.0  On |                  N/A |
|  0%   45C    P8              12W / 170W |    484MiB / 12288MiB |      4%      Default |
|                                         |                      |                  N/A |
+-----------------------------------------+----------------------+----------------------+

+---------------------------------------------------------------------------------------+
| Processes:                                                                            |
|  GPU   GI   CI        PID   Type   Process name                            GPU Memory |
|        ID   ID                                                             Usage      |
|=======================================================================================|
|    0   N/A  N/A      7724    C+G   ...ience\NVIDIA GeForce Experience.exe    N/A      |
|    0   N/A  N/A      8376    C+G   ....Search_cw5n1h2txyewy\SearchApp.exe    N/A      |
|    0   N/A  N/A      8880    C+G   C:\Windows\explorer.exe                   N/A      |
|    0   N/A  N/A      9360    C+G   ...GeForce Experience\NVIDIA Share.exe    N/A      |
|    0   N/A  N/A     10120    C+G   ...2txyewy\StartMenuExperienceHost.exe    N/A      |
|    0   N/A  N/A     11156    C+G   ...CBS_cw5n1h2txyewy\TextInputHost.exe    N/A      |
|    0   N/A  N/A     14492    C+G   ...__8wekyb3d8bbwe\WindowsTerminal.exe    N/A      |
+---------------------------------------------------------------------------------------+
  • 结果分析:
    1. 驱动程序版本:当前使用的NVIDIA驱动程序版本为546.01。

    2. CUDA版本:当前使用的CUDA版本为12.3。

    3. GPU信息:

      • NVIDIA GeForce RTX 3060显卡,该显卡处于工作状态(On),温度为45摄氏度,性能状态为P8(较低性能模式),功率使用率为12瓦,总体功率限制为170瓦。
      • 显存使用率为484MB/12288MB(4%),表示显存的使用情况较低。GPU利用率为0%,表示GPU当前未执行计算任务。
    4. 进程信息:列出了当前正在使用GPU的进程列表。

      • 当前有以下进程正在使用GPU:NVIDIA GeForce Experience、Windows搜索、Windows资源管理器、NVIDIA Share、开始菜单体验宿主、文本输入宿主。

部署

  • ChatGLM3 一键部署包
  • 提取码:1234
  • 解压后文件内容如下:一个是model也就是模型文件,第二个ChatGLM3是模型的驱动程序
    在这里插入图片描述

补充内容

  • 内存不够,可以设置虚拟内存
    设置,系统,高级系统设置,性能设置,高级,更改虚拟内存,选中空间充足的固态硬盘设置为系统管理的大小,点设置,重启电脑
    在这里插入图片描述
  • 公告,回车即可
  • 如果您希望收到有用的入职邮件、新闻、优惠、促销信息以及偶尔的赠品,请在下方输入您的电子邮件地址。否则,请将此字段留空。
    在这里插入图片描述
    在这里插入图片描述
    在这里插入图片描述

体验

  • 整体运行占用显存8G左右,回答速度还可以(毕竟设备也就那样……还要求什么)
    在这里插入图片描述
  • 正常速度
    在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1204930.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

22.斐波那契数列数列前20项.

#include<stdio.h>int main(){int i,sum1; int a[100];a[0]0;a[1]1;for(i2;i<20;i){a[i]a[i-1]a[i-2]; sumsuma[i];}printf("斐波那契数列的前20项和为&#xff1a;%d",sum);return 0;}

沧州市壹家人社工小赵庄乡社工站常态化开展关爱一老一小活动

沧州市壹家人社会工作服务中心承接新华区小赵庄乡社工站以来以服务一老一小为工作重点&#xff0c;发挥五社联动的重要作用&#xff0c;开展“幸福院”和“护蕾驿站”两个微项目&#xff0c;聚焦需求&#xff0c;采取社工引领志愿服务的模式&#xff0c;常态化为老人和孩子开展…

Wpf 使用 Prism 实战开发Day05

首页设计 1.效果图 一.代码现实 根据页面布局&#xff0c;可以将页面设计成3行&#xff0c;每行中分多少列&#xff0c;看需求而定根据页面内容&#xff0c;设计Model 实体类&#xff0c;以及View Model 1.Index.xaml 页面布局设计 RowDefinition 分行&#xff08;Row&#xf…

【LeetCode】每日一题 2023_11_12 每日一题 Range 模块(线段树)

文章目录 刷题前唠嗑题目&#xff1a;Range 模块题目描述代码与解题思路 刷题前唠嗑 LeetCode? 启动&#xff01;&#xff01;&#xff01; 嗯&#xff1f;怎么是 hard&#xff0c;好长&#xff0c;可恶&#xff0c;看不懂&#xff0c;怎么办 题目&#xff1a;Range 模块 题…

mindspore mindyolo目标检测华为昇腾上推理使用

参考&#xff1a; https://github.com/mindspore-lab/mindyolo 使用案例&#xff1a; https://github.com/mindspore-lab/mindyolo/blob/master/GETTING_STARTED.md 安装&#xff1a; pip install mindyolo特别注意opencv-python、opencv-python-headless版本问题&#xff0…

深入理解C++关联式容器:set、multiset、map和multimap详解

序列式容器 与 关联式容器 我们知道&#xff1a; C 中&#xff0c;我们将 vector、list、queue 这种底层为线性序列的数据结构叫做 序列式容器&#xff0c;其存储的就是元素本身。而 关联式容器 以键-值对的形式存储数据。每个键在容器中必须是唯一的&#xff0c;而值则与相应…

基于连续Hopfield神经网络优化——旅行商问题优化计算

大家好&#xff0c;我是带我去滑雪&#xff01; 利用神经网络解决组合优化问题是神经网络应用的一个重要方面。所谓组合优化问题&#xff0c;就是在给定约束条件下&#xff0c;使目标函数极小&#xff08;或极大&#xff09;的变量组合问题。将Hopfield网络应用于求解组合优化问…

Centos7 升级到 Centos8 教程以及关于dnf包管理工具的若干问题解决方案

目录 为什么升级一、参考文档二、升级步骤三、安装git编码错误缓存问题安装git依赖冲突问题解决办法 为什么升级 jenkins 2.4版本需要CentOS8 一、参考文档 点我 二、升级步骤 1.安装epel源 yum -y install epel-release2.安装rpmconf和yum-utils yum -y install rpmco…

死锁(JAVA)

死锁在多线程代码中是非常严重的BUG&#xff0c;一旦代码中出现死锁就会导致线程卡死。 当单个线程连续两次对同一个对象进行加锁操作时&#xff0c;如果该锁是不可重入锁就会发生死锁&#xff08;线程卡死&#xff09; 两个线程两把锁&#xff0c;如果出现这种情况也是会发生…

瑞吉外卖Day02

小张推荐:瑞吉外卖Day01&#xff0c;瑞吉外卖Day03 1.登陆功能 1.1结果封装类 导入返回结果类R此类是一个通用结果类。服务端响应的所有结果最终都会包装成此种类型返回给前端页面 注意属性名&#xff0c;莫要写错&#xff0c;不然与前端很难对接&#xff01;&#xff01;&…

Docker 中的端口

Docker 中的端口 0.0.0.0:8080->80/tcp &#xff0c;主机&#xff08;即运行 Docker 的机器&#xff09;监听8080端口&#xff0c;如果有请求转发到容器的 80 端口上去。 详细解释一下&#xff1a; 0.0.0.0:8080->80/tcp &#xff1a;这是一个端口映射规则。 0.0.0.0:80…

Leetcode—202.快乐数【简单】

2023每日刷题&#xff08;二十八&#xff09; Leetcode—202.快乐数 快慢指针思想 通过手玩2&#xff0c;可以发现 会走入一个循环&#xff0c;并且fast和slow会在一个数字相遇&#xff0c;以下也大概花了一下推倒出来了。如果slow不是因为1和fast相等的&#xff0c;就说明它…

消息队列中的事务是什么呢?

消息队列中的事务是什么呢&#xff1f; 说到事务&#xff0c;肯定会优先想到数据库中的事务。在数据库中需要事务&#xff0c;是为了保证数据的一致性、完整性、持久性和隔离性。它可以将数据库中的一组操作合并为一个不可分割的工作单元&#xff0c;要么全部执行成功&#xf…

​软考-高级-系统架构设计师教程(清华第2版)【第4章 信息安全技术基础知识(P160~189)-思维导图】​

软考-高级-系统架构设计师教程&#xff08;清华第2版&#xff09;【第4章 信息安全技术基础知识&#xff08;P160~189&#xff09;-思维导图】 课本里章节里所有蓝色字体的思维导图

【沐风老师】3dMax使用克隆修改器插件创建旋转楼梯教程

3DMAX克隆修改器插件&#xff0c;它通过增量平移、旋转和缩放输入几何体来创建对象的副本。在某些方面&#xff0c;它类似于 3dMax 的内置“阵列”工具&#xff0c;但有一个主要优点 -克隆修改器是完全参数化的&#xff0c;因此您可以随时更改重复项的数量及其分布。其他功能包…

mapboxGL中的底图切换

概述 底图切换&#xff0c;这么简单的功能还要写一篇文章&#xff1f;值得的&#xff0c;为什么这么说呢&#xff1f;因为mapboxGL的矢量底图有上百个&#xff0c;不同的底图用的样式、图层的名称、图层的内容、字体库、图标库都不一样&#xff0c;尤其是当地图上已经叠加了很…

展会预告 | 图扑邀您相约高交会-全球清洁能源创新博览会

第二十五届中国国际高新技术成果交易会(简称“高交会”)将在深圳盛大开幕。高交会由商务部、科学技术部、工业和信息化部、国家发展改革委、农业农村部、国家知识产权局、中国科学院、中国工程院和深圳市人民政府共同举办。是目前中国规模最大、最具影响力的科技类展会。 图扑软…

【LittleXi】C程序预处理、编译、汇编、链接步骤

【LittleXi】C程序预处理、编译、汇编、链接步骤 C程序 #include<stdio.h> int main(){int x1,y1;printf("xy%d",xy); }1、预处理 将头文件引入进来、除去注释、宏定义下放 执行指令 g -E esc.c -o esc.i 2、编译 将处理好的代码编译为汇编代码.s 执行…

AI优秀企业案例——机器人流程自动化:达观数据RPA

通过学习业内领先公司的最佳实践&#xff0c;我们可以更好地将它们应用到我们自己的公司和业务中。特别是第三部分&#xff0c;提供了大量应用案例&#xff0c;让我们一起期待看到这些案例的结尾。 1.简介 达观数据是一家专注于智能文本机器人的国家高新技术企业&#xff0c;…

Flink SQL -- 反压

1、测试反压&#xff1a; 1、反压&#xff1a; 指的是下游消费数据的速度比上游产生数据的速度要小时会出现反压&#xff0c;下游导致上游的Task反压。 2、测试反压&#xff1a;使用的是DataGen CREATE TABLE words (word STRING ) WITH (connector datagen,rows-per-second…