大模型系列课程学习-基于2080TI-22G魔改卡搭建双卡大模型训练平台(双系统)

news2024/7/2 21:28:30

1.选择合适的硬件配置

再配置电脑之前,需要确认自己需要的显存大小、主板、内存条、电源、散热等核心配件。经过前期调研,选择的硬件配置如下:
(1)主板:华南X99_F8D(DDR4主板),因为需要支持双卡,综合价格等多种因素,选择了该主板,
在这里插入图片描述

![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/3ebd4a0df02c4571b0fbc33e50d19274.png
(2)CPU:E5-2680V42(线程28个)价格便宜,且线程多
在这里插入图片描述
(3)内存条:16G
4 (DDR4),这里面选三星或者国产内存条均可
(4)显卡: 2080ti-22G魔改卡 *2【显卡之间nvlink连接】,一般情况,单卡全卡功耗在250W左右
在这里插入图片描述
(5)散热:散热器 4铜管 或 6铜管
(6)电源:选择了1250W的模块化电源【CPU:240W+GPU:500W+主板、散热器、风扇等,留有余量,选择大点的】
(7)电脑机箱:这里一定要根据主板和显卡大小选择,我选择的是宙斯盾的,稍微贵了一些,之前选的坦克机箱和航佳机箱都没货了。
(8)存储:NVME固态+SATA固态(分别安装windows和ubuntu系统)

2.硬件组装- X99主板安装基础硬件设施

x99主板的硬件外围图如下:
在这里插入图片描述
实物图如下:
在这里插入图片描述

2.1 CPU安装:

CPU的安装、散热器的安装可以移步至x99主板安装视频
在这里插入图片描述

2.2 显卡安装

显卡安装需要注意,建议一张一张卡的安装,先把系统点亮后再安装另一个显卡,因为显卡厚度原因,建议PCIE显卡安装为主如下图所示
在这里插入图片描述
在这里插入图片描述
显卡安装实物图如下(建议先安装一个卡,系统正常运行后再逐步添加卡):
在这里插入图片描述

2.3 电源安装(这里使用的是全模组电源,主要是方便)

在这里插入图片描述
接线示意图如下
在这里插入图片描述

3.电脑系统安装(Windows11 + ubuntu系统)

3.1windows电脑系统安装

windows系统安装比较简单,大概的步骤就是弄一个U盘,然后使用大白菜弄个启动盘,然后安装系统即可,可以参考windows系统U盘安装教程,一般购买硬盘,店家都会给你预装,想省事的话可以让店家把你预装一个,然后再自己去官网下载个系统盘,直接执行安装即可windows11安装系统
因为windows系统大家都比较熟悉,安装的时候记得自己安装在哪个硬盘即可
在这里插入图片描述
需要注意,window显卡驱动需要单独从官网下载安装,此外,因为本次使用的显卡为涡轮卡,需要设置显卡风扇速度,避免显卡过热(可以通过bios或者NVIDIA Inspector 进行设置)链接

3.2 Ubuntu系统安装

ubuntu系统安装同winodows比较类似,唯一不同的是这里的显卡驱动在安装系统时可以选择自动安装,我这里面参考的教程如下ubuntu系统安装
过程中遇到不少问题:
a.ERROR:BIOS/LEGACY BOOT OF UEFI-ONLY MEDIA
在这里插入图片描述

原因:启动盘的引导项是用于uefi模式启动,但是服务器的引导启动方式为legacy ,所以导致报错。
解决方案:重新弄启动U盘,或者查找系统安装位置是否正确,可以参考链接
b.界面无显示,系统之前已经成功,但是无显示(可能是显卡驱动安装不对)
c.主板液晶屏显示报错,相关报错码如下:
在这里插入图片描述
在这里插入图片描述
系统安装完毕后,再次安装另一个显卡和nvlink

3.3 显卡及NVLINK的设置(以ubuntu系统为例)

(1)在上述安装完双系统后,需要对显卡和nvlink的配置进行设置,确保显卡散热正常
(2)一般windows系统中NVIDIA Inspector设置风扇速度这块为灰色,无法设置,建议使用ubuntu进行设置,一般情况下代码在linux的环境下,使用更为方便
(3)显卡风扇配置
a. sudo nvidia-settings
在这里插入图片描述
b.安装完毕后打开软件,设置风扇速度为最大
在这里插入图片描述

(4)打开命令行界面,首先查看显卡是否正常:nvidia-smi
在这里插入图片描述
(5)查看nvlink连接是否正常:nvidia-smi topo -m
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1880284.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot 3.x相比之前版本有什么区别

Spring Boot 3.x相比之前的版本(尤其是Spring Boot 2.x),主要存在以下几个显著的区别和新特性: Java版本要求: Spring Boot 3.x要求至少使用Java 17作为最低版本,同时已经通过了Java 19的测试,…

【C语言】指针剖析(完结)

©作者:末央& ©系列:C语言初阶(适合小白入门) ©说明:以凡人之笔墨,书写未来之大梦 目录 回调函数概念回调函数的使用 - qsort函数 sizeof/strlen深度理解概念手脑并用1.sizeof-数组/指针专题2.strlen-数组/指针专题 指针面试题专题 回调函…

C++ | Leetcode C++题解之第205题同构字符串

题目&#xff1a; 题解&#xff1a; class Solution { public:bool isIsomorphic(string s, string t) {unordered_map<char, char> s2t;unordered_map<char, char> t2s;int len s.length();for (int i 0; i < len; i) {char x s[i], y t[i];if ((s2t.coun…

HDFS详细介绍以及HDFS集群环境部署【hadoop组件HDFS笔记】(图片均为学习时截取的)

HDFS详细介绍 HDFS是什么 HDFS是Hadoop三大组件(HDFS、MapReduce、YARN)之一 全称是&#xff1a;Hadoop Distributed File System&#xff08;Hadoop分布式文件系统&#xff09;&#xff1b;是Hadoop技术栈内提供的分布式数据存储解决方案 可以在多台服务器上构建存储集群&…

C : 线性规划例题求解

Submit Page TestData Time Limit: 1 Sec Memory Limit: 128 Mb Submitted: 93 Solved: 49 Description 求解下述线性规划模型的最优值min &#xfffd;1&#xfffd;1&#xfffd;2&#xfffd;2&#xfffd;3&#xfffd;3&#xfffd;.&#xfffd;. &…

Java 并发编程常见问题

1、线程状态它们之间是如何扭转的&#xff1f; 1、谈谈对于多线程的理解&#xff1f; 1、对于多核CPU&#xff0c;多线程可以提升CPU的利用率&#xff1b; 2、对于多IO操作的程序&#xff0c;多线程可以提升系统的整体性能及吞吐量&#xff1b; 3、使用多线程在一些场景下可…

StringUTF_16错误认识字节长度

众所周知&#xff0c;在 UTF-8 编码中&#xff0c;中文字符通常占用 3 个字节: import java.nio.charset.StandardCharsets;/*** author shenyang* version 1.0* info untitled* since 2024/6/30 上午9:42*/ public class Test {public static void main(String[] args) {Stri…

【机器学习】机器学习的重要方法——强化学习:理论,方法与实践

目录 一、强化学习的核心概念 二、强化学习算法的分类与示例代码 三.强化学习的优势 四.强化学习的应用与挑战 五、总结与展望 强化学习&#xff1a;理论&#xff0c;方法和实践 在人工智能的广阔领域中&#xff0c;强化学习&#xff08;Reinforcement Learning, RL&…

第3章-数据类型和运算符

#本章目标 掌握Python中的保留字与标识符 理解Python中变量的定义及使用 掌握Python中基本数据类型 掌握数据类型之间的相互转换 掌握eval()函数的使用 了解不同的进制数 掌握Python中常用的运算符及优先级1&#xff0c;保留字与标识符 保留字 指在Python中被赋予特定意义的一…

【操作系统】内存管理——页面分配策略(个人笔记)

学习日期&#xff1a;2024.6.28 内容摘要&#xff1a;页面分配策略和内存映射文件&#xff0c;内存映射文件 页面分配置换策略 基本概念 驻留集&#xff0c;指请求分页存储管理中给进程分配的物理块的集合&#xff0c;在采用了虚拟存储技术的系统中&#xff0c;驻留集大小一…

docker harbor仓库搭建,主从库复制

背景&#xff1a;需要主机安装docker-ce和docer-compose #1.安装相关依赖. yum install -y yum-utils device-mapper-persistent-data lvm2 #2.下载官方的docker yum源文件 yum-config-manager --add-repo https://mirrors.aliyun.com/docker-ce/linux/centos/docker-ce.repo …

专题三:Spring容器ApplicationContext初始化

前面我们构建好了Spring源码&#xff0c;接下来肯定迫不及待来调试啦&#xff0c;来一起看看大名鼎鼎ApplicationContext 新建模块 1、基础步骤 2、重要文件 build.gradle plugins {id java }group org.springframework version 5.2.6.RELEASErepositories {mavenCentral(…

DDD学习笔记五

模型引力场&#xff1a;聚合 强作用力体现&#xff1a; 某个领域模型是另一些模型存在的前提&#xff0c;没有前者&#xff0c;后者就失去了生存的意义。 一组领域模型之间存在关联的领域逻辑&#xff0c;任何时候都不能违反。 一组领域模型必须以一个完整的、一致的状态呈现给…

专业指南:U盘数据恢复全攻略

一、引言&#xff1a;U盘数据恢复的重要性 在信息化日益发展的今天&#xff0c;U盘已成为我们日常生活中不可或缺的存储设备。然而&#xff0c;由于各种原因&#xff0c;U盘中的数据可能会面临丢失的风险。U盘数据恢复技术便应运而生&#xff0c;它旨在帮助用户找回因误删除、…

多平台自动养号【开心版】偷偷使用就行了!

大家好&#xff0c;今天我无意间发现了一款【多平台自动养号工具】&#xff0c;看了一下里面的功能还是挺全面的&#xff0c;包含了【抖音&#xff0c;快手&#xff0c;小红薯】还有一些截流功能 虽然这款工具功能强大&#xff0c;但美中不足的是需要付费的。但别担心&#xf…

线性结构之栈结构

栈是一种只能从一端存取数据并且遵循“后进先出”原则的线性存储结构。这句话中体现了栈结构的三个特征——只能从一端存取数据&#xff0c;遵循“后进先出”的原则和线性存储结构。因此如果我们要实现一个栈结构的数据结构&#xff0c;就必须要满足这三点要求。提到线性结构&a…

构建高效业财一体化管理体系

构建高效业财一体化管理体系 业财一体化战略意义 提升决策质量 强化数据支撑&#xff1a;通过整合业务与财务数据&#xff0c;为决策提供准确、实时的信息基础&#xff0c;确保分析的深度与广度。促进业务与财务协同&#xff1a;打破信息孤岛&#xff0c;实现业务流程与财务管…

最流行的文件同步软件

PanguFlow是一款免费的文件同步软件&#xff0c;他支持文件的全量同步、支持文件的增量同步、支持文件的实时备份&#xff0c;支持双向同步&#xff0c;支持三向同步甚至多向同步&#xff0c;支持无人值守运行。 PanguFlow数据同步软件下载地址https://pan.baidu.com/s/1GLjFR…

博客都在使用的打字机效果,居然这么简单?

效果展示 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-scale1.0"><title>Document</title><style>body …

在Ubuntu下将pulseaudio换成pipewire

1、为什么要将pulseaudio换成pipewire&#xff1f; PulseAudio 是一个成熟且广泛使用的音频服务器&#xff0c;适合一般桌面音频需求&#xff0c;但在性能和延迟上有一定限制。PipeWire 是一个更现代的解决方案&#xff0c;旨在统一音频和视频处理&#xff0c;提供高性能和低延…