AMD ROCm™ 安装指南

news2024/11/17 11:56:00

AMD ROCm™ installation — ROCm Blogs

注意: 本文之前是 AMD 实验笔记博客系列的一部分。

AMD ROCm™ 是第一个面向 HPC/超大规模级 GPU 计算的开源软件开发平台。AMD ROCm™ 将 UNIX 的选择权、极简主义和模块化软件开发哲学引入 GPU 计算领域。有关更多信息,请参阅 AMD 的开源 GPU 计算平台和ROCm 信息门户页面。

关于 ROCm 安装的更详细信息,请访问在 Linux 上部署 ROCm页面。

在没有明确理解相关组件和安装流程的情况下,安装 AMD ROCm™ 软件包可能会遇到困难。本文将介绍如何在支持 AMD GFX9 架构的 AMD GPU 卡的工作站上安装 ROCm。后续的博客将讨论在其他环境(如 Docker 容器、Linux LXC 或完整的 HPC 安装)中安装 ROCm。

网站 https://rocm.docs.amd.com 包含 ROCm 的发布、支持和 API 文档的链接。请参阅安装指南和硬件/软件支持指南,了解 ROCm V 5.7 版本支持的软件和硬件。本篇文章将基于 Ubuntu 22.04 操作系统和 AMD MI (MI210, MI250 等) 系列 GPU 卡。完整的安装过程记录在安装指南中。

AMD ROCm™ 是支持使用 AMD CDNA 和 RDNA GPU 架构的 GPU 的 ROCm 开源软件平台的品牌名称。该平台包括驱动程序、库运行时以及开发工具。

本文将描述三种安装选项:
1. 使用 AMD 提供的脚本安装 ROCm。
2. 在一个系统上支持多个 ROCm 版本。
3. 使用 Ubuntu 的 apt-get 安装 ROCm。

选项1

AMD 提供了适用于特定操作系统和 ROCm 版本的安装脚本。每种操作系统和 ROCm 的组合下,脚本的名称和下载位置可能不同,因此请检查[安装页面](ROCm installation for Linux — ROCm installation (Linux))以获取您特定组合的信息。我们使用的是 Ubuntu 22.04 并安装 ROCm 5.7.1,发现脚本名称为 amdgpu-install_5.7.50701-1_all。

sudo apt update
wget https://repo.radeon.com/amdgpu-install/5.7.1/ubuntu/jammy/amdgpu-install_5.7.50701-1_all.deb
sudo apt install ./amdgpu-install_5.7.50701-1_all.deb

一旦提取了 amdgpu-install 脚本,就可以用它来安装内核代码、库和开发代码。对于典型的 HPC 环境,HIP、ROCm 和内核驱动应该足够了:

sudo amdgpu-install --usecase=hiplibsdk,rocm,dkms

可以安装其他库,且可用的用例列表可以使用以下命令查看:

sudo amdgpu-install --list-usecase

ROCm 代码默认安装在 /opt/rocm。您可以运行以下命令验证 ROCm 是否安装成功:

/opt/rocm/bin/rocminfo

并检查软件是否检测到显卡。支持的 GPU 卡型号将以“GFX9”开头。

选项2

如果已经安装了ROCm,可以删除旧版本并安装新版本。或者,可以在保留旧版本的同时安装其他版本。安装额外的版本会创建一个多版本系统,因此需要谨慎确保环境变量中的路径正确。例如,当前的`/opt/rocm`可能会变为`/opt/rocm-5.4.0`或`/opt/rocm-5.3.2`,具体取决于已安装的ROCm版本。
要删除所有旧版本,可以使用以下命令:

sudo amdgpu-uninstall --rocmrelease=all

AMD为特定的操作系统和ROCm版本提供了安装脚本。脚本名称和下载位置可能会因操作系统和ROCm版本的不同而有所差异,因此请查看如何安装页面以获取特定组合的信息。我们使用的是Ubuntu 22.04并安装ROCm 5.7.1,发现脚本名为amdgpu-install_5.7.50701-1_all。

sudo apt update
wget https://repo.radeon.com/amdgpu-install/5.7.1/ubuntu/jammy/amdgpu-install_5.7.50701-1_all.deb
sudo apt install ./amdgpu-install_5.7.50701-1_all.deb

提取amdgpu-install脚本后,可用于安装内核代码、库和开发者代码。以下步骤将安装内核驱动代码版本5.7.1,并安装版本5.7.0和5.7.1的库。对于典型的HPC环境,HIP和ROCm库就足够了:

sudo amdgpu-install --usecase=hiplibsdk,rocm,dkms --rocmrelease=5.7.1
sudo amdgpu-install --usecase=hiplibsdk,rocm --rocmrelease=5.7.0 --no-dkms
sudo amdgpu-install --usecase=hiplibsdk,rocm --rocmrelease=5.7.1 --no-dkms

可以安装其他库,使用以下命令可以查看可用的用例列表:

sudo amdgpu-install --list-usecase

ROCm代码默认安装到`/opt/rocm`。你可以通过运行以下命令来验证ROCm是否安装成功:

/opt/rocm-5.7.1/bin/rocminfo

并检查软件是否检测到了显卡。支持的GPU卡型号将以“GFX9”开头。 

选项3

虽然AMD提供了特定操作系统和ROCm版本的安装脚本,但该脚本最终还是会使用操作系统的标准安装软件来安装软件。在Ubuntu的情况下,脚本将使用`apt-get`来安装ROCm。完整的`apt-get`过程可以在[如何安装页面](https://rocm.docs.amd.com/en/latest/deploy/linux/os-native/install.html)上找到。以下步骤将使用自定义版本的`apt-get`命令来安装ROCm 5.4。

确定要安装的ROCm软件位置以及HIP和相关的ROCm软件:

export ROCM_REPO_BASEURL="https://repo.radeon.com/rocm/apt/5.7.1/"
export ROCM_REPO_COMP="ubuntu"
export ROCM_REPO_BUILD="main"
echo "deb [arch=amd64 trusted=yes] ${ROCM_REPO_BASEURL} ${ROCM_REPO_COMP} ${ROCM_REPO_BUILD}" > /etc/apt/sources.list.d/rocm.list
sudo apt-get update
DEBIAN_FRONTEND=noninteractive apt-get install -y \
 libdrm-amdgpu* \
 initramfs-tools \
 libtinfo* \
 initramfs-tools \
 rocm-llvm \
 rocm-hip-runtime \
 rocm-hip-sdk \
 roctracer-dev

要找到其他可以使用`apt-get`安装的ROCm组件的列表,可以使用`apt-cache`:

apt-cache search rocm

ROCm代码默认安装到`/opt/rocm`。你可以通过运行以下命令来验证ROCm是否已安装:

/opt/rocm/bin/rocminfo

并检查软件是否检测到显卡。受支持的GPU卡将以“GFX9”开头。

注意:不建议混合使用`apt-get`和`amdgpu-install`方法。请选择其中一种方法来安装ROCm。

作者感谢Rajat Arora和Asitav Mishra的有帮助的评审和建议。如果你有任何问题或意见,请在GitHub[讨论区](https://github.com/ROCm/rocm-blogs/discussions)上联系我们。
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2173256.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

华为OD机试 - 小明的幸运数(Python/JS/C/C++ 2024 E卷 100分)

华为OD机试 2024E卷题库疯狂收录中,刷题点这里 专栏导读 本专栏收录于《华为OD机试真题(Python/JS/C/C)》。 刷的越多,抽中的概率越大,私信哪吒,备注华为OD,加入华为OD刷题交流群,…

modelsim仿真出现的问题

问题:仿真波形没有结果 解决 点击Optimization Options 选第二个 右键testbench,Add Wave,快速添加 如何更改字体大小 Tools Edit Preference

latex设置背景颜色

\documentclass{article} \usepackage{xcolor} % 定义颜色,将#FCF9EA转换为LaTeX的颜色定义 \definecolor{mycolor}{HTML}{FCF9EA} % 设置页面颜色 \pagecolor{mycolor} \begin{document} This is a test page with the background color set to \# FCF9E…

如何巧妙运用Shell变量:掌握脚本编程的核心技巧

目录 前言一、Shell变量——变量类型1、用户自定义变量2、环境变量用./ 启动脚本文件记得加权限哦 二、Shell变量——变量赋值和访问(一)变量定义(二)变量的使用(三)删除变量(四)添加环境变量(五)内部变量(六&#xff…

Karmada新版本发布,支持联邦应用跨集群滚动升级

摘要:本次升级支持联邦应用跨集群滚动升级,使用户版本发布流程更加灵活可控;透明同事karmadactl 新增了多项运维能力,提供独特的多集群运维体验。 本文分享自华为云社区 《Karmada v1.11 版本发布!新增应用跨集群滚动升…

cve 漏洞排查流程

1、打开CVE连接 确认漏洞jar包以及版本信息 https://gitee.com/opengauss/security/issues/IASNOA?fromproject-issue 2、通过命令导出对应jar包的依赖树 并导出到目标结果文件中 mvn dependency:tree -Dincludes:gson > gson.result.txt 3、过滤test引用…

Linux之实战命令17:nl应用实例(五十一)

简介: CSDN博客专家、《Android系统多媒体进阶实战》一书作者 新书发布:《Android系统多媒体进阶实战》🚀 优质专栏: Audio工程师进阶系列【原创干货持续更新中……】🚀 优质专栏: 多媒体系统工程师系列【…

成都睿明智科技有限公司抖音电商服务靠谱吗?

在这个电商风起云涌的时代,抖音作为短视频直播的超级流量池,正深刻改变着人们的购物习惯。无数商家蜂拥而至,渴望在这片蓝海中找到属于自己的岛屿。而提及抖音电商服务,成都睿明智科技有限公司无疑是一个备受瞩目的名字。那么&…

2024年7月大众点评餐饮比较北上广深成渝

在做一些城市分析、学术研究分析、商业选址、商业布局分析等数据分析挖掘时,大众点评的数据参考价值非常大,截至2024年7月,大众点评美食店铺剔除了暂停营业、停止营业后的最新数据情况分析如下。 分析研究的字段维度包括大众点评数字id、字母…

10分钟读懂,ITIL4为什么它是IT服务管理的未来?

点击进入ITIL资料库 在当今数字化时代,IT服务管理(ITSM)对于企业的重要性不言而喻。而作为ITSM领域最广泛采用的最佳实践框架,ITIL(Information Technology Infrastructure Library)一直在引领着行业的发展。2019年,AXELOS发布了ITIL 4&#…

突发:OpenAI o1颠覆了人类,o1为什么超越了人类,sam万字长文解读

要点速读 2024 年 9 月 12 日,OpenAI 发布了其最新的人工智能模型——o1(Learning to Reason with LLMs[1]),这是一款经过强化学习训练的大型语言模型,能够执行复杂的推理任务。相比于此前的 GPT-4o(GPT-4…

网络资源模板--Android Studio 宿舍管理系统

目录 一、项目演示 二、项目测试环境 三、项目详情 四、完整的项目源码 一、项目演示 网络资源模板--宿舍管理系统 二、项目测试环境 三、项目详情 登录注册页面 ### 功能总结 1. **用户输入**: - 允许用户输入用户名和密码。 2. **登录验证**: - 检查用户名和密码…

开启争对目标检测的100类数据集-信息收集

DataBall 助力快速掌握数据集的信息和使用方式。 目标检测项目数据集样例地址: gitcode: https://gitcode.com/DataBall/DataBall-detections-100s/overview github: https://github.com/TechLinkX/DataBall-detections-100s 请关注我们的专栏:DataBal…

Linux防火墙-常用命令,零基础入门到精通,收藏这一篇就够了

我们经过上小章节讲了Linux的部分进阶命令,我们接下来一章节来讲讲Linux防火墙。由于目前以云服务器为主,而云服务器基本上就不会使用系统自带的防火墙,而是使用安全组来代替了防火墙的功能,可以简单理解安全组就是web版的防火墙&…

binkw32dll缺失怎么办?免费的dll修复工具诊断解决(报错修复)

binkw32dll缺失怎么办? 在使用电脑尤其是运行视频游戏时,我们有时会遇到“binkw32.dll缺失”的错误提示。这是一个由RAD Game Tools开发的动态链接库文件,主要关联于视频游戏中的视频播放技术,负责压缩视频回放功能。当这个文件缺…

[大语言模型-论文精读] Diffusion Model技术-通过时间和空间组合扩散模型生成复杂的3D人物动作

​​​​​​Generation of Complex 3D Human Motion by Temporal and Spatial Composition of Diffusion Models L Mandelli, S Berretti - arXiv preprint arXiv:2409.11920, 2024 通过时间和空间组合扩散模型生成复杂的3D人物动作 摘要 本文提出了一种新的方法&#xff0…

Apache POI快速入门

介绍 Apache POl是一个处理Miscrosoft Office各种文件格式的开源项目。简单来说就是,我们可以使用 POI 在 Java 程序中对Miscrosoft Office各种文件进行读写操作。 一般情况下,POI都是用于操作 Excel 文件。 Apache POI的主要组件包括: HS…

【开源免费】基于SpringBoot+Vue.JS服装销售平台(JAVA毕业设计)

博主说明:本文项目编号 T 054 ,文末自助获取源码 \color{red}{T054,文末自助获取源码} T054,文末自助获取源码 目录 一、系统介绍二、演示录屏三、启动教程四、功能截图五、文案资料5.1 选题背景5.2 国内外研究现状5.3 可行性分析…

LeetCode从入门到超凡(四)深入浅出理解贪心算法

引言 大家好,我是GISer Liu😁,一名热爱AI技术的GIS开发者。本系列文章是我跟随DataWhale 2024年9月学习赛的LeetCode学习总结文档;本文主要讲解贪心算法。💕💕😊 介绍 贪心算法是一种经典的算法…

代码随想录Day 57|prim算法和kruskal算法精讲,题目:寻宝

提示:DDU,供自己复习使用。欢迎大家前来讨论~ 文章目录 图论part07**prim算法精讲**题目:53. 寻宝解题思路:Prim算法Kruskal算法总结Prim算法的核心步骤(三部曲):关键数据结构:算法…