GPU参数指标

news2024/9/30 5:21:55

以英伟达的A800卡为例,简单聊聊GPU卡的核心参数指标,A800的核心指标主要有5个,为算力、显存大小、显存带宽、功耗情况和卡间互联速率。
在这里插入图片描述

  • 性能:则可以理解为货车对不同货物类型的马力大小,决定能“拉动”多少重量的货,不同数据类型好比不同的货物,木板(FP16)和钢卷(FP32)对于运输要求不同,木材能拉10顿,可能钢卷就拉5顿(钢卷的放置要求高,需要配套各种固定装置);
  • 显存:可以理解为货车的车厢,能够放下多大“尺寸”的物品,这个需要和算力匹配,避免吕布骑狗或者小马拉大车。
  • 显存带宽:这个可以理解为装卸货的速度,带宽越大装卸“一车”货物的时间越快。这个与GPU显存类型有关,比如A800 SXM 的为HBM2e,就高达2TB/s;就像货车中装了自动装卸货装置,卸货效率飞起,而普通显卡的GDDR6则相当于人工,效率就慢了很多。
  • 卡间互联:2个A800通过nvlink互联,主要是实现了显存容量共享,相当于把2个货车的车厢相加,可以放下更大的货物。现在的大模型可以比作一个家具,一张GPU的显存放不的下大模型,可以多卡互联扩大显存来实现,而一个货车的车厢装不下,可以把两个货车的车厢合成一个(这个比喻可能有点不恰当);
  • 功耗TDP:这个更好理解就像货车的油耗,拉相同重量的货物,油耗越低肯定越好。
    在这里插入图片描述
    在这里插入图片描述

在这里插入图片描述

  • 流处理器:也叫渲染管、着色器。画面都是由一个又一个像素点组成的,而流处理器就负责这些像素点的渲染工作;

  • RT核心:光追核心,用作于光线追踪效果;正常数据中心级的GPU核心是没有RT Core的,主要是消费级显卡才为光线追踪运算添加了 RT Cores,考虑到芯片的空间有限,每个SM里面只有1个光追核心(为此还砍掉了大部分的 FP64)。可以极大地提升了游戏渲染效率。

  • CUDA 核心和Tensor 核心:CUDA Core和Tensor Core,为GPU提供计算能力的硬件单元。CUDA core也叫Streaming Processor(SP),是单精度,组成SM的重要部分。Core的数量越多,并行运算的线程越大,计算的峰值越高。

  • Tensor Core:核心特别大,用于机器学习加速,它可以把整个矩阵都载入寄存器中批量运算,实现十几倍的效率提升,从Volta 架构发布以来,奠定了英伟达在AI训练的领军地位,每次升级都有新支持的数据类型。

  • 显存容量:显存容量决定着显存临时存储数据的多少,大显存能减少读取数据的次数,降低延迟;

  • 显存带宽:显存带宽,指显示芯片与显存之间的数据传输速率,单位是字节/秒。显卡的显存是由一块块的显存芯片构成的,显存总位宽同样也是由显存颗粒的位宽组成,显存带宽=显存频率×显存位宽/8。显存带宽是决定显卡性能和速度最重要的因素之一。

  • 显存位宽:是显存在一个时钟周期内所能传送数据的位数,位数越大则瞬间所能传输的数据量越大,这是显存的重要参数之一;

  • 浮点性能:代表显卡的浮点计算能力,越高算力越强,深度学习、科学计算用途较多;

  • 核心代号:显卡核心代号就是指显卡的显示核心的开发代号。

  • 核心频率:指显示核心的工作频率,其工作频率在一定程度上可以反映出显示核心的性能;

  • 加速频率:指显示核心的工作频率最高可达频率。

  • Vulkan API:Vulkan API 是一种跨平台的图形接口,能提供更高的图形性能和更低的能耗。支持 Vulkan API 的显卡在运行 Vulkan 游戏或应用时性能更佳。这对于追求高帧率、低延迟的游戏玩家来说是一个重要的参数。

  • DirectX 支持:DirectX 是微软开发的一组多媒体编程接口,用于处理图形、音频和输入输出等多媒体任务。支持 DirectX 的显卡通常在运行 DirectX 游戏时性能更佳。因此,如果您是一个热衷于玩 DirectX 游戏的游戏玩家,那么这一参数对您来说尤为重要。

  • 热设计功耗(TDP):它指的是显卡运行时所产生的最大热量输出。TDP 越低,显卡的散热和电源需求就越低,相应的成本也越低。因此,在选择显卡时,应根据自己的需求和预算来平衡 TDP 与性能的关系。

  • 纹理处理集群:TPC(Texture Processor Cluster)

主流架构的NVIDIA GPU参数变化
在这里插入图片描述

参考:
https://xie.infoq.cn/article/fcd73ab3509b7eb4a5757a743

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2178736.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

实用工具推荐---- PDF 转换

直接上链接:爱PDF |面向 PDF 爱好者的在线 PDF 工具 (ilovepdf.com) 主要功能如下: 全免费!!!!

什么是 Apache Ingress

Apache Ingress 主要用于管理来自外部的 HTTP 和 HTTPS 流量,并将其路由到合适的 Kubernetes 服务。 容器化与 Kubernetes 是现代云原生应用程序的基础。Kubernetes 的主要职责是管理容器集群,确保它们的高可用性和可扩展性,同时还提供自动化…

httpsok-v1.17.0-SSL通配符证书自动续签

🔥httpsok-v1.17.0-SSL通配符证书自动续签 介绍 httpsok 是一个便捷的 HTTPS 证书自动续签工具,基于全新的设计理念,专为 Nginx 、OpenResty 服务器设计。已服务众多中小企业,稳定、安全、可靠。 一行命令,一分钟轻…

Java中使用接口实现回调函数的详解与示例

💝💝💝欢迎莅临我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 推荐:「storm…

【2025】springboot基于微信小程序记账本的设计与实现(源码+文档+调试+答疑)

文章目录 前言一、主要技术?二、项目内容1.整体介绍(示范)2.运行截图3.系统测试 总结更多项目 前言 时代在飞速进步,每个行业都在努力发展现在先进技术,通过这些先进的技术来提高自己的水平和优势,记账本小…

【游戏分组】

题目来源 from itertools import combinations def get_input(): """获取输入的整数列表。""" return list(map(int, input("请输入10个整数(用空格分隔): ").split())) def get_min_difference(arr): &q…

OpenCV C++霍夫圆查找

OpenCV 中的霍夫圆检测基于 霍夫变换 (Hough Transform),它是一种从边缘图像中识别几何形状的算法。霍夫圆检测是专门用于检测图像中的圆形形状的。它通过将图像中的每个像素映射到可能的圆参数空间,来确定哪些像素符合圆形状。 1. 霍夫变换的原理 霍夫…

【韩顺平Java笔记】第3章:变量

只记录我觉得重点的,自用,如果有漏的请自己看视频 文章目录 33. 内容梳理34. 变量原理34.1 为什么需要变量35. 变量概念35.1 概念35.2 变量使用的基本步骤36. 变量入门36.1 变量使用入门案例 37. 变量细节37.1 变量使用注意事项 38. 加号使用38.1 程序中…

身份证号、定位信息等个人信息敏感性判定解析

关于身份证号号码以及精确定位信息是否是敏感个人信息的疑问一直以来不少合规安全从业者有疑惑,本文来自于《数安标准强基助力计划 》作者为指南和标准的起草者,其观点具有一定的权威性,一下为内容摘要,以供大家学习和解惑&#x…

【sourceTree问题】拉取提交的时候需要频繁输入账号密码

用sourceTree进行代码管理的时候会出现一直让输入账号密码的问题,烦不胜烦,可以点击【设置】 → 【编辑配置文件...】打开配置文件: 在配置文件里找到url,把url里面的网址修改为: http://username:passwordxxxxx/xx…

LeetCode 热题 100 回顾7

干货分享,感谢您的阅读!原文见:LeetCode 热题 100 回顾_力code热题100-CSDN博客 一、哈希部分 1.两数之和 (简单) 题目描述 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标…

阿里云 SAE Web:百毫秒高弹性的实时事件中心的架构和挑战

作者:胡志广(独鳌) 背景 Serverless 应用引擎 SAE 事件中心主要面向早期的 SAE 控制台只有针对于应用维度的事件,这个事件是 K8s 原生的事件,其实绝大多数的用户并不会关心,同时也可能看不懂。而事件中心,是希望能够…

实验3 使用Wiresharkl观察ping命令的工作过程

1、实验目的: 了解嗅探器工具Ethereal(Wireshark)的下载和安装方法; 掌握Ethereal(Wireshark)的简单使用方法; 了解抓包结果的分析方法(最好是把菜单中所有的菜单命令都尝试一下&…

SpringCloud-Alibaba第二代微服务快速入门

1.简介 Spring Cloud Alibaba其实是阿里的微服务解决方案,是阿里巴巴结合自身微服务实践,开源的微服务全家桶,在Spring Cloud项目中孵化成为Spring Cloud的子项目。第一代的Spring Cloud标准中很多组件已经停更,如:Eureak,zuul等。所以Sprin…

复刻谷歌爆火的AI生成播客应用:高效方案分享

随着Google Illuminate等产品的推出,将复杂文档转换为音频播客的需求日益增长。MIT最近开源的PDF2Audio项目为此提供了一个开放且高效的解决方案。本文将详细介绍如何复刻这一功能,并分享一个适用于AI代理和播客创业者的高效方案。 一、背景 近年来,将文本内容转换为音频播…

第一课:什么是易语言?

易语言是一门计算机程序设计语言,也通常代指与之对应的集成开发环境,其特点是通过汉语进行编程。易语言的创始人是吴涛。早期版本的名字为E语言。 简单的说,易语言是一个小型的软件开发系统。(就是写程序用的,够通俗吧&#xff1f…

Vue76 编程式路由导航

笔记 作用&#xff1a;不借助<router-link> 实现路由跳转&#xff0c;让路由跳转更加灵活 具体编码&#xff1a; //$router的两个API this.$router.push({name:xiangqing,params:{id:xxx,title:xxx} })this.$router.replace({name:xiangqing,params:{id:xxx,title:xxx} …

LeetCode 热题 100 回顾19

干货分享&#xff0c;感谢您的阅读&#xff01;原文见&#xff1a;LeetCode 热题 100 回顾_力code热题100-CSDN博客 一、哈希部分 1.两数之和 &#xff08;简单&#xff09; 题目描述 给定一个整数数组 nums 和一个整数目标值 target&#xff0c;请你在该数组中找出 和为目标…

buuctf_藏藏藏

题目&#xff1a;没什么&#xff0c;一张图片&#xff0c;叫“藏藏藏.jpg” winhex&#xff0c;隐写看了&#xff0c;没什么结果 上kali&#xff0c;为了方便&#xff0c;我将图片命名为0.jpg。本文将讲述我遇到的俩个难点 1.kali未配置打不出中文字符 2.kali打不开docx 下面是…

1.2.1 计算机网络分层结构(上)

体系结构可分层使得不同的层次承担不同的功能。 知识点&#xff1a; 1.不同类型的节点&#xff0c;实现的功能层次可能不一样。 2.分层结构的设计并不唯一&#xff0c;可以根据实际需求增加或减少层次。 3.一个功能可以放在不同的层次反复出现。 根据分层结构不同可以分为&…