[每周一更]-(第94期):认识英伟达显卡

news2024/11/19 1:32:08

在这里插入图片描述

英伟达显卡:引领图形计算的领先者,显卡也常称为GPU(图形处理器 Graphics processing unit),是一种专门在个人电脑、工作站、游戏机和一些移动设备(如平板电脑、智能手机等)上执行绘图运算工作的微处理器。以图形处理器为核心的主板扩展卡也称显示卡或“显卡”。

英伟达(NVIDIA)是全球领先的人工智能计算公司,其显卡产品在图形处理、深度学习、科学计算等领域具有举足轻重的地位。英伟达的显卡产品以其出色的性能、高度的可靠性和广泛的应用领域而闻名于世。以下是对英伟达显卡的介绍、参数指标、性能以及市场常见的对比。

做显卡目前市面上出名的就是:英伟达和AMD,自己的两台主机上也分别配置的有英伟达的GTX1060和1050Ti(现在消费级都已经40系,自感落伍),AMD的显卡早起有用过,如Radeon HD 7790,英伟达是专注做显卡,而AMD不光显卡,还有CPU还很顶,前几期之前也有介绍;

显卡的常见使用场景是:剪辑、游戏、计算等,详细的就如下:

  1. 游戏: 游戏是显卡最为常见的使用场景之一。显卡负责处理图形渲染,将游戏中的虚拟场景和角色呈现在显示器上。高性能的显卡可以提供更流畅、更逼真的游戏画面和更高的帧率,提升游戏体验。

  2. 图形设计和数字内容创作: 图形设计师、动画师、影视制作人等专业人士常常使用显卡进行图形渲染、视频编辑和3D建模等工作。显卡提供了强大的图形处理能力,加速了设计和创作过程,并提高了工作效率。

  3. 科学计算和工程仿真: 显卡不仅可以用于图形处理,还可以用于科学计算和工程仿真。GPU加速技术可以大幅提高计算密集型任务的运行速度,包括分子动力学模拟、气候模拟、流体动力学仿真等领域。

  4. 深度学习和人工智能: 显卡在深度学习和人工智能领域也发挥着重要作用。由于深度学习算法的并行计算特性,GPU的并行计算能力能够大幅加速训练和推理过程,成为深度学习模型训练的重要工具。

  5. 数据可视化和大数据分析: 在数据科学领域,显卡可以用于数据可视化、大数据分析和数据挖掘等任务。通过GPU加速技术,可以更快地处理大规模数据集,并通过可视化方式展现数据分析结果。

  6. 虚拟现实和增强现实: 虚拟现实(VR)和增强现实(AR)技术需要大量的图形处理能力来实时渲染虚拟场景和交互元素。显卡可以提供高性能的图形处理,为VR和AR应用提供流畅的用户体验。

1. 介绍

英伟达的显卡产品主要分为消费级和专业级两大类别。消费级显卡主要面向游戏玩家和普通消费者,提供了高性能的图形处理能力和优秀的游戏体验;专业级显卡则主要面向科研、工程设计、数字内容创作等专业领域,具有更高的计算性能和可靠性。

2.种类

英伟达(NVIDIA)的显卡种类众多,涵盖了消费级、专业级和数据中心级等多个领域。以下是一些主要的英伟达显卡系列:

  1. GeForce系列: 主要面向消费级市场,包括游戏玩家和个人用户。GeForce系列显卡拥有强大的图形处理性能,提供出色的游戏体验和图形渲染效果。常见的产品包括RTX 30系列(如RTX 3080、RTX 3070等)和GTX系列(如GTX 1660 Ti、GTX 1650等),最新是40系,如RTX 4090,从20系列产品新命名为RTX,而未沿用推出多年的GTX,以突显支援光线跟踪的特色。
  2. Quadro系列: 面向专业级市场,包括设计师、工程师、数字内容创作者等专业用户。Quadro系列显卡具有优秀的计算性能和专业级的驱动支持,适用于CAD、CG、视频编辑等专业应用。
  3. Tesla系列: 面向数据中心和高性能计算市场,用于机器学习、深度学习、科学计算等领域。Tesla系列显卡拥有强大的计算能力和高效的并行处理能力,支持CUDA和TensorFlow等深度学习框架。
  4. TITAN系列: 旗舰级产品,面向高端消费者和专业用户。TITAN系列显卡集合了英伟达最先进的技术和性能,拥有超高的计算能力和显存容量,适用于高端游戏、深度学习、科学研究等领域。
  5. Ampere架构: 是英伟达最新一代的GPU架构,采用了先进的光线追踪技术和AI加速器,提供了更高的性能和更低的功耗。Ampere架构显卡包括RTX 30系列和A100等产品。

3.市场常见的对比

在市场上,英伟达显卡通常与其主要竞争对手AMD的显卡进行对比。两者在性能、价格、功耗等方面都有各自的优势和特点。以下是英伟达显卡和AMD显卡常见的对比:

  • 性能比较: 英伟达显卡在游戏性能和图形处理能力上通常表现更强,而AMD显卡在计算性能和成本效益上有一定优势。
  • 功耗和散热: 英伟达显卡的功耗和散热控制通常较好,能够在更低的功耗下实现更高的性能,而AMD显卡在功耗和散热方面可能略逊一筹。
  • 价格比较: 英伟达显卡通常定位在高端市场,价格相对较高,而AMD显卡在中低端市场具有更好的性价比。

总的来说,英伟达显卡以其优秀的性能、可靠性和广泛的应用领域而受到用户的青睐,不断推动着图形计算和人工智能技术的发展。在选择显卡时,用户可以根据自己的需求和预算考虑英伟达显卡以及其他竞争对手的产品,并进行综合评估和对比。

4.NVIDIA 架构 演进过程

NVIDIA的GPU架构经历了多次演进,不断推动着图形处理和计算领域的发展。以下是NVIDIA GPU架构的演进过程的主要里程碑:

  1. Tesla架构:
  • 推出时间:2006年
  • Tesla架构是NVIDIA推出的第一个通用并行计算架构,为高性能计算和科学计算提供了强大的计算能力。Tesla架构引入了CUDA(Compute Unified Device Architecture)计算模型,为GPU计算的兴起奠定了基础。
  1. Fermi架构:
  • 推出时间:2010年
  • Fermi架构是NVIDIA第一代支持双精度浮点计算的GPU架构,提供了更高的计算性能和更广泛的应用领域。Fermi架构引入了NVIDIA的Parallel Thread Execution(PTX)指令集,为GPU计算的发展打开了新的可能性。
  1. Kepler架构:
  • 推出时间:2012年
  • Kepler架构是NVIDIA第一代支持动态并行调度的GPU架构,提供了更高的能效和更优化的性能。Kepler架构引入了GPU Boost技术,可以根据工作负载动态调整核心频率,提高了GPU的功效比。
  1. Maxwell架构:
  • 推出时间:2014年
  • Maxwell架构是NVIDIA注重能效和性能平衡的一代GPU架构,引入了多项能效优化技术和新的图形渲染技术。Maxwell架构支持Dynamic Super Resolution(DSR)和Multi-Frame Sampled Anti-Aliasing(MFAA)等新功能。
  1. Pascal架构:
  • 推出时间:2016年
  • Pascal架构是NVIDIA的第一代基于16nm FinFET工艺的GPU架构,具有更高的性能和更低的功耗。Pascal架构引入了NVIDIA的深度学习加速器(NVIDIA Deep Learning Accelerator),为深度学习应用提供了更强大的支持。
  1. Volta架构:
  • 推出时间:2017年
  • Volta架构是NVIDIA的下一代GPU架构,主要针对高性能计算和深度学习应用。Volta架构引入了Tensor Core加速器,支持深度学习矩阵运算,并提供了更高的计算性能和更强大的AI加速能力。
  1. Turing架构:
  • 推出时间:2018年
  • Turing架构是NVIDIA的下一代游戏和工作站GPU架构,引入了实时光线追踪技术(RTX)和人工智能加速器(Tensor Core)。Turing架构为游戏图形提供了更高的真实感和渲染效果,并提供了更强大的AI加速能力。
  1. Ampere架构:
  • 推出时间:2020年
  • Ampere架构是NVIDIA的最新一代GPU架构,采用了8nm制程工艺,引入了第二代Tensor Core和NVIDIA RT Core等新技术,提供了更高的计算性能和更强大的人工智能加速能力。Ampere架构主要用于数据中心、高性能计算和深度学习领域。
  1. Hopper 架构:
  • 推出时间:2022年
  • NVIDIA Hopper™ 架构的新一代加速计算平台。与上一代产品相比,该平台实现了数量级的性能飞跃。 Hopper 采用尖端台积电4 nm制程,配备超过800 亿个电晶体,具有五项突破性创新技术,是NVIDIA H200与H100 Tensor 核心GPU的动力所在,相互结合之下,相较于上一代NVIDIA Megatron 530B聊天机器人(全球最大的生成语言模型),人工智慧推论的速度提升30 倍。NVIDIA Hopper 架构利用专为加速人工智慧模型训练而设计的Transformer Engine,进一步提升Tensor 核心技术。

5.显卡性能指标

显卡性能的指标有很多,以下是其中一些主要的指标:

  1. CUDA核心数(NVIDIA)/ 流处理器数(AMD): CUDA核心数或流处理器数是显卡中用于并行计算的处理单元数量。核心数越多,显卡的并行计算能力越强大,性能也通常更高。

  2. 显存容量: 显存容量决定了显卡可以处理的数据量大小。对于需要处理大型图像、视频或模型的任务,较大的显存容量可以提高性能和效率。

  3. 核心频率: 核心频率是指GPU核心的运行速度,通常以MHz或GHz为单位。较高的核心频率意味着GPU可以更快地处理图形和计算任务。

  4. 显存频率: 显存频率是显卡显存模块的运行速度,通常以GHz为单位。较高的显存频率可以提高数据传输速度,提高显卡的整体性能。

  5. 带宽: 显存带宽是指显卡与显存之间的数据传输速度,通常以GB/s为单位。较高的带宽可以提高数据传输效率,加快图形渲染和计算速度。

  6. 功耗(TDP): TDP(Thermal Design Power)是显卡在满负荷运行时的最大热设计功耗,通常以瓦特(W)为单位。较高的功耗可能需要更好的散热系统,但也可能意味着更高的性能。

  7. 性能指标(例如FLOPS): 性能指标用于评估显卡在不同工作负载下的性能表现,通常以每秒浮点运算次数(FLOPS)为单位。较高的性能指标意味着显卡在计算密集型任务中具有更好的性能。

6.英伟达和AMD的部分参数

  1. NVIDIA GeForce RTX 3080:
  • VRAM容量:10GB GDDR6X
  • CUDA核心数:8704
  • 核心频率:1440 MHz
  • 显存频率:19 Gbps
  • TDP:320W
  • 性能指标:29.8 TFLOPS(浮点计算性能)
  1. NVIDIA GeForce RTX 3070:
  • VRAM容量:8GB GDDR6
  • CUDA核心数:5888
  • 核心频率:1500 MHz
  • 显存频率:14 Gbps
  • TDP:220W
  • 性能指标:20.3 TFLOPS
  1. NVIDIA GeForce RTX 3060 Ti:
  • VRAM容量:8GB GDDR6
  • CUDA核心数:4864
  • 核心频率:1410 MHz
  • 显存频率:14 Gbps
  • TDP:200W
  • 性能指标:16.2 TFLOPS
  1. AMD Radeon RX 6900 XT:
  • VRAM容量:16GB GDDR6
  • 流处理器数:5120
  • 核心频率:2015 MHz
  • 显存频率:16 Gbps
  • TDP:300W
  • 性能指标:23.0 TFLOPS
  1. AMD Radeon RX 6800 XT:
  • VRAM容量:16GB GDDR6
  • 流处理器数:4608
  • 核心频率:2015 MHz
  • 显存频率:16 Gbps
  • TDP:300W
  • 性能指标:20.7 TFLOPS

参考

  • GeForce
  • 图形处理器
  • hopper-architecture

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1629593.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【STM32+HAL】三轴按键PS2摇杆

一、准备工作: 有关CUBEMX的初始化配置,参见我的另一篇blog:【STM32HAL】CUBEMX初始化配置 有关定时器触发ADC模式配置,详见【STM32HAL】ADC采集波形实现 二、所用工具: 1、芯片: STM32F407VET6 2、CUBE…

大数据面试题 —— Spark数据倾斜及其解决方案

目录 1 调优概述2 数据倾斜发生时的现象3 数据倾斜发生的原理4 如何定位导致数据倾斜的代码4.1 某个 task 执行特别慢的情况4.2 某个 task 莫名其妙内存溢出的情况5 查看导致数据倾斜的 key 的数据分布情况6 数据倾斜的解决方案6.1 使用 Hive ETL 预处理数据6.2 过滤少数导致倾…

Ubuntu中的 Everything 搜索软件 ==> fsearch

本文所使用的 Ubuntu 系统版本是 Ubuntu 22.04 ! 在 Windows 中,我经常使用 Everything 来进行文件搜索,搜索效率比 Windows 自带的高出千百倍。 那么在 Ubuntu 系统中,有没有类似的软件呢?那必须有,它就是 FSearch 。…

JavaScript-Web API基本认知-什么是DOM和BOM

基本认知 var、let、const选用Web API作用和分类什么是DOM什么是DOM树DOM对象(重要)什么是BOM var、let、const选用 var or let or const ? 首先var 先排除,老派写法,问题很多,可以淘汰掉… let or const …

Docker 的数据管理 与 Docker 镜像的创建

目录 一、Docker 的数据管理 1.1.数据卷 1.2.数据卷容器 1.3.容器互联(使用centos镜像) 二、Docker 镜像的创建 2.1.基于现有镜像创建 2.2.基于本地模板创建 2.3.基于Dockerfile创建 2.3.1联合文件系统(UnionFs) 2.3.2…

多线程模型浅谈

优质博文:IT-BLOG-CN 笔者近期在维护的项目中发现了一些比较随机的问题,时有时无的,排查之后发现是使用多线程导致的,恍然之下研究了下多线程的底层模型相关知识,现不大家简要分享下。 一个程序进程可包含多个线程&am…

全志ARM-超声波测距

超声波测距模块是用来测量距离的一种产品,通过发送和收超声波,利用时间差和声音传播速度, 计算出模块到前方障碍物的距离 1.测距原理: 给Trig端口至少10us的高电平发送声波,Echo信号,由低电平跳转到高电平…

【语音识别】搭建本地的语音转文字系统:FunASR(离线不联网即可使用)

参考自: 参考配置:FunASR/runtime/docs/SDK_advanced_guide_offline_zh.md at main alibaba-damo-academy/FunASR (github.com)参考配置:FunASR/runtime/quick_start_zh.md at 861147c7308b91068ffa02724fdf74ee623a909e alibaba-damo-aca…

绘唐科技AIGC怎么激活

绘唐科技AIGC怎么激活绘唐科技AIGC怎么激活绘唐科技AIGC怎么激活绘唐科技AIGC怎么激活 这里激活免费3天体验 Docshttps://qvfbz6lhqnd.feishu.cn/wiki/D3YLwmIzmivZ7BkDij6coVcbn7W

【Django】初识Django快速上手

Django简介 Django是一个高级的、开源的Python Web框架,旨在快速、高效地开发高质量的Web应用程序 https://developer.mozilla.org/zh-CN/docs/Learn/Server-side/Django/Introduction 安装Django pip install Django如果要知道安装的Django的版本,可…

机器学习:深入解析SVM的核心概念(问题与解答篇)【一、间隔与支持向量】

直接阅读原始论文可能有点难和复杂,所以导师直接推荐我阅读周志华的《西瓜书》!!然后仔细阅读其中的第六章:支持向量机 间隔与支持向量 问题一:什么叫法向量?为什么是叫法向量 在这个线性方程中&#xff…

新科技辅助器具赋能视障生活:让盲人出行融入日常

随着科技日新月异的发展,一款名为蝙蝠避障专为改善盲人日常生活的盲人日常生活辅助器具应运而生,它通过巧妙整合实时避障与拍照识别功能,成功改变了盲人朋友们的生活格局,为他们提供了更为便捷、高效的生活体验。 这款非同…

数据结构——二叉树的顺序存储(堆)(C++实现)

数据结构——二叉树的顺序存储(堆)(C实现) 二叉树可以顺序存储的前提堆的定义堆的分类大根堆小根堆 整体结构把握两种调整算法向上调整算法递归版本 非递归版本向下调整算法非递归版本 向上调整算法和向下调整算法的比较 我们接着…

1. 房屋租赁管理系统(Java项目 springboot/vue)

1.此系统的受众 1.1 在校学习的学生,可用于日常学习使用或是毕业设计使用 1.2 毕业一到两年的开发人员,用于锻炼自己的独立功能模块设计能力,增强代码编写能力。 1.3 亦可以部署为商化项目使用。 2. 技术栈 jdk8springbootvue2mysq5.7&8…

论文阅读之MMSD2.0: Towards a Reliable Multi-modal Sarcasm Detection System

文章目录 论文地址主要内容主要贡献模型图技术细节数据集改进多视图CLIP框架文本视图图像视图图像-文本交互视图 实验结果 论文地址 https://arxiv.org/pdf/2307.07135 主要内容 这篇文章介绍了一个名为MMSD2.0的多模态讽刺检测系统的构建,旨在提高现有讽刺检测系…

Amazon云计算AWS之[5]关系数据库服务RDS

文章目录 RDS的基本原理主从备份和下读写分离 RDS的使用 RDS的基本原理 Amazon RDS(Amazon Relational Database Service) 将MySQL数据库移植到集群中,在一定的范围内解决了关系数据库的可扩展性问题。 MySQL集群方式采用Share-Nothing架构。每台数据库服务器都是…

JavaEE——介绍 HTTPServlet 三部分使用与 cookie 和 session 的阐述

文章目录 一、HTTPServlet介绍其中的关键 三个方法 二、HTTPServletRequest(处理请求)1.分块介绍方法作用get 为前缀的方法字段中 含有 getParameter 字段 的方法(前后端交互):字段中 含有 getHeader 字段 的方法: 2.解释前后端的交互过程3.使用 json 格…

【小迪安全2023】第59天:服务攻防-中间件安全CVE复现lSApacheTomcatNginx

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收…

RocketMQ快速入门:namesrv、broker、dashboard的作用及消息发送、消费流程(三)

0. 引言 接触rocketmq之后,大家首当其冲的就会发现需要安装3个组件:namesrv, broker, dashboard,其中dashboard也叫console,为选装。而这几个组件之前的关系是什么呢,消息发送和接收的过程是如何传递的呢,…

如何在 Visual Studio 中通过 NuGet 添加包

在安装之前要先确定Nuget的包源是否有问题。 Visual Studio中怎样更改Nuget程序包源-CSDN博客 1.图形界面安装 打开您的项目,并在解决方案资源管理器中选择您的项目。单击“项目”菜单,然后选择“管理 NuGet 程序包”选项。在“NuGet 包管理器”窗口中…