购买新的图形卡(GPU)可能很困难,尤其是如果涉及您所不熟悉的所有技术问题。
显卡市场上的大多数消费者只需要了解显卡在自己喜欢的游戏中的性能,并确定购买决定即可。但是,如果您想购买GPU进行视频编辑或3D渲染,则查找相关信息要困难得多。
特别是对于3D渲染,如果您尽可能快地进行渲染,则会节省大量时间和金钱。
怎么区分渲染GPU与编辑GPU?
尤其是如果您不熟悉图形技术,那么您就有很多问题需要回答。
我们将在这里假设基本熟悉程度,即,您知道GPU代表图形处理单元 ,而图形卡是包含一个或多个GPU的扩展卡。
图像来源:Nvidia
有什么不同?专业GPU与消费者GPU
如今,消费者GPU和专业GPU看起来比以往任何时候都更相似。
一些GPU甚至稍微模糊了界限,例如AMD的Radeon VII或Nvidia的Titan系列。
毕竟,这些卡具有超高的价格标签和虚幻的VRAM数量。
今天,让我们看一下Nvidia RTX GPU。面向消费者的GeForce RTX卡与面向专业的Quadro RTX卡之间有什么区别?
图片来源:PNY
它们都使用相同的硬件体系结构,有时甚至可以指定为处理内核和VRAM,但是Quadro的价格要高出好几倍……这仅仅是骗局吗?
让我们来看看:
专业GPU
消费类GPU与专业GPU之间的最大区别在于软件。
Nvidia的Quadro卡和AMD的FirePro卡经过优化,专门针对高端生产力应用程序,与业界领先的应用程序具有极其彻底的兼容性。
此外,它们得到了多年的支持,并且被视为长期投资,而消费类图形卡则不被视为长期投资。
Pro GPU已通过行业应用程序进行了测试,并且对驱动程序进行了优化,以使其发挥最佳性能。许多高级行业应用程序(例如流行的CAD应用程序Solidworks)具有特殊功能(例如Solidworks中的RealView),只有在拥有专业GPU的情况下才受支持。
例如,下图显示了Solidworks官方支持的Nvidia GPU:
图像来源:Solidworks
如果您使用的是专业GPU,则某些软件供应商仅支持您,并提供售后维护。
对于大型公司而言,这是至关重要的,在大型公司中,服务器或工作站的正常运行时间对于保持其昂贵的员工始终在功能性PC上工作至关重要。
这确实是有道理的。有足够资金的公司购买Quadro GPU。软件开发人员以足够的资金支持公司。这些公司通常还拥有专门的IT人员,具有足够的专业知识。
怎么让麻烦更少,更有效:
1、Solidworks支持人员与公司的IT专家交谈,然后可以解决公司所有PC上的某些Solidworks故障
2、许多Solidworks支持人员与数百名不了解PC / Tech / IT的个人用户交谈
购买Pro-GPU时,您购买的是Pro-Support。(除了一些硬件功能)
消费类GPU
消费类GPU将非常适合游戏和消费类应用程序。
它们还可以非常擅长于照片和视频编辑,而功能强大的消费类GPU(例如Nvidia RTX 2080Ti)通常被夸大了。
消费类GPU也非常适合GPU渲染,因为GPU渲染引擎通常不具有只能在专业GPU上运行的功能。
专业GPU,不过,通常会...不太擅长的游戏,但高超的编辑,渲染和几乎任何其它专业级的任务,但是,相同的性能下,专业GPU会价格更高。
因此,如果您知道选择的软件没有使用需要专业GPU的功能,并且您不需要专业GPU中的大量VRAM,那么消费类GPU几乎总是更好的选择,尤其是在性价比方面。
但是,让我们深入探讨一些细节。
CUDA内核,或者为什么在这里Nvidia受到青睐
CUDA内核是指Nvidia GPU内发现的特殊处理内核,这是Nvidia专有的。
CUDA代表Compute Unified Device Architecture,而Nvidia GPU内部的这些核心本质上是充当原始计算能力,而不是原始图形能力。
这就是为什么它们被用来在受支持的字幕(例如Nvidia HairWorks)中增强计算密集型效果的原因,仅GPU不足以完成这项工作。
对于编辑和渲染,CUDA核心是执行给定任务所需的额外计算能力的必不可少的来源。
大多数编辑和渲染应用程序都以某种方式进行了优化,以利用CUDA内核,因此在系统中添加更多功能将使您能够更好,更快地渲染模型、视频等。
一些流行的GPU渲染引擎(例如Octane和Redshift)是基于Nvidia的CUDA构建的,这意味着只有拥有Nvidia GPU才能使用它们。在此类渲染引擎中,渲染性能几乎与GPU具有的CUDA Cores数量成线性比例关系。
某些应用程序(例如Adobe的After Effects或Premiere Pro)带来了对Nvidia和AMD GPU的支持,但通常在Nvidia GPU上运行得更快。
GeForce还是Quadro?
当涉及到编辑视频和原始3D应用程序性能之类的事情时,GeForce将为您带来最大的价值。
但是,由于GeForce是一个主要面向游戏玩家和普通消费者的品牌,因此高端专业人士可能需要缺少某些功能。
Quadro可以在许多应用程序中提供高性能,但是吸引人的要点是其对企业用户的软件支持。
与GeForce相比,任何获得的性能都要付出高昂的价格。
但是,如果您需要ECC(纠错代码存储器)或绝对适合专业应用程序的最佳驱动程序,则Quadro是最佳选择~
GeForce专注于游戏和消费者,Quadro专注于企业和企业用户。
此外,Quadro还将具有更高的CUDA内核和VRAM数量,并且有时还会具有诸如ECC之类的独有功能,我们将在稍后详细说明。
总体而言, 我们向以下用户推荐Quadro:
-
可以冲销高价作为业务费用
-
可以利用ECC,更大的VRAM,更高的浮点精度,更高的监视器位深度
-
需要仅专业级GPU支持的特殊软件功能(例如Solidworks,Autocad…)
-
定期依靠软件供应商的维护和支持
-
需要对其硬件进行全面测试,以确保其在企业或服务器环境中的持久性和稳定性,即使在24/7正常运行时间下
我们向以下用户推荐GeForce:
-
不要利用仅PRO级GPU支持的功能
-
想要更多的钱来赚钱
-
不一定需要大量的VRAM或ECC
-
不要依赖其应用程序供应商的常规软件支持
-
可能还想时不时地玩游戏
我需要RTX吗?
Nvidia的“ Turing”架构是第一个引入RTX的架构,它在CUDA内核(即RT和Tensor内核)之上带来了一些新功能。
图像来源:Nvidia
RT内核是用于光线跟踪的,并且是专门为它而构建的。
对于专业渲染,至少在受支持的应用程序中,拥有更强大的光线跟踪GPU可以大大加快工作量。
如果您不需要光线跟踪GPU(尤其是如果您专注于视频编辑而不是3D渲染),那么RT内核的出现就不会带来很大的不同。
Tensor核心是另一个故事,变得更加有趣。
在消费类GPU中,Tensor内核用于实现DLSS(深度学习超级采样)等功能,该功能使用AI来改善图像质量。
对于专业用途,Tensor内核可以利用其强大的FP16 / FP32和INT4 / 8功能,使其成为神经网络、深度学习、人工智能等的理想选择。
如果这些领域听起来像您的企业想要探索的东西,那么Quadro RTX可能就是您想要的。
至少在受支持的渲染引擎中,RT Core还可大大提高渲染速度。例如,Octane和Redshift正在研究使用RayTracing Cores的实现。
总之,RT和Tensor内核添加了一些漂亮的额外功能,这些功能可能会或可能不会对您的工作量产生影响。
但是,我们仍然建议将RTX GPU替换为上一代Nvidia GPU,因为即使不利用这些额外的处理内核,最新的RTX GPU确实比非RTX前辈具有显着的性能提升。
编辑GPU需要什么?
与专业渲染相比,视频编辑需要的GPU需求要少得多。
甚至您的具有CUDA内核的Nvidia的基本消费类GPU都可以在这里完成工作,尤其是当您只是一个从事自由职业或发布到YouTube等网站的内容创建者时。
查看以下Premiere Pro视频编辑基准,可以清楚地显示GPU Sweet Spot所在的位置:
视频和照片编辑不需要任何想象力,就不需要夸张的Quadro GPU规格和价格标签,因此您将非常适合低端或中端GeForce RTX GPU。
如果您的需求是更多企业级的(即4K / 8K HDR视频),那么您可能希望选择高端GeForce RTX GPU。
您需要渲染GPU有什么功能?
从渲染GPU(在专业环境中进行显式3D渲染),您将需要GPU的更多帮助。
渲染GPU(鉴于它与您正在使用的渲染引擎兼容)所需要的最大功能就是尽可能多的CUDA核心和VRAM。
在GPU上渲染平均帧所花费的时间与GPU拥有的CUDA核心数量几乎成线性反比。
但是,如果3D场景数据适合其VRAM(GPU上的视频内存),则GPU只能利用其巨大的CUDA Core性能。
这意味着,如果您知道具有数百万个多边形,子多边形位移或诸如大型纹理之类的非常复杂的场景,则对VRAM的需求将比仅包含几个对象的场景相当简单的情况要高得多。
大多数GeForce RTX GPU已经具有相当数量的VRAM,通常在8GB至11GB之间,但是如果您需要更多,则必须使用Quadro RTX GPU,它具有高达48GB的VRAM。
在Quadro GPU中,您还将获得ECC,我们现在将对其进行解释。
ECC:它是什么,以及为什么您需要它
ECC是指纠错代码存储器。
ECC内存可检测并纠正在长期的高强度工作负载过程中自然发生的数据错误。
这些错误是造成看似随机的事件(如数据损坏或系统故障)的原因,在处理足够脆弱的数据时,必须不惜一切代价避免这些错误。
这就是为什么ECC最常用于服务器和企业PC中的原因-为了防止这些错误在造成最严重损害时发生。
在GPU中,ECC是Nvidia和AMD的专业GPU独有的。
在Nvidia的情况下,这些仅在Nvidia Quadro GPU中存在,并且对于防止某些情况下的致命错误是必需的。
但是,大多数未集成到企业工作流中的消费者和创建者可以放心地忽略ECC。
评估表现
评估给定GPU性能的第一个也是最好的方法是查看基准。
通常,消费者会查看游戏和其他应用程序的基准,以最好地了解给定组件的性能。
通常,这里也适用相同的观点,但是您确实需要知道应该关注哪些基准。
为了进行GPU渲染,您具有受欢迎的GPU渲染引擎(例如OctaneBench,Redshift和VRAY -RT)的基准。
其他资源也可能会有所帮助,包括Passmark的GPU计算基准表(用于衡量DirectCompute / OpenCL性能)。
除了基准测试外,还有核心规格,我们将在以下每个精选下列出这些规格。
我们要处理的核心规格是:
-
CUDA核心——对应于原始处理能力(3D渲染性能的巨大指标)
-
Tensor核心——对应于深度学习/ AI功能以及FP32 / 16工作负载
-
RT核心——对应于光线追踪性能,可以成为受支持的渲染引擎中3D渲染的加速器
-
VRAM ——用于管理较大的场景,编辑等,而不会占用过多的内存
-
GPU频率——GPU核心速度的度量
顶级GeForce和顶级RTX GPU规格表
注意:实际价格可能有所不同。Quadro RTX卡通常比MSRP便宜得多,而非Quadro卡通常比MSRP更高或更低。
从表中可以看出,最大的硬件差异归结为大幅提升的VRAM(带有ECC),以及显着提升了CUDA,Tensor和RT内核,至少在高端方面如此。
除了包含ECC外,Titan RTX还提供与高端Quadro RTX卡类似的规格。
关键要点:
在GeForce上选择Quadro的主要原因是为了增强稳定性以及对企业级软件的驱动程序支持–否则,GeForce卡在许多情况下都可以以更低的价格获得相似的性能。
我应该用双GPU吗?
如果您要构建游戏系统,我们的答案将非常简单:不,绝对不是。
在游戏方面,多GPU支持已大大减少,不建议使用。
但是为了提高生产力……嗯,这是另一回事了。
游戏需要利用SLI之类的标准来利用多个GPU渲染一个场景,而大多数编辑和渲染应用程序都是在考虑分布式工作负载的情况下进行的。
这意味着您不仅不需要GPU完美协调地工作就可以同时拥有两张卡,而且还可以看到线性的2倍性能提升,从而可以在工作负载中增加另一个GPU!
双GPU并不是高端产品。随着在兼容系统中添加更多卡,工作负载(如3D-GPU渲染)的性能几乎呈线性增长,对于3D-Artists,配备多达4个GPU的HEDT PC是很常见的。
关于Nvidia的NVLINK的一小段内容:
但是,要利用NVLINK内存共享,您将需要比RTX 2070 Super更高层的GPU。此外,使用NVLINK一次不能在两个以上的GPU之间共享内存,并且需要渲染引擎支持才能使用这些功能。
您将需要NVLINK桥来连接两张卡。
在Adobe Premiere Pro中用于视频编辑的双/多GPU设置?
Premiere Pro不会在系统中使用多个GPU,因此您不会从多个GPU中受益。
最佳编辑和渲染图形卡:瑞云的推荐选择
1、最佳价值编辑和渲染GPU:Nvidia RTX 2060 Super
参数:
-
CUDA核心– 2176
-
Tensor Cores – 272
-
RT内核– 34
-
VRAM – 8GB GDDR6
-
GPU频率– 1470 MHz(基本)
如果您预算有限,但仍希望在花钱进行编辑和渲染任务时获得良好的性能,则RTX 2060 Super将是我们的首选。
与同价位的其他GPU相比,它为游戏和专业工作提供了全面的卓越性能。(不过,对于游戏而言,AMD RX 5700绝对是更好的选择。)
RTX 2060 Super具有适量的RT和Tensor核心以及相当数量的CUDA核心,足以编辑1080p和1440p视频。
在OctaneBench中,该卡的得分约为205,这比Quadro RTX 3000(在149)和Quadro RTX 5000(在184)要好得多。
这意味着2060 Super可用的原始计算能力甚至超过价格比其价格高出数倍的Quadro RTX卡,这当然还不错。
这些成绩使RTX 2060 Super在计算性能上稳居单个GPU卡的中端。
对于那些刚开始进行编辑和渲染的人,或者还没有数千美元的硬件投资,RX 2060 Super是一个理想的起点。
需要双GPU?取而代之的是鼓风机风格的RTX 2060 Super
2、最佳高端编辑和渲染GPU:Nvidia RTX 3090
参数:
-
CUDA核心——10496
-
Tensor Cores——328
-
RT核心——82
-
VRAM——24GB GDDR6X 9
-
GPU频率——1400 MHz(基本)
如果您预算不紧,又不需要ECC,又不想卖肾脏来买显卡,请购买Nvidia RTX 3090。
出于游戏目的,与低端同类产品相比,RTX 3090并没有真正提高每美元的性能。
但是,与上述非Ti同类产品相比,它的原始计算性能确实有了显着提高,这使其成为“编辑和渲染”中更具吸引力的选择。
在OctaneBench中,RTX 3090得分为661,就单GPU性能而言,它稳固地位于高端单GPU卡上。
考虑到所有这些因素,RTX 3090成为了该级别的首选。如果您要处理1440p / 4K视频或常规的高要求渲染任务,则3090是最适合该工作的显卡之一。
3、最佳高端专业GPU:Nvidia Quadro RTX 6000
参数:
-
CUDA核心——4608
-
Tensor Cores——575
-
RT核心——72
-
VRAM——24 GB GDDR6(ECC)
-
GPU频率——1440 MHz(基本)
最后但同样重要的是,让我们看一下Quadros。
在原始性能方面,在受VRAM限制的场景之外,Quadro RTX 6000不会比RTX 2080 Ti更好。
这在OctaneBench中得到了反映,该结果显示2080 Ti的302仅308英寸——难以置信的边际差异。但是,如果您已阅读该文章,则可能已经弄明白了那部分。
获得Quadro RTX卡的主要动机是增强的软件支持,稳定性和ECC RAM支持。
如果您想要在这个性价比范围内的产品,但Quadro RTX 6000不能提供您所需要的产品,请考虑以下三种选择。
如果此卡看起来有点受VRAM的限制,请选择Quadro RTX8000。大多数规格相同,但VRAM却增加了一倍。
非VRAM绑定方案中的性能差异非常有限。
如果ECC对您的工作负载无关紧要,那么您也可以便宜得多,并获得具有几乎相同规格的Nvidia Titan RTX。
如果ECC不要紧,你的工作量和你不介意多付大约在同一价格,还要考虑泰坦V。
它没有RT内核,但是它确实具有足够的计算能力——根据OctaneBench的说法,是所有单个GPU中最好的——并且它仍然具有更多的Tensor和CUDA内核可以使用。不过,它确实具有更少的VRAM。
Renderbus瑞云渲染农场支持最新CPU卡渲染及GPU卡渲染,GPU渲染低至2.5元/机时,CPU渲染低至0.125/核时。现在新用户注册,即可获得40元无门槛渲染券哦~欢迎前来免费试用!