RTX40 系列游戏本还有几天就上市了,商家选了个比较特别的日子,2 月 22 号 22:00,真是有心了。为了用游戏本做 AI 的朋友选的时候有的放矢,特意查了一下 RTX40 系列的 CUDA 核心与频率,计算一下 FP32 TFLOPS,便于比较。
笔记本 GPU:
RTX40 系列笔记本 GPU:
RTX30 系列笔记本 GPU:
RTX30 系列的游戏本还占有较大的市场,估计随着 RTX40 系列游戏本的推出,价格上可能会有一些优惠,性价比会有提高,也可以关注一下。
RTX40 系列与 RTX30 系列游戏本对比:
NVIDIA 给出的测试显示,RTX40 系列笔记本 GPU 性能比上一代有较大的提高:
除了加速频率的提升,还得益于构架的升级:
RTX40 系列与RTX30 系列游戏本计算力对比:
台式机显卡:
RTX40 系列台式机 GPU:
RTX30 系列台式机 GPU:
RTX40 系列与 RTX30 系列台式机显卡对比:
小结:
比较 RTX30 与 RTX40 系列的游戏本 GPU,不难发现,稍低端的 RTX4060 与 RTX3060 的 TFLOPS 差别不大,而且 RTX4060 的位宽比 RTX3060 低,估计老黄的刀法是冲着 10~20 TFLOPS 去的,差不多够用就得了,再高了,散热和性价比就不好控制了;高端的 RTX4090 游戏本的 FP32 达到了接近 40 TFLOPS;目前来看,不能再高了,再高估计散热就 Hold 不住了。
RTX4090 台式机显卡的 FP32 达到了 82.6 TFLOPS,RTX4070Ti 也到了 40.1 TFLOPS,超过了上一代的旗舰 RTX3090Ti,性能再低的就看看游戏本得了。
目前比较火的 ChatGPT,底层拥有一个 1750 亿参数的预训练大模型,支撑其算力基础设施至少需要上万颗英伟达 GPU A100( 19.5 TFLOPS),一次模型训练成本超过 1200 万美元;训练阶段总算力消耗约为 3640PF-days(即1 PetaFLOP/s效率跑3640天),如果采用 121 块最新的 RTX4090 台式机显卡,不停的跑,得跑一整年!
老徐,2023/2/17