【NPU 系列专栏 3.1 -- - NVIDIA 的 Orin 和 Altan 和 Thor 区别】

news2024/9/20 6:12:29


请阅读嵌入式及芯片开发学必备专栏


文章目录

  • NVIDIA Orin、Altan 和 Thor
    • NVIDIA Orin 简介
      • NVIDIA Orin 主要特点
      • NVIDIA Orin 应用场景
    • NVIDIA Altan 简介
      • NVIDIA Altan 主要特点
      • NVIDIA Altan 应用场景
    • NVIDIA Thor 简介
      • NVIDIA Thor 主要特点
      • NVIDIA Thor 应用场景
    • 与 Hopper 架构的关系
      • Hopper 架构简介
      • Orin 与 Hopper
      • Altan 与 Hopper
      • hor 与 Hopper
    • Summary

NVIDIA Orin、Altan 和 Thor

NVIDIA Orin 简介

2020年前后,英伟达分别发布了新一代面向机器人和自动驾驶领域的Orin芯片和计算平台。这全新的SoC采用ARM Hercules CPU内核和英伟达下一代GPU架构,Orin SoC包含了高达170亿晶体管,几乎是Xavier SoC的两倍,搭载了12个ARM Hercules内核,并集成了NVIDIA下一代Ampere架构的GPU,提供了惊人的200 TOPS@INT8性能,接近Xavier SoC的7倍。

Orin SoC采用先进的7nm制程工艺,功耗水平出色,在200TOPS的算力下,TDP仅为50W。Orin的应用范围广泛,从入门级 ADAS 解决方案到 L5 级 Robotax系统,Orin计算平台有助于并发运行多个自动驾驶应用和深度神经网络模型算法。Orin 达到了 ISO 26262 ASIL-D 等级的功能安全标准,为自动驾驶系统的安全性提供了强有力的支持。
在这里插入图片描述

NVIDIA Orin 主要特点

  • 集成式计算解决方案:Orin 集成了英伟达 Ampere 架构的 GPU、ARM CPU 和深度学习加速器,实现高计算密度。
  • 高计算性能:提供高达 254 TOPS(每秒万亿次操作)的 AI 计算性能。
  • 多传感器支持:支持摄像头、雷达、激光雷达等多种传感器的数据处理。
  • 支持深度学习:内置深度学习加速器,优化 AI 推理和训练任务。

NVIDIA Orin 应用场景

  • 自动驾驶:用于处理自动驾驶汽车的环境感知、路径规划和决策。
  • 机器人:用于工业机器人、服务机器人等的智能控制和任务执行。
  • 智能交通:支持智能交通管理系统,提高交通效率和安全性。

NVIDIA Altan 简介

2021年4月 英伟达(NVIDIA)宣布推出下一代自动驾驶汽车AI计算平台NVIDIA DRIVE Atlan,可将车辆整个计算基础平台集成至单个片上系统中。

虽然车辆采用越来越多的计算技术,但是车辆也缺乏数据中心的物理安全性保护。而Atlan实际上是一个数据中心,可将英伟达在AI、汽车、机器人技术、安全性和BlueField数据中心中的所有技术融合在一起,从而实现安全可靠的AI计算。

Altan 是一款专为高性能计算和人工智能应用设计的 GPU。它提供了强大的计算能力和灵活的应用场景支持。该平台将实现每秒执行1000万亿次操作(1000 TOPS),是上一代产品的4
在这里插入图片描述

Altan 芯片架构示意图

NVIDIA Altan 主要特点

  • 高性能计算:提供卓越的计算性能,适用于深度学习训练和推理、高性能计算等任务。
  • 多架构支持:支持多种计算架构,如 FP32、FP16、INT8 等,适应不同的计算需求。
  • 高带宽内存:采用 HBM3 内存,提供高带宽和低延迟的数据传输。
  • 多功能应用:适用于科学计算、数据分析、金融建模等多个领域。

NVIDIA Altan 应用场景

  • 深度学习与人工智能:用于训练和推理复杂的深度学习模型,如 GPT-3、BERT 等。
  • 高性能计算 (HPC):适用科学仿真、工程计算等高性能计算任务。
  • 实时数据处理:在金融、医疗等需要实时数据处理的领域,提供快速的数据处理能力。

NVIDIA Thor 简介

2022年 9月21凌晨,NVIDIA GTC 2022秋季发布会上,CEO黄仁勋发布了其2024年将推出的自动驾驶芯片。因为其2000TFLOPS的性能过于强大,英伟达索性直接把它全新命名为Thor,代替了之前1000TOPSAltan

Thor 是一款面向自动驾驶和智能交通系统的 GPU。它集成了强大的计算能力和多功能支持,旨在提升自动驾驶系统的智能化和安全性。

NVIDIA Thor 主要特点

  • 专为自动驾驶设计:优化了自动驾驶所需的计算能力和传感器数据处理能力。
  • 高性能计算:提供卓越的计算性能,支持复杂的环境感知和决策算法。
  • 多传感器融合:支持摄像头、雷达、激光雷达等多种传感器的数据融合。
  • 高可靠性和安全性:符合汽车行业的高安全性和可靠性标准。

NVIDIA Thor 应用场景

  • 自动驾驶汽车:用于自动驾驶系统的环境感知、路径规划和决策。
  • 智能交通系统:支持智能交通管理、车联网等应用。
  • 实时视频处理:用于智能监控和视频分析,提高监控系统的智能化水平。

目前,蔚来、小鹏、理想等造车新势力车企的新车均所采用英伟达Orin X芯片,单颗算力为254TOPS,已经是量产车中算力最高的芯片,而新发布Thor算力较Orin提升了8倍。极氪已宣布将搭载Thor,应用于下一代智能电动汽车,并于2025年初开始生产。目前,极氪量产车型极氪001搭载的自动驾驶芯片是Mobileye EyeQ5,单颗算力为24TOPS

与 Hopper 架构的关系

Hopper 架构简介

Hopper 是英伟达最新一代的 GPU 架构,专为高性能计算和深度学习设计。其主要特点包括更高的计算性能、更高的能效和更灵活的架构设计。

Orin 与 Hopper

  • 不同的定位:Orin 主要面向自动驾驶和机器人应用,集成了 CPU、GPU 和深度学习加速器,而 Hopper 架构主要用于高性能计算和数据中心应用。
  • 技术继承:尽管 Orin 不直接基于 Hopper 架构,但它继承了英伟达在高性能计算和 AI 加速方面的技术优势。

Altan 与 Hopper

  • 直接基于 Hopper 架构:Altan 是基于 Hopper 架构设计的高性能 GPU,具有 Hopper 的所有技术优势,如高计算性能和高带宽内存。
  • 应用优化:Altan 针对高性能计算和 AI 应用进行了优化,提供了卓越的计算能力和灵活的应用支持。

hor 与 Hopper

  • 设计优化:Thor 尽管不直接基于 Hopper 架构,但它在自动驾驶和智能交通系统的应用中,继承了 Hopper 架构的高计算性能和多传感器支持。
  • 专门优化:Thor 针对自动驾驶和智能交通系统进行了特别优化,确保其在这些应用场景中提供高可靠性和高性能。

Summary

英伟达的 Orin、Altan 和 Thor GPU 各自针对不同的应用场景进行了设计和优化:

  • Orin:面向自动驾驶和机器人,集成了 CPU、GPU 和深度学习加速器。
  • Altan:基于 Hopper 架构,面向高性能计算和人工智能应用。
  • Thor:专为自动驾驶和智能交通系统设计,集成了高计算性能和多传感器支持。

这三款 GPU 产品共同构成了英伟达在高性能计算和智能系统领域的强大产品线,为各类应用提供了卓越的计算能力和灵活的解决方案。通过与 Hopper 架构的技术继承和优化,它们在各自的应用领域中展示出了极高的性能和效率。

推荐阅读
https://aijishu.com/a/1060000000356794
https://healthnews.sohu.com/a/752844053_236796

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1948695.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

CTF-NSSCTF题单[GKCTF2020]

[GKCTF 2020]CheckIN 这道题目考察:php7-gc-bypass漏洞 打开这道题目,开始以为考察反序列化,但实际并不是,这里直接用$_REQUEST传入了参数便可以利用了。这里出现了一个eval()函数,猜测考察命…

暑期C++ 缺省参数

有任何不懂的问题可以评论区留言,能力范围内都会一一回答 1.缺省参数的概念 缺省参数是是声明或定义参数时为函数的参数指定一个缺省值。在调用该函数值时,如果没有指定实参则采用该形参的缺省值,否则使用指定的实参 看了上面定义后&#…

CogVLMv2环境搭建推理测试

引子 之前写过一篇CogVLM的分享,感兴趣的移步CogVLM/CogAgent环境搭建&推理测试-CSDN博客,前一阵子,CogVLMv2横空出世,支持视频理解功能,OK,那就让我们开始吧。 一、模型介绍 CogVLM2 系列模型开源了…

基于Vision Transformer的mini_ImageNet图片分类实战

【图书推荐】《PyTorch深度学习与计算机视觉实践》-CSDN博客 PyTorch计算机视觉之Vision Transformer 整体结构-CSDN博客 mini_ImageNet数据集简介与下载 mini_ImageNet数据集节选自ImageNet数据集。ImageNet是一个非常有名的大型视觉数据集,它的建立旨在促进视觉…

旗晟机器人仪器仪表识别AI智慧算法

在当今迅猛发展的工业4.0时代,智能制造和自动化运维已然成为工业发展至关重要的核心驱动力。其中智能巡检运维系统扮演着举足轻重的角色。工业场景上不仅要对人员行为监督进行监督,对仪器仪表识别分析更是不可缺少的一个环节。那么我们说说旗晟仪器仪表识…

AI模型大比拼:Claude 3系列 vs GPT-4系列最新模型综合评测

AI模型大比拼:Claude 3系列 vs GPT-4系列最新模型综合评测 引言 人工智能技术的迅猛发展带来了多款强大的语言模型。本文将对六款领先的AI模型进行全面比较:Claude 3.5 Sonnet、Claude 3 Opus、Claude 3 Haiku、GPT-4、GPT-4o和GPT-4o Mini。我们将从性能…

【Gin】精准应用:Gin框架中工厂模式的现代软件开发策略与实施技巧(下)

【Gin】精准应用:Gin框架中工厂模式的现代软件开发策略与实施技巧(下) 大家好 我是寸铁👊 【Gin】精准应用:Gin框架中工厂模式的现代软件开发策略与实施技巧(下)✨ 喜欢的小伙伴可以点点关注 💝 前言 本次文章分为上下两部分&…

智能家居全在手机端进行控制,未来已来!

未来触手可及:智能家居,手机端的全控时代 艾斯视觉的观点是:在不远的将来,家,这个温馨的港湾,将不再只是我们休憩的场所,而是科技与智慧的结晶。想象一下,只需轻触手机屏幕&#xf…

如何实现CPU最大处理效率

如何实现CPU最大处理效率 CPU,或称为中央处理器,是计算机中负责执行指令和处理数据的核心部件。它的工作原理可简单概括为"取指、译码、执行、存储"四个步骤,也称为计算机的指令周期。 取指(Fetch):在取指阶段,CPU从内存中获取下一条要执行的指令,并存放在指…

回顾网络路,心率就过速

笔者上网写作已满16年,其间加盟过国内互联网的知名网站自媒体至少在40至50家之多,但由于有的被已被勒令停刊了(如《天涯论坛》),有的则因其改版而只保留了极少数擅于唱颂的写手(如《强国论坛》)…

【SpringCloud】企业认证、分布式事务,分布式锁方案落地-1

目录 HR企业入驻 HR企业入驻 - 认证流程解析 HR企业入驻 - 查询企业是否存在 HR企业入驻 - 上传企业logo与营业执照 HR企业入驻 - 新企业(数据字典与行业tree结构解析) 行业tree 行业tree - 创建节点 行业tree - 查询一级分类 行业tree - 查询子分…

计算存储背景与发展

随着云计算、企业级应用以及物联网领域的飞速发展,当前的数据处理需求正以前所未有的规模增长,以满足存储行业不断变化的需求。这种增长导致网络带宽压力增大,并对主机计算资源(如内存和CPU)造成极大负担,进…

Redis的使用场景——热点数据缓存

热点数据缓存 Redis的使用场景——热点数据的缓存 1.1 什么是缓存 为了把一些经常访问的数据,放入缓存中以减少对数据库的访问效率,从而减少数据库的压力,提高程序的性能。【在内存中存储】 1.2 缓存的原理 查询缓存中是否存在对应的数据如…

05 capture软件创建元器件库(以STM32为例)

05 创建元器件库_以STM32为例 一、新建原理图库文件二、新建器件三、开始创建元器件 一些IC类元件,需要自己创建元器件库。 先看视频,然后自己创建STM32F103C8T6的LQFP48的元器件。 STM32F103C8T6是目前为止,自己用的最多的芯片。 先要有数据…

nodejs安装及环境配置建材商城管理系统App

✌网站介绍:✌10年项目辅导经验、专注于计算机技术领域学生项目实战辅导。 ✌服务范围:Java(SpringBoo/SSM)、Python、PHP、Nodejs、爬虫、数据可视化、小程序、安卓app、大数据等设计与开发。 ✌服务内容:免费功能设计、免费提供开题答辩P…

文件包涵条件竞争(ctfshow82)

Web82 利用 session.upload_progress 包含文件漏洞 <!DOCTYPE html> <html> <body> <form action"https://09558c1b-9569-4abd-bf78-86c4a6cb6608.challenge.ctf.show//" method"POST" enctype"multipart/form-data"> …

C语言的发展过程介绍

引言 C语言&#xff0c;由丹尼斯里奇&#xff08;Dennis Ritchie&#xff09;在20世纪70年代初期于贝尔实验室开发&#xff0c;是计算机科学史上最具影响力的编程语言之一。本文将概述C语言的发展历程&#xff0c;并提供一些代码示例来展示其演变。 起源&#xff1a;UNIX和C语言…

自动化测试--WebDriver API

1. 元素定位方法 通过 ID 定位&#xff1a;如果元素具有唯一的 ID 属性&#xff0c;可以使用 findElement(By.id("elementId")) 方法来定位元素。通过 Name 定位&#xff1a;使用 findElement(By.name("elementName")) 来查找具有指定名称的元素。通过 Cl…

重生之“我打数据结构,真的假的?”--5.堆(无习题)

1.堆的概念与结构 如果有⼀个关键码的集合 &#xff0c;把它的所有元素按完全⼆叉树的顺序存储⽅ 式存储&#xff0c;在⼀个⼀维数组中&#xff0c;并满⾜&#xff1a; &#xff08; 且 &#xff09;&#xff0c; i 0、1、2... &#xff0c;则称为⼩堆(或⼤堆)。将根结点最⼤的…

逻辑处理模块:FPGA复旦微JFM7VX690T36+网络加速器:雄立XC13080-500C

逻辑处理模块通常是指在计算机系统、软件应用或电子设备中负责执行逻辑运算和决策过程的组件。 在不同的领域和技术中&#xff0c;逻辑处理模块可能有不同的实现方式和名称&#xff0c;但它们的核心功能都是基于输入数据进行逻辑判断和处理&#xff0c;并产生相应的输出结果。下…