[自动驾驶 SoC]-3 英伟达Orin

news2024/11/24 7:30:17

NVIDIA® Jetson AGX OrinTM series (资料来源:nvidia-jetson-agx-orin-technical-brief.pdf)

1 整体介绍

1) Orin SoC结构

Orin SoC,如下图所示,由一个NVIDIA Ampere architecture GPU, Arm® Cortex®-A78AE CPU, 下一代深度学习核视觉处理加速器, 视频编码器和视频解码器组成。

2) Orin和Xavier配置对比

3) AGX ORIN分为32GB、64GB两种模块

2 核心模块说明

1) GPU

GPU由两个GPC组成,共计16个SM单元,192KB L1 Cache和4MB L2 Cache。每个SM具备128个CUDA核(共计2048个-5.3 FP32 TFLOPs)和4个第三代Tensor核(共计64个-170 sparse TOPs INT8)。

2) Tensor核

 主要提供矩阵乘法累加计算,支持16个半精度HMMA和32个整型IMMA,并且支持稀疏计算。

3) TensorRT和cuDNN

TensorRT 是一个深度学习推理的运行时库和优化器,提供低的延迟和高吞吐量,用于解析训练好的模型,通过将模型量化到 INT8 格式、优化 GPU 内存和带宽利用(如内核节点融合)以及选择最佳的数据层和算法,最大化推理性能。

cuDNN提供了深度神经网络常见操作的高度优化实现,例如卷积前向和反向、交叉相关、池化前向和反向、softmax 前向和反向以及张量变换功能等。

4) DLA

DLA 2.0 提供了高效能的架构,增加了本地缓冲区,提高了能效并减少了 DRAM 带宽。同时DLA 2.0 引入了结构化稀疏性、深度卷积和硬件调度器等新特性,支持最多 105 INT8 稀疏 TOPs 性能,相比 Jetson AGX Xavier DLA 的 11.4 INT8 密集 TOPs 大幅提升。

用户可以使用 TensorRT 加速 DLA 上的模型,NVIDIA DLA 设计用于从 GPU 卸载深度学习推理,使 GPU 能够运行更复杂的网络和动态任务;TensorRT 支持在 DLA 上运行 INT8 或 FP16 的网络,并支持卷积、反卷积、全连接、激活、池化、批量归一化等层。

5) CPU

CPU使用ARM Cortex-A78AE CPU 取代了 NVIDIA Carmel CPU,包含 12 个 CPU 核心,每个核心具有 64KB 的指令 L1 缓存和 64KB 的数据缓存,以及 256KB 的 L2 缓存,每个集群还具有 2MB 的 L3 缓存,最高支持 2.2 GHz 的 CPU 频率。

6) AI性能对比

3 实例介绍

1)自动泊车系统

1.1) 环境感知:摄像头捕捉停车场景,LiDAR扫描周围环境。

处理单元:CUDA核心处理图像预处理,Tensor核心运行YOLO等物体检测模型识别停车位和障碍物。

1.2) 路径规划:计算最优泊车路径。

处理单元:ARM CPU核(可结合DLA核-支持3D建模、路径规划、语义理解等)运行路径规划算法(如 A* 或 Dijkstra 算法),生成泊车轨迹。

1.3) 传感器融合:融合摄像头和LiDAR数据,生成准确的停车场景。

处理单元:CUDA核心处理数据融合,ARM CPU核进行高层次决策生成统一环境模型。

1.4) 车辆控制:执行泊车操作。

处理单元:ARM CPU核控制转向和速度,实现平稳泊车。

2) 计算机视觉处理

NVIDIA Jetson AGX Orin 通过 PVA 和 VIC 提供了强大的计算机视觉处理能力,结合 VPI 软件库,可以灵活地在多种硬件组件上运行复杂的视觉算法,从而优化计算资源的利用。

2.1)可编程视觉加速器(PVA)

双7路 VLIW(超长指令字)矢量处理单元:可以并行处理多个指令,提高计算效率。

双 DMA 引擎:用于高效的数据传输,减少数据传输的瓶颈。

Cortex-R5 子系统:负责控制和调度任务,提供实时处理能力。

PVA 支持:滤波,对图像进行平滑或增强处理;图像扭曲,调整图像的几何形状;图像金字塔,多分辨率图像表示,用于检测不同尺度的特征;特征检测,检测图像中的关键点;快速傅里叶变换(FFT),用于频域分析。

2.2)视频成像合成器(VIC)2D 引擎

VIC 支持的图像处理功能:镜头畸变校正,增强时间噪声减少,频锐化增强,颜色空间转换,图像缩放,图像混合与合成。

2.3)视觉编程接口(VPI)

VPI 是一个软件库,旨在实现计算机视觉和图像处理算法的硬件加速。它支持在 PVA、VIC、CPU 和 GPU 上运行计算机视觉任务,从而有效地分配计算资源。例如,基本图像处理(如框滤波、卷积、图像重缩放和重映射);复杂计算机视觉算法(如 Harris 角点检测、KLT 特征跟踪、光流、背景减法等)。

2.4) 立体视差估计(Stereo Disparity Estimation)流水线示例

输入:来自立体相机的左图像和右图像。

处理步骤:

a) 镜头畸变校正和图像缩放:由 VIC 处理。

b) 颜色转换为灰度图像:由 GPU 处理。

c) 特征检测和立体匹配:由 PVA 和 NVENC 处理。

输出:生成输入图像之间的视差估计,反映场景深度。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1831011.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MicroPython+ESP32 C3开发上云

传感器PinI/O状态D412输出1开0关D513输出1开0关 概述 MicroPython是python3编程语言的精简实现,能够在资源非常有限的硬件上运行,如MCU微控制器Micropython的网络功能和计算功能很强大,有非常多的库可以使用,它为嵌入式开发带来了…

Windows NT 3.5程序员讲述微软标志性“3D管道”屏幕保护程序的起源故事

人们使用屏保程序来防止 CRT 显示器"烧毁",因为静态图像会永久损坏屏幕。像 3D Pipes 这样的屏保程序能在显示器处于非活动状态时为其提供动画效果,从而保护屏幕并延长其使用寿命。此外,它们还能在用户不使用电脑时为其提供可定制的…

盘点有趣的人工智能开源项目一

字幕导出 zh_recogn是一个专注于中文语音识别的字幕生成工具,基于魔塔社区Paraformer模型。它不仅支持音频文件,还能处理视频文件,输出标准的SRT字幕格式。这个项目提供了API接口和简单的用户界面,使得用户可以根据自己的需求灵活…

值得推荐的品牌维权控价方法

数据调查 全面了解线上各渠道(如淘宝、天猫、拼多多、京东、抖音、快手等)的低价情况,包括哪些是授权店低价、窜货或假货,为后续针对性治理提供依据。人工排查适用于链接不多的情况,链接数量庞大时利用系统监测更高效…

睿烨蜘蛛池福建官网下载

baidu搜索:如何联系八爪鱼SEO? baidu搜索:如何联系八爪鱼SEO? baidu搜索:如何联系八爪鱼SEO? 现在做站群程序的时候,由于百度、搜狗蜘蛛越来越少了,所以缓存也跟着减少,很多人都降低了服务器的配置,这个时候google蜘蛛却疯狂涌入,烦不胜烦…

Pulsar 社区周报 | No.2024-06-14 | 增强 Pulsar Broker 级别的监控指标

“ 各位热爱 Pulsar 的小伙伴们,Pulsar 社区周报更新啦!这里将记录 Pulsar 社区每周的重要更新,每周发布。 ” 本期主题:增强 Pulsar Broker 级别的监控指标 在 Pulsar 的当前度量指标框架中, pulsar_out_bytes_total …

AbMole带你探索细胞的“铁”门:Piezo1通道在椎间盘退变中的关键角色

在生物医学领域,铁是细胞功能不可或缺的元素,但铁的异常积累却可能成为细胞的“隐形杀手”。最近,一项发表在《Bone Research》上的研究,为我们揭开了铁代谢与椎间盘退变之间神秘联系的一角。这项研究不仅深化了我们对铁离子通道P…

[机器学习] Stable Diffusion初体验——基于深度学习通过神经网络的强大AI平台

文章目录 前言平台介绍 一.创建应用 Stable Diffusion WebUI初始化上传模型,VAE,lora 介绍sd模型,vae,lora模型进入应用文生图工作区调参区图生图 结语 前言 在这个信息爆炸的时代,AI技术正以前所未有的速度发展着。图…

Appium+python自动化(九)- 定位元素工具(义结金兰的两位异性兄弟)(超详解) 密码保护

宏哥微信粉丝群:https://bbs.csdn.net/topics/618423372 有兴趣的可以扫码加入 简介 环境搭建好了,其他方面的知识也准备的差不多了,那么我们就开始下一步元素定位,元素定位宏哥主要介绍如何使用uiautomatorviewer,通…

python-不定方程求解

[题目描述] 给定正整数 a,b,c。求不定方程axbyc 关于未知数 x 和 y 的所有非负整数解组数。输入: 一行,包含三个正整数 a,b,c,两个整数之间用单个空格隔开。每个数均不大于 1000。输出&#xff…

Python武器库开发-武器库篇之Redis未授权漏洞扫描器(五十七)

Python武器库开发-武器库篇之Redis未授权漏洞扫描器(五十七) Redis未授权访问漏洞简介以及危害 Redis是一个开源的内存数据库,具有高性能和可扩展性。然而,由于配置不当或者默认设置,Redis服务器可能会存在未授权访问的漏洞。 未授权访问漏…

股票交易系统

效果展示,如下动图: 首先简述一下股票交易规则: 买卖股票,股民可以自行选择股票的买入或卖出价格和股票的数量,但是用户不一定马上就交易成功,只有当股票价格低于买入价才有机会买入,高于卖出价…

用户运营(1):从“麦肯锡三层面法”看怎么定“用户运营策略”

麦肯锡三层面法是源自麦肯锡公司提出的一种战略规划框架,它基于对全球不同行业高速增长公司的研究,为企业提供了一个系统化的方法,可以让企业用来平衡短期业绩、中期增长机会与长期潜力的开发,确保企业持续增长与适应市场变化。以…

springcloud第4季 分布式事务seata作用服务搭建

一 seata作用 1.1 作用 二 seata服务端搭建 2.1 seata搭建 2.2.1 seata 服务端下载安装 下载地址: Seata-Server下载 | Apache Seata 截图如下: 2.2.2 使用mysql初始化seata所需表 1.下载脚本地址:incubator-seata/script/server/db/…

分组检测常用算法

目录 4.分组检测常用算法4.1 接收信号能量检测4.2 双滑动窗口分组检测4.3 采用前导结构进行分组检测 总结 微信公众号获取更多FPGA相关源码: 4.分组检测常用算法 常用的分组检测算法包括能量检测算法、双滑动窗口能量检测算法、以及利用训练序列的同步算法等。 …

MySQL8新特性实现无限层级依赖SQL查询

前言 看IT老齐视频,学到了一招MySQL8的新特性,特此记录一下,大家可以去看原视频: 【IT老齐173】学到就是赚到,利用MySQL8新特性实现无限层级依赖SQL查询 准备 MySQL至少需要8以上的版本哦! 1.创建表 C…

石墨消解仪 石墨炉加热 热传导率高 平均温差小

GS系列石墨消解仪是一款专为实验室加热设计制造的加热装置,可用于样品加热、培养、烘干。采用国际先进技术,具有消解快速、高效、节能、方便等优点,采用数字电路PID方式控制温度,更加准确。高纯优质石墨加热载体,表面喷…

代码随想录——电话号码的字母组合(Leetcode17)

题目链接 回溯 class Solution {List<String> res new ArrayList<String>();StringBuilder str new StringBuilder();HashMap<String, String> Sites new HashMap<String, String>();public List<String> letterCombinations(String digit…

《汇编语言程序设计》例子出现segmentation fault

照着例子抄写了一下&#xff0c;直接用的 gcc 编译&#xff0c;源码如下&#xff0c;因为不支持 pushl&#xff0c;所以改成了 pushq #cpuid.s View the CPUID Vendor ID string using C library calls .section .data output:.asciz "The processor Vendor ID is %s \n&…

揭秘:边缘智能网关P1600在智慧灯杆上的应用

智慧灯杆作为智慧城市建设的重要组成部分&#xff0c;集成了照明、通信、安防、环境监测等多重功能&#xff0c;是实现城市智能化的关键载体。边缘智能网关P1600在这一系统中扮演着至关重要的角色&#xff0c;它不仅连接和管理各种传感器和设备&#xff0c;还负责数据的采集、处…