DPU是什么?

news2024/11/20 12:44:45

问题描述:

DPU是什么?
在这里插入图片描述

解答:

DPU(Data Processing Unit)是以数据为中心构造的专用处理器,采用软件
定义技术路线支撑基础设施层资源虚拟化,支持存储、安全、服务质量管理等
基础设施层服务。2020年NVIDIA公司发布的DPU产品战略中将其定位为数据中
心继CPU和GPU之后的“第三颗主力芯片”,掀起了一波行业热潮。DPU的出
现是异构计算的一个阶段性标志。与GPU的发展类似,DPU是应用驱动的体系
结构设计的又一典型案例;但与GPU不同的是,DPU面向的应用更加底层。
DPU要解决的核心问题是基础设施的“降本增效”,即将“CPU处理效率低
下、GPU处理不了”的负载卸载到专用DPU,提升整个计算系统的效率、降低
整体系统的总体拥有成本(TCO)。DPU的出现也许是体系结构朝着专用化路
线发展的又一个里程碑。

DPU的作用

DPU最直接的作用是作为CPU的卸载引擎,接管网络虚拟化、硬件资源池
化等基础设施层服务,释放CPU的算力到上层应用。以网络协议处理为例,要
线速处理10G的网络需要的大约4个Xeon CPU的核,也就是说,单是做网络数据
包处理,就可以占去一个8核高端CPU一半的算力。如果考虑40G、100G的高速
网络, 性能的开销就更加难以承受了。A m a z o n 把这些开销都称之为
“Datacenter Tax”,即还未运行业务程序,先接入网络数据就要占去的计算资
源。AWS Nitro产品家族旨在将数据中心开销(为虚拟机提供远程资源,加密解
密,故障跟踪,安全策略等服务程序)全部从CPU卸载到Nitro加速卡上,将给
上层应用释放30%的原本用于支付“Tax” 的算力!

DPU的设计目标是提供高效的数据处理能力,以满足不同应用场景中对数据处理的需求。相比于传统的通用处理器(如CPU),DPU在数据处理方面通常具有更高的效率和性能。

简介

数据中心走向以数据为中心,CPU的性能已经远远落后于数据的增长速度,GPU加速计算成为了计算的主力,极大地提升了单处理器及单机的计算性能。
利用CPU来处理数据中心中的安全、通信、存储、虚拟化等基础架构操作的传统方式逐渐成为计算性能增长的瓶颈,计算和基础架构支撑功能对CPU的资源冲突愈加剧烈。
NVIDIA DPU的出现,将这些基础架构的操作由CPU卸载到了DPU上 ,实现了软件定义和硬件加速在安全、通信、存储和虚拟化等方面组合,将CPU的计算资源释放了出来,更好地支持应用的需求。

发展历史

源于传统的网卡设备,通过添加网络硬件卸载功能(如RDMA、安全卸载、存储卸载、OVS卸载等)走向了智能网卡,NVIDIA再通过和ARM CPU及PCIe交换机的整合实现了DPU的雏形,未来和GPU的进一步整合将实现完整的功能完善和强大的DPU。

核心结构

CPU + 智能网卡 + PCIe交换 + GPU(未来) + DOCA软件开发包

工作原理

软件定义和硬件加速是工作原理的综合。通过网卡的硬件卸载实现高性能的通信、安全、存储和虚拟化,通过CPU来处理管理和控制平面的操作,通过GPU实现DPU的自学习、推理及推荐,并增强DPU的计算性能。

性能优势

NVIDIA BlueField DPU [1]实现全线速的Data In-Line和Data At-Rest加解密功能,如150倍IPSec加解密性能提升; 在不消耗主机CPU的前提下大幅提升了存储的IOPS,比较主机CPU来操作大约30倍的性能提升;实现了RDMA操作的控制和数据平面卸载, 2.5倍的Overlay网络性能提升; 150倍的下一代有状态防火墙性能提升; 10倍的防恶意攻击性能提升等。

应用领域

包括安全加速、存储加速和软硬件分离、OVS卸载、计算加速、视频流业务加速、防火墙加速、防恶意攻击等。

应用场景一:网络功能卸载

网络功能卸载是伴随云计算网络而产生的,主要是对云计算主机上的虚拟
交换机的能力做硬件卸载,从而减少主机上消耗在网络上的CPU算力,提高可
售卖计算资源。

应用场景二:存储功能卸载

NVMe-oF硬件加速
NVMe over Fabric(又名NVMe-oF)是一个相对较新的协议规范,旨在使用
NVMe通过网络结构将主机连接到存储,支持对数据中心的计算和存储进行分
解。NVMe-oF协议定义了使用各种通用的传输协议来实现NVMe功能的方式。
在NVMe-oF诞生之前,数据存储协议可以分为三种:
(1)iSCSI:是一种基于IP的存储网络标准,在TCP/IP网络上通过发送
SCSI命令来访问块存储服务。
(2)光纤通道(Fibre Channel):是一种高速的数据传输协议,提供有序
无损的块数据传输。主要用于关键高可靠要求的业务上。

应用场景三:安全功能卸载

硬件信任根
硬件信任根在安全领域是其它安全功能的基础,主要表现如下方面:
(1)硬件信任根(Root-Of-Trust):硬件信任根提供更离散的密钥生成算
法,并且与主机操作系统相隔离,可以做到硬件防破解。硬件信任根实现私有
密钥存储,可以反克隆和签名。通过硬件信任根认证授权实现访问受控。
(2)加密解密(Encryption/Decryption):数据加密解密算法完全卸载到
硬件网卡,无需主机CPU资源,效率更高更可靠。可以实现通用加密算法和国
密算法等。
(3)密钥证书管理(KMS):密钥证书管理卸载到智能网卡,与主机系统
相隔离;支持多种密钥交换算法,如D-H密钥交换等。
(4)动态数据安全(Secure Data-in-Motion):利用硬件级加解密算法,对
传输通道上的数据做加解密处理,如IPSec和TLS等。硬件处理可以实现更高吞
吐量。
(5)静态数据安全(Secure Data-at-Rest):在存储服务中,永久存盘的数
据需要进行加密,防止被窃取,硬件级数据加解密在存储服务中可以提供更高
效的数据读取,并保证数据安全。
All Rights Reserved 55
DPU White Paper
(6)流日志和流分析(Flowlog):流分析和流日志监控,对数据中心流量
做精细监控,有效识别,可以及时识别DDoS攻击,并做出响应。

卸载到了DPU上,卸载到DPU上具体是什么意思?

卸载到DPU上意味着将特定的任务或操作转移给DPU来处理,而不是由CPU来执行。这可以提供一些优势,包括:

提高性能:DPU通常专门针对某些特定任务进行了优化,比如数据处理、网络处理、硬件加速等。相比于通用的CPU来说,DPU在这些特定任务上可能具有更高的效率和性能。

降低CPU负载:将一些特定的任务从CPU卸载到DPU上,可以减轻CPU的工作负荷,使其能够更集中地处理其他任务。这有助于提高系统的整体性能和响应速度。

节省能源:由于DPU通常比CPU更高效,卸载到DPU上的任务可以以更低的能耗完成。这可以帮助降低整体系统的能耗。

在NVIDIA的案例中,NVIDIA DPU(数据处理器)是专门设计用于数据中心和云计算环境的加速器,可以卸载和加速一些特定的数据处理任务,如网络加速、数据解码、转码等。通过将这些任务卸载到DPU上,可以提高整体系统的性能和效率。

总而言之,将任务卸载到DPU上意味着通过使用专门的处理器来执行特定的任务,以提高性能、降低负载和节省能源。

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1478364.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【vmware安装群晖】

vmware安装群晖 vmware安装群辉: vmware版本:17pro 下载链接, https://customerconnect.vmware.com/cn/downloads/details?downloadGroupWKST-1751-WIN&productId1376&rPId116859 激活码可自行搜索 教程: https://b…

云时代【4】—— 资源隔离与控制技术

云时代【4】—— 资源隔离与控制技术 二、资源隔离与控制技术(一)NameSpace1. 基本介绍2. 相关 Linux 指令实战1:隔离进程实战2:隔离文件系统 (二)CGroups1. 基本介绍2. 相关 Linux 指令实战1:c…

sora技术报告阅读

sora是一个在可变持续时间、分辨率和宽高比的视频和图像上联合训练文本条件扩散模型。 需要将所有类型的视觉数据转化为统一表示的方法,使得能够对生成模型进行大规模训练。 Sora是一个通用的视觉数据模型,它可以生成不同持续时间、宽高比和分辨率的视…

ctfshow——反序列化

文章目录 web 254——啥也没web 255——反序列化对变量进行赋值(1)web 256——反序列化对变量进行赋值(2)web 257——对象注入web 258——对象注入(绕过preg_match)web 259 web 254——啥也没 这里就是使用GET传输,use…

小程序中使用echarts地图

一、下载并安装echarts 1、下载echarts-for-weixin组件 echarts-for-weixin项目提供了一个小程序组件,用这种方式可以在小程序中方便地使用 ECharts。 下载ec-canvas项目(下载地址) ​​ 注意:下载的 ec-canvas 中的echarts的版本…

k8s.gcr.io/pause:3.2镜像丢失解决

文章目录 前言错误信息临时解决推荐解决onetwo 前言 使用Kubernetes(k8s)时遇到了镜像拉取的问题,导致Pod沙盒创建失败。错误显示在尝试从k8s.gcr.io拉取pause:3.2镜像时遇到了超时问题,这通常是因为网络问题或者镜像仓库服务器的…

【Go-Zero】测试API查询信息无法返回数据库信息与api、rpc文件编写规范

【Go-Zero】测试API查询信息无法返回数据库信息与api、rpc文件编写规范 大家好 我是寸铁👊 总结了一篇测试API查询信息无法返回数据库信息与api、rpc文件编写规范的文章✨ 喜欢的小伙伴可以点点关注 💝 问题背景 大家好,我是寸铁&#xff01…

TypeScript 中类的理解及应用场景

👩 个人主页:不爱吃糖的程序媛 🙋‍♂️ 作者简介:前端领域新星创作者、CSDN内容合伙人,专注于前端各领域技术,成长的路上共同学习共同进步,一起加油呀! ✨系列专栏:前端…

应用多元统计分析--多元数据的直观表示(R语言)

例1.2 为了研究全国31个省、市、自治区2018年城镇居民生活消费的分布规律,根据调查资料做区域消费类型划分。 指标: 食品x1:人均食品支出(元/人) 衣着x2:人均衣着商品支出(元/人) 居住x3:人均居住支出(元/人) 生活x4…

map和set的简单介绍

由于博主的能力有限,所以为了方便大家对于map和set的学习,我放一个官方的map和set的链接供大家参考: https://cplusplus.com/ 在初阶阶段,我们已经接触过STL中的部分容器,比如:vector、list、deque&#x…

【AI+应用】怎么快速制作一个类chatGPT套壳网站

最近有人问我, 看了我之前写的一篇文章 [人工智能] AI浪潮下Sora对于普通人的机会 , 怎么做一个类chatGPT的套壳网站,是从0开始做么。 对于普通人来说,万事不懂先AI, AI找不到答案搜索google或百度。对于程序员来说…

GIT 拉取代码报错error:some local refs could not be updated

文章目录 报错信息处理办法在这里插入图片描述小结 报错信息 ![new branch] dev->orgin/dev(unable to update local ref) error:some local refs could not be updated;try running git remote prune orginto remove any old,confilicting branches 处理办法 git gc --pru…

【免费】两阶段鲁棒优化matlab实现——CCG和benders

目录 1 主要内容 2 部分代码 3 程序结果 4 下载链接 1 主要内容 程序采用matlab复现经典论文《Solving two-stage robust optimization problems using a column-and-constraint generation method》算例,实现了C&CG和benders算法两部分内容,通过…

android开发与实战,那些年Android面试官常问的知识点

前言 在做android项目开发时,大家都知道如果程序出错了,会弹出来一个强制退出的弹 出框,这个本身没什么问题,但是这个UI实在是太丑了,别说用户接受不了,就连 我们自己本身可能都接受不了。虽然我们在发布程…

水豚鼠标助手 强大的鼠标美化工具

水豚鼠标助手 水豚鼠标助手是一款 鼠标换肤、屏幕画笔、放大镜、聚光灯、屏幕放大、倒计时功能的强大屏幕演示工具。 软件助手获取 水豚鼠标助手1.0.0 安装教程 第一步:下载后,双击软件安装包 第二步:Windows可能会出现提示弹窗&#xff…

使用Docker部署Nacos集群和Nginx高可用负载(9节点集群部署)

文章目录 🔊博主介绍🥤本文内容部署Nacos集群Nginx高可用负载 📢文章总结📥博主目标 🔊博主介绍 🌟我是廖志伟,一名Java开发工程师、Java领域优质创作者、CSDN博客专家、51CTO专家博主、阿里云专…

打造透明银行存储:Solidity智能合约的实践与探索

引言: 随着区块链技术的快速发展,智能合约作为其中的核心组件,正被越来越多地应用于各种场景。作为智能合约的编程语言,Solidity因其对以太坊平台的深度支持而备受关注。在这篇文章中,我们将通过构建一个透明的银行存储…

Qt6内嵌CEF

一、下载CEF CEF下载地址:https://cef-builds.spotifycdn.com/index.html 或https://bitbucket.org/chromiumembedded/cef/src/master/ 选择对应系统的版本(本教程选择的是116.0.19) CMake下载地址:https://cmake.org/download…

模糊PID控制算法实战讲解-案例温度控制(附C语言实现)

可结合之前的文章一起理解: 控制算法-PID算法总结-从公式原理到参数整定解析(附C源码)_pid自整定算法-CSDN博客 模糊控制算法实战讲解-案例温度控制(附C语言实现)-CSDN博客 目录 一、模糊PID控制的原理 1.1 模糊化…

【程序员是如何看待“祖传代码”的?】《代码的遗产:探索程序员眼中的“祖传代码”》

程序员是如何看待“祖传代码”的? 在程序员的世界里,代码不仅仅是构建软件的基石,它们也承载着历史、智慧和技术的演变。在我的编程生涯中,我遇到过许多神奇而独特的“祖传代码”,这些代码如同古老的魔法书&#xff0…