Arm发布 Neoverse V2 和 E2:下一代 Arm 服务器 CPU 内核

news2025/1/17 6:16:49

9月14日,Arm发布了新的处理器内核:V2和E2,在官网已经可以看到相关的TRM 手册了。。
在这里插入图片描述

在这里插入图片描述

四年前,Arm发布了Neoverse系列的CPU设计。Arm决定加大力度进军服务器边缘计算市场,专门为这些市场设计Arm CPU内核,而不仅仅是回收以消费者为中心的Cortex-A设计。因此,Arm开始以更积极的方式进军基础设施市场。这些努力为Arm及其合作伙伴带来了越来越丰厚的回报,得益于亚马逊的GravitonAmpere Altra CPU等产品,他们终于能够在服务器CPU市场中占据重要份额。
在这里插入图片描述
在这里插入图片描述

然而,随着Arm CPU最终实现了过去十年未能实现的市场渗透率,Arm需要确保不会满足于现状。在该公司的Neoverse核心设计的三个系列中——高效的E、灵活的N和高性能的V——该公司已经推出了第二代N核心,恰当地称为N2。现在,该公司正准备用下一代V和E核心更新Neoverse系列的其余产品,并于今天发布了Neoverse V2和Neoverse E2核心。这两种设计都将为HPC和其他服务器客户带来Armv9架构,并显着提高性能。
在这里插入图片描述

Arm Neoverse V2:Armv9助力高性能计算

领导Arm新CPU核心IP的是该公司的第二代V系列设计Neoverse V2。完整的V2平台代号为Demeter,标志着Arm高性能V系列内核的首次迭代,以及该内核系列从Armv8.4 ISA到Armv9的过渡。虽然这只是Arm第二次尝试服务器专用高性能核心,但请不要误会:Arm的目标是雄心勃勃。该公司声称Neoverse V2 CPU将提供市场上最高的单线程整数性能,超越AMD和英特尔的下一代设计。

虽然Arm本周发布的公告没有对新架构进行全面深入探讨,而且更令人恼火的是,该公司没有谈论具体的PPA指标,但Arm提供了对一些变化和功能的高级概述,这些功能将随V2平台一起提供。可以肯定的是,V2 IP现已完成并交付给客户(尤其是NVIDIA),但在2023年第一批基于该IP的芯片发布之前,Arm在某种程度上对V2的说法含糊其辞。

首先也是最重要的,Armv9的升级带来了最新Arm架构的全套功能。其中包括作为架构基础功能的安全性改进(对于云共享环境尤其方便)以及Arm较新的SVE2矢量扩展。

对于后者,Arm做出了一个有趣的改变,重新配置了矢量引擎的宽度;V1使用2个管道256位SIMD实现SVE(1),而V2则转向4个管道128位SIMD。最终结果是V2的累积SIMD宽度并不比V1宽,但执行流程已更改为并行处理大量较小的向量。这一变化使得SIMD管道宽度与Arm的Cortex部件相同(均为128位,SVE2的最小尺寸),但这确实意味着Arm不再充分利用可扩展性通过使用更大的SIMD来实现SVE的一部分。我希望一旦Arm进行了全面的V2深入研究,我们就会明白为什么Arm会采取这条路线,因为我很好奇这是否纯粹是一种效率游戏,还是更类似于整个Arm生态系统的同质化设计。

除此之外,值得注意的是,虽然Arm的演示幻灯片将bfloat16和int8 matmul列为功能,但这些并不是新功能。尽管如此,Arm仍承诺V2的SIMD处理将比V1提供更高的微架构效率。
在这里插入图片描述

更广泛地说,V2还将引入更大的L2缓存大小。V2设计支持每个核心高达2MB的私有二级缓存,是V1最大大小的两倍。V2还将进一步改进Arm的整数处理性能,但该公司目前尚未透露更多细节。从架构的角度来看,V1借鉴了Cortex-X1 CPU的设计,如果V2再次借鉴X2的设计,也不会太令人惊讶。在这种情况下,像Snapdragon 8 Gen1和Dimensity 9000这样的消费芯片应该可以提供一个关于预期结果的宽松参考。
在这里插入图片描述

对于Demeter平台,Arm将重复使用其CMN-700网状织物,该织物首次在V1代中引入。CMN-700仍然采用现代网格设计,在12x12配置中支持多达144个节点,并且适合与DDR5内存以及用于I/O的PCIe 5/CXL 2连接。因此,严格来说,V2并没有在结构层面带来任何新东西——甚至512MB的SLC也可以通过V1 + CMN-700设置完成——但这确实意味着CMN-700网格及其功能现在是V2前进的基线。
内存以及用于 I/O 的 PCIe 5/CXL 2 连接。因此,严格来说,V2 并没有在结构层面带来任何新东西——甚至 512MB 的 SLC 也可以通过 V1 + CMN-700 设置完成——但这确实意味着 CMN-700 网格及其功能现在是 V2 前进的基线。

Neoverse V2核心将成为下一代高性能Arm服务器CPU的基石。这里事实上的旗舰产品将是NVIDIA的Grace CPU,它将是2023年推出的首批(如果不是第一个)V2设计之一。NVIDIA此前曾宣布Grace将基于Neoverse设计,因此本周的公告Arm最终证实了长期以来的怀疑,即Grace将基于下一代Neoverse V核心。
在这里插入图片描述

NVIDIA则计划在几天内举办秋季GTC活动。因此,随着NVIDIA寻求在明年发布之前推广该芯片,我们很可能会听到更多有关Grace及其Neoverse V2基础的信息。

Neoverse E2:Cortex-A510与N2配合使用

除了Neoverse V2的发布之外,Arm还利用本周的简报发布了Neoverse E2平台。与V2的发布不同,这是一次规模小得多的公告,Arm仅提供了少量技术细节。最终,E2的辉煌日子将在晚些时候到来。

也就是说,E2平台正在交付给合作伙伴,着眼于与现有N2平台的互操作性。为此,Arm将Cortex-A510 CPU(Arm的小型/高效Cortex CPU内核)与CMN-700网格配对。此举旨在通过提供N2的替代CPU核心,为服务器运营商/供应商提供更大的灵活性,同时仍提供Arm网格的现代I/O和内存功能。强调这一点的是,E2系统背板甚至与N2背板兼容。

Neoverse Next: Poseidon, N-Next, and E-Next

最后,Arm本周发布的公告让我们可以一睹该公司所有三个Neoverse平台的未来路线图,不出所料,Arm正在开发每个平台的更新版本。
在这里插入图片描述

值得注意的是,所有三个平台都要求添加PCIe 6支持和CXL 3.0支持。这将来自Arm的CMN网状网络的下一个迭代,正如Arm今天所做的那样,该网络在所有三个平台之间共享。

与此同时,有趣的是看到Poseidon的名字再次出现在Arm的路线图中。回到Arm的第一个Neoverse路线图,Poseidon是Arm的500万/2021平台的名称,此后该位置被N2和V1/V2以各种形式占据。由于V2直到2023年才会登陆硬件,Poseidon/V3还需要数年时间,但Arm保留代号可能有一定意义(例如新的微架构)。

但首先推出的将是N-Next平台——可能是Neoverse N3。Neoverse N平台领先其他平台一代(N2于2020年首次发布),它将成为下一个需要更新的平台。N3将于2023年向合作伙伴推出,Arm广泛宣传新一代性能和效率改进。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1016147.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

UART 协议

文章目录 硬件拓扑基本原理起始位数据帧奇偶校验位停止位 参考 硬件拓扑 在 UART 通信中,两个 UART 直接相互通信。发送 UART 将控制设备(如 CPU)的并行数据转换为串行形式,以串行方式将其发送到接收 UART。只需要两条线即可在两…

elementUI elfrom表单验证无效、不起作用常见原因

今天遇到一个变态的问题&#xff0c;因页面比较复杂&#xff0c;出现几组条件判断&#xff0c;每个template内部又包含很多表单&#xff01;&#xff01; <template v-if"transformTypeValue 1"></template><template v-else-if"transformTypeV…

项目知识点总结-分页(三)

后端分页查询接口&#xff1a; Controller Service&#xff1a; Mapper&#xff1a; //分页搜索会议的方法List<SearchMeeting> getAllSearchMeeting(Param("sm") SearchMeeting searchMeeting,Param("page") Integer page,Param("pageSize&q…

黑马JVM总结(十)

&#xff08;1&#xff09;直接内存_基本使用 下面我们看一下使用了ByteBuffer直接内存&#xff0c;大文件的读写效率是非常的高 Java本身并不具备磁盘读写的能力&#xff0c;它需要调用操作系统的函数&#xff0c;需要从java的方法内部调用本地方法操作系统的方法&#xff0c…

Multitor:一款带有负载均衡功能的多Tor实例创建工具

关于Multitor Multitor是一款带有负载均衡功能的多Tor实例创建工具&#xff0c;Multitor的主要目的是以最快的速度完成大量Tor进程的初始化&#xff0c;并将大量实例应用到我们日常使用的程序中&#xff0c;例如Web浏览器和聊天工具等等。除此之外&#xff0c;在该工具的帮助下…

火山引擎 ByteHouse:ClickHouse 如何保证海量数据一致性

背景 ClickHouse是一个开源的OLAP引擎&#xff0c;不仅被全球开发者广泛使用&#xff0c;在字节各个应用场景中也可以看到它的身影。基于高性能、分布式特点&#xff0c;ClickHouse可以满足大规模数据的分析和查询需求&#xff0c;因此字节研发团队以开源ClickHouse为基础&…

国内AI语言大模型【文心一言】介绍

一、前言 文心一言是一个知识增强的大语言模型,基于飞桨深度学习平台和文心知识增强大模型,持续从海量数据和大规模知识中融合学习具备知识增强、检索增强和对话增强的技术特色。 最近收到百度旗下产品【文心一言】的产品,抱着试一试的心态体验了一下,整体感觉:还行! 二…

OpenMV与STM32之间的通信(附源码)

本篇文章旨在记录我电赛期间使用openmv和stm32单片机之间进行串口通信&#xff0c;将openmv识别到的坐标传输给单片机。背景是基于2023年全国大学生电子设计大赛E题&#xff1a;舵机云台追踪识别。 单片机的串口通信原理我便不再详细讲解&#xff0c;下面直接上代码分析。 值得…

SpringBoot分页其实很简单

分页其实很简单 一、数据库Limit Limit的使用 Limit子句可以被用于强制 SELECT 语句返回指定的记录数。 Limit接受一个或两个数字参数&#xff0c;参数必须是一个整数常量。如果给定两个参数&#xff0c;第一个参数指定第一个返回记录行的偏移量&#xff0c;第二个参数指定返…

Java————初始集合框架

一 、 集合框架 Java 集合框架Java Collection Framework &#xff0c;又被称为容器container &#xff0c; 是定义在 java.util 包下的一组接口interfaces 和其实现类classes 。 其主要表现为将多个元素element 置于一个单元中&#xff0c; 用于对这些元素进行快速、便捷的存…

题目 1056: 二级C语言-温度转换

输入一个华氏温度&#xff0c;要求输出摄氏温度。公式为 保留两位小数 样例输入 -40.00 样例输出 -40.00 这道题很简单&#xff0c;数据代入公式就行。记得设置double或者float的浮点型--》用于保留两位小数。 对于保留小数: 1是可以用iomanip的cout<<fixed<&l…

Mysql的逻辑架构、存储引擎

1. 逻辑架构剖析 1.1 服务器处理客户端请求 首先MySQL是典型的C/S架构&#xff0c;即Clinet/Server 架构&#xff0c;服务端程序使用的mysqld。 不论客户端进程和服务器进程是采用哪种方式进行通信&#xff0c;最后实现的效果是&#xff1a;客户端进程向服务器进程发送一段文…

MySQL数据库详解 一:安装MySQL数据库及基本管理

文章目录 1. 数据库的基本概念1.1 数据库的组成1.1.1 数据1.1.2 表1.1.3 数据库 1.2 当前主流数据库及其特点1.3 数据库类型1.3.1 关系数据库1.3.1.1 关系数据库的组成1.3.1.2 非关系数据库 2. 安装MySQL2.1 yum安装2.2 编译安装MySQL2.2.1 前置准备2.2.2 编译安装2.2.3 修改my…

《C和指针》笔记27:递归

递归所需要的两个特性&#xff1a; 存在限制条件&#xff0c;当符合这个条件时递归便不再继续&#xff1b;每次递归调用之后越来越接近这个限制条件。 这里没有用计算阶乘和菲波那契数列的例子说明递归&#xff0c;作者指出前者递归并没有提供任何优越之处。而后者效率之低是…

渗透测试的概况、依据、内容方法和流程有哪些?

一、项目概况 通过模拟黑客的思维和攻击手段&#xff0c;对计算机业务系统的弱点、技术缺陷和漏洞进行探查评估。经过客户授权后&#xff0c;在不影响业务系统正常运行的条件下&#xff0c;渗透人员在黑客可能的不同的位置&#xff0c;采取可控的方法、手段和工具&#xff0c;…

Java计算机毕业设计 基于SpringBoot+Vue的毕业生信息招聘平台的设计与实现 Java实战项目 附源码+文档+视频讲解

博主介绍&#xff1a;✌从事软件开发10年之余&#xff0c;专注于Java技术领域、Python人工智能及数据挖掘、小程序项目开发和Android项目开发等。CSDN、掘金、华为云、InfoQ、阿里云等平台优质作者✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精…

Input子系统 - Kernel驱动程序 - Android

Input子系统 - Kernel驱动程序 - Android 1、Input子系统相关定义1.1 代码位置1.2 input_dev结构体&#xff1a;表示输入设备1.3 input_handler结构体&#xff1a;struct input_handler - implements one of interfaces for input devices1.4 input_handle结构体&#xff1a;将…

图文文案音视频素材库流量主小程序开发

适用于全行业的资源素材运营变现小程序&#xff0c;支持文档、图片、文件、图文、音视频、网盘等多种资源形式&#xff0c;多种功能组合运营变现的小程序。 适用领域&#xff1a; 公司/微商素材、学习/考研/论文资料分享、PPT模板/背景图/壁纸/头像、知识付费、抖音素材等等…

传统 IAM 已成为企业增长桎梏,下一代身份基础设施如何帮助企业破局?

近期&#xff0c;国际权威研究机构 Gartner 发布了《Hype Cycle for Data, Analytics and AI in China, 2023》&#xff08;2023 中国数据、分析与 AI 技术成熟度曲线报告&#xff09;。报告指出&#xff0c;数据、分析技术和人工智能对中国的数字经济和国家战略至关重要&#…

经典匹配算法: KMP、Sunday与ShiftAnd

本次介绍的三种算法的时间复杂度&#xff1a; 基础概念&#xff1a; 图3 图1 单模匹配问题&#xff1a;单个模式串&#xff0c;比如我们要在一个长串&#xff08;母串S&#xff09;中查找一个短串&#xff08;模式串T&#xff09;是否出现过。 暴力匹配算法&#xff1a; 算法…