【ARM Cache 系列文章 10 -- ARM Cortex-A720 Hunter 介绍】

news2024/11/20 3:18:49

文章目录

    • 概述
    • 1.1 A720 Features
      • 1.1.1 core features
      • 1.1.2 Cache features
      • 1.1.3 Debug features
    • 1.2 A720 组件介绍
      • 1.2.1 L1 缓存系统
      • 1.2.2 指令解码
      • 1.2.3 寄存器重命名
      • 1.2.4 指令分发单元
      • 1.2.5 向量执行单元
      • 1.2.6 加解密扩展单元
        • 1.2.6.1 有限域算法
    • 1.3 接口
    • 1.4 GIC CPU Interface
    • 1.5 System Control
    • 1.6 Debug
    • 1.7 Performance Monitors Extension

概述

Cortex-A720 是基于 DSU-120 实现的,下图显示了A720的实现配置图:
在这里插入图片描述

1.1 A720 Features

1.1.1 core features

  • 基于 ArmV9.2-A A64 指令集实现;
  • 包含MMU;
  • 40位的物理地址宽度,48位的虚拟地址宽度;
  • GIC(Generic Interrupt Controller);
  • 通用时钟接口,支持64位的counter计数器;
  • 支持 RSA Extension(Reliability, Availability, and Serviceability);
  • 支持 Scalable Vector Extension (SVE) ;
  • 支持 SIM 和 浮点运算;
  • 支持 AMU(Activity Monitoring Unit);
  • 支持加解密引擎。

1.1.2 Cache features

  • L1 的 指令cache和数据cache分开,L1 指令cache size 可选:32KB or 64KB,数据cache可选:32KB or 64KB;
  • L2 Cache; L2 Cache 的配置大小可选:128KB, 256KB, or 512KB;
  • 支持 MAPM(Memory System Resource Partitioning and Monitoring)。

1.1.3 Debug features

  • 支持 Armv9,2 的 debug 逻辑;
  • 支持 PMU,PMU支持的event conuter 个数可配置范围:6 或者20个;
  • 支持 ETE(Embedded Trace Extension );
  • 支持 TRBE(TRace Buffer Extension);
  • 可选项 SPE (Statistical Profiling Extension )功能;
  • 可选项 ELA-600功能。

1.2 A720 组件介绍

下图是 A720 内部组件图:
在这里插入图片描述
主要包含以下内容:

  • L1 instruction and L1 data memory systems
  • L2 memory system
  • Register rename,寄存器重命名
  • Instruction decode,指令解码
  • Instruction issue,指令分发
  • Execution pipeline,执行流水线,主要是做一些向量运算,
  • Memory Management Unit (MMU)
  • Trace unit and trace buffer
  • Performance Monitoring Unit (PMU)
  • Activity Monitoring Unit (AMU): 它的主要功能是提供一种机制来测量处理器的运行活动。
    AMU 通过收集和存储关于处理器执行的指令和内存访问的详细信息,使得开发者可以更好地理解和优化软件在硬件上的性能。这些信息可能包括执行的指令数、缓存命中和未命中的数目、分支预测的准确性等等。

    在某些场景下,AMU 的信息还可以用来进行能耗分析和优化。比如,通过比较不同的软件版本或者算法实现在处理器上运行的效率,开发者可以找到并解决可能的性能瓶颈,进一步减少能耗。
  • Generic Interrupt Controller (GIC) CPU interface
  • Branch prediction,分支预测

A720 通过 CPU Bridge 与 DSU-120 连接, DSU-120再与与外部存储及SOC上其它项连接

1.2.1 L1 缓存系统

主要是从指令cache中拿去指令然后发送到指令解码单元。

L1 缓存系统主要包括:

  • 4路组相连,大小可配置为32K或者64K, cacheline 64bytes
  • L1 指令 TLB,大小可以配置为 16K, 64K, 2M
  • 动态分支预测

1.2.2 指令解码

解码单元将AArch64 架构的指令解码成CPU内部格式,然后发送到执行单元。

1.2.3 寄存器重命名

该功能主要是通过寄存器重命令来加速乱序执行和分发解码后的指令到对应的发射通道。

1.2.4 指令分发单元

控制何时将解码后的指令发送到执行管道,它包含分发队里用于暂存解码后的指令。

1.2.5 向量执行单元

主要用于执行 SVE 和 SEV2 指令,也可以执行加解密指令。

SVE,全名Scalable Vector Extension,是ARM在ARMv8-A架构中引入的一种向量扩展。SVE提供了一种新的处理向量数据的方法,使得在处理大规模并行任务时能够更加高效。SVE的一大特点是其向量寄存器的长度是可伸缩的,可以最大达到2048位。

SVE2是在SVE基础上的进一步扩展,加入了对复杂整数和浮点数运算的支持,以及对通信和密码学应用的支持。SVE2是ARMv9架构中的一个重要特性。

1.2.6 加解密扩展单元

  • 支持 AES 加解密;
  • 支持 SHA-1,SHA-2,SHA-3 哈希算法;
  • 支持 SM3 hash 功能和 SM4 hash 功能;在讨论这个问题之前,需要先明确一点,SM3和SM4是密码算法,而不是哈希算法。SM3是一种消息摘要算法,SM4是一种分组密码算法,它们都是由中国的国家密码管理局发布的。在硬件级别上,ARMv9能够更快更安全地执行这两种算法。这对于一些需要执行大量这类加密运算的场景(如网络安全、数据保护等)非常有利。

    SM3是一种消息摘要算法,常用于数字签名、消息认证码等密码学应用中,它的输出是一个固定长度(512位)的“摘要”,任何微小的输入变化都会导致输出摘要的巨大变化,使得攻击者无法通过摘要反推出原始输入信息。

    SM4是一种分组密码算法,用于数据的加密和解密。SM4使用的密钥长度为128位,分组长度为128位,采用了分组密码中常见的Feistel结构,是对称密码算法,即加密和解密使用的是同一个密钥。
  • 支持有限域算法,用于支持Galois/Counter Mode 和 Elliptic Curve加解密, Galois/Counter Mode (GCM) 是一种块密码模式,它可以提供数据的加密和认证,常常用于保护网络数据。GCM 结合了 Galois 模式的消息认证码(GMAC)和计数器模式(CTR)的加密方式,可以同时进行加密和认证操作。
1.2.6.1 有限域算法

有限域算法,又称有限字段算法,是指在有限域(Finite Field)或者称伽罗华域(Galois Field)上进行的运算规则和算法。

有限域是由有限个元素组成的代数结构,满足加法、乘法、减法和除法四则运算的封闭性、结合律、交换律、分配律,并且乘法和加法操作都有单位元素和逆元素。

在有限域上的算法主要包括有限域上的加法、乘法、求逆等基本运算,以及更高级的多项式运算、矩阵运算、求解线性方程组等。

有限域算法在密码学、编码理论、线性代数、数字信号处理等领域都有广泛应用。例如,在密码学中,AES(高级加密标准)就是在有限域上进行运算的。在编码理论中,Reed-Solomon编码也是建立在有限域上的。

1.3 接口

在这里插入图片描述

1.4 GIC CPU Interface

TODO

1.5 System Control

TODO

1.6 Debug

TODO

1.7 Performance Monitors Extension

TODO

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1105456.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

TTS | 语音合成模型实验结果经验总结

本文主要是语音合成模型实验结果经验总结!! 首先列出实验过的所有模型 Fastspeech&Fastspeech2Tacotron&Tacotron2Transformer-TTSBark(E2E)VITS/VITS2(E2E)NaturalSpeech2MB-iSTFT-VITS/ MB-iSTFT-VITS2(E2E) 1.语音合成主主要架构如下 2.模…

C++对象模型(15)-- 构造函数语义学:移动构造函数和移动赋值运算符

1、什么是移动构造函数 我们知道拷贝构造函数分为浅拷贝和深拷贝。 (1)浅拷贝:当类含有指针变量时,浅拷贝会发生错误。 (2)深拷贝:每次都要全部赋值一份,内存消耗比较大。 移动构…

红队专题-从零开始VC++C/S远程控制软件RAT-MFC-[5]客户端与服务端连接

红队专题 招募六边形战士队员端操作系统SystemInfo类获取系统信息发送系统信息头文件声明头文件调用 未找到来自 OleAcc.dll 的导入LINK 招募六边形战士队员 一起学习 代码审计、安全开发、web攻防、逆向等。。。 私信联系 端 发送连接->进入主线程->返回socket->…

【iOS】JSONModel的基本使用

文章目录 前言一、导入JSONModel二、JSONModel的基本使用1.基本用法2.模型集合3.模型导出为NSDictionary或JSON4.设置所有属性可选(所有属性值可以为空)5.下划线(蛇式)转驼峰命名法 前言 JSONModel 是一个用于 Objective-C 的开源库,它用于简…

使用 Python 进行卡方测试

使用 Python 进行卡方测试 Python 中卡方特征测试的简单解释 奥坎耶尼根 跟随 发表于 迈向开发 4 分钟阅读 2月 2022&#xff0c; <> 18 1 土耳其超级联赛的三大足球俱乐部 一、说明 卡方检验用于检验为分类变量创建的模型。也就是说&#xff0c;这是我们在统计学中经…

Java】实现图片验证码2.0【详细代码】

实际开发过程中经常遇到要实现图片验证码来防止外部使用脚本刷接口&#xff0c;所以说图片验证码是很有必要的一个小功能。 下面这个之前发布的&#xff0c;现在发现生成的图片验证码是可以被自动化工具进行识别的&#xff0c;具有一定的安全性问题。 1.0版本验证码&#xff…

汽车零部件企业信邦控股之项目管理实践案例

信邦控股有限公司&#xff08;信邦控股&#xff09;为香港交易所主版上市公司&#xff0c;是惠州建邦精密塑胶有限公司的控股公司。信邦控股集团是国际化一站式表面处理专家&#xff0c;主要产品包括汽车内饰件、外饰件和双层挠性覆铜板&#xff0c;总部设于中国惠州。 信邦控股…

2023年中国熔盐储能装机量、新增装机量及行业投资规模分析[图]

熔盐储能是一种可以传递能量、长时间&#xff08;6-8h&#xff09;、大容量储能的技术路径&#xff0c;作为传热介质可以实现太阳能到热能的转换&#xff0c;作为储能介质可以实现将热能和电能的双向转换&#xff0c;可以很好的适应和解决以上两大矛盾。因此&#xff0c;熔盐储…

【面试题笔记】C++继承和多态常见高频经典面试题

1.继承相关习题 1.1 什么是菱形继承&#xff1f;菱形继承的问题是什么&#xff1f; 菱形继承&#xff1a;菱形继承是多继承的一种特殊情况。两个中间类继承父类&#xff0c;而派生类继承了两个中间类&#xff0c;从而在继承关系上呈现出一种菱形。如下图所示&#xff1a; **…

jinkens编译不通过排查

gerrit上看编译不通过 打开 点开fulllog 然后 搜索 failed 关键字 或者error 都没有就看具体信息 就能找到原因了 此外碰到一个难以解决的问题 就是master分支本地编译没问题 push以后一直报错引用不到某个变量 最后发现是打开fulllog 发现其实报错的是其他的工程&…

openvino系列教程之人脸检测 mobilenetv2

OpenVINO&#xff08;开放式视觉推理和神经网络优化&#xff09;是英特尔推出的一款用于加速计算机视觉应用开发的软件。它基于英特尔的深度学习技术&#xff0c;提供了一套完整的工具链&#xff0c;包括模型优化器、运行时库等&#xff0c;帮助开发者快速实现高性能的计算机视…

火爆,接口测试+接口自动化测试整理总结,你不知道的都在这了...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 1、接口自动化测试…

软件外包开发文档

编写软件开发文档是项目开发过程中的关键步骤&#xff0c;它有助于组织、记录和分享项目的信息和进展。以下是编写软件开发文档的一般步骤和建议&#xff0c;希望对大家有所帮助。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&#xff0c;欢迎交流合作。 1.文档…

vue2 集成 Onlyoffice

缘起于进行了一次在线 Office 解决方案的调研&#xff0c;对比了 Office365、可道云、WPS Office、PageOffice 等厂商&#xff0c;最终敲定了使用 Onlyoffice&#xff0c;故整理了一份 Onlyoffice 从零开始系列教程&#xff0c;这是第一篇。 一、Onlyoffice 是什么&#xff1f…

虹科 | 解决方案 | 机械免拆压力测试方案

对于发动机的气门卡滞或气门开闭时刻错误、活塞环磨损、喷油嘴泄漏/堵塞等故障&#xff0c;往往需要解体发动机或拆卸部件才能发现&#xff1b;而对于某些轻微的故障&#xff0c;即使解体了发动机后也经常难于肉眼判别 虹科Pico提供的WPS500压力测试方案&#xff0c;可以动态测…

架构师日记-聊聊开发必掌握的那些实践技能 | 京东云技术团队

一 引言 尽管软件开发一直致力于追求高效、可读性强、易于维护的特性&#xff0c;但这些特性却像是一个不可能三角&#xff0c;相互交织&#xff0c;此消彼长。就像底层语言&#xff08;如汇编和C语言&#xff09;能够保持高效的运行性能&#xff0c;但在可读性和维护性方面却…

会议OA小程序【首页布局】

目录 一. Flex布局介绍 1.1 什么是Flex布局 1.2 基本概念 1.3 Flex属性 二. 会议OA首页轮播图的实现 配置 Mock工具 swiper 效果展示 三. 会议OA首页会议信息布局 index.js index.wxml index.wxss 首页整体效果展示 一. Flex布局介绍 布局的传统解决方案&#x…

LeetCode之买卖股票的最佳时机系列共6道题

文章目录 0 引言1 121. 买卖股票的最佳时机1. 1 暴力法1.2 一次遍历1.3 动态规划 2 122. 买卖股票的最佳时机 II2.1 一次遍历2.2 动态规划 3 123. 买卖股票的最佳时机 III3.1 动态规划 4 188. 买卖股票的最佳时机 IV4.1 动态规划 5 309. 买卖股票的最佳时机含冷冻期5.1 动态规划…

每日温度00

题目链接 每日温度 题目描述 注意点 answer[i] 是指对于第 i 天&#xff0c;下一个更高温度出现在几天后如果气温在这之后都不会升高&#xff0c;请在该位置用 0 来代替1 < temperatures.length < 100000 解答思路 使用单调栈解决本题&#xff0c;思路为&#xff1a…

IEEE754 FP16

一. 实数的表达方法 1.定点数表示法 <整数部分>.<小数部分> 例. 666.66 2.浮点数表示法 科学计数法&#xff1a;有效数字基数&#xff08;base&#xff09;指数&#xff08;exponent&#xff09;正负符号位 规范化表示&#xff1a;d.ddd*β^e&#xff08;0&…