ARM学习笔记_1 模式,寄存器,流水线

news2025/1/16 9:09:40

ARM

arm体积小功耗低性能高,支持thumb ARM双指令集,兼容8/16位器件;大量使用寄存器,指令定长,寻址简单。

ARM是32位架构,Word 32bit, half Word 16bit.

模式

image-20230518185159807

用户模式是用户程序的模式,没权限操作其他硬件和数据,只能通过软中断或异常切换。

系统模式和用户模式共用一套资源,且权限更高。

中断模式可以自由访问硬件资源。不然CPU直接可以访问所有硬件资源效率太低。

快速中断紧急一些,处理快速问题。

管理模式svc:软中断swi处理或者板子上电/rst时的模式,主要用于系统初始化。

中止模式:访问非法地址时的异常,如segment fault。预取指令中止或数据中止异常进入中止模式(预取指令中止是指令没问题,但是指令指的地址找不到)。

未定义模式:软件仿真,或无法识别指令时进入。

Monitor:安全监测。

这些模式的切换可以通过软件或者EXTI Exception改变。

异常有精确和非精确,无法嵌套只能一个个处理。

image-20230518193233074

寄存器

除了sys和usr是共用一组寄存器,其他模式之间都是有一部分通用寄存器(33个,对于Cortex-A来说),一部分当前模式独有的状态寄存器(7个)。

  • R0-R7:未分组寄存器。这些寄存器所有模式下都指向同一批寄存器,因此模式切换的时候可能出问题。
  • R8-R14:分组寄存器,分低位高位,一些指令可以分组执行提高效率。高位比如R13的SP和R14的LR。(R8-R12快中断和其他模式不一样,物理上有两组R8-R12的寄存器;而R13 14有7个物理寄存器,sys和usr模式下是一样的,其他模式下各自有一个R13 R14)
  • R15 PC:程序计数器。

r13 堆栈寄存器,由高位向低位存储。

刚刚了解到r13是7种模式下各有一个的,因此用途在于当模式切换的时候,堆栈指针可以保存各自模式下需要保存的寄存器,便于恢复。

r14 链接寄存器,用于保存程序运行位置(即各个模式下PC的值),多模式切换时返回有用。

pc的最低位一般没用,arm是[31:2]位保存pc,[1:0]位=0;thumb是[31:1]保存pc。因此寻址0x40008001和寻址0x40008000没区别。

pc=当前程序执行位置+8,因为取指是预取 提前多取一点装载一下,然后解码执行。

cpsr 当前程序状态寄存器,cpsr是所有模式共用的。

  • m位:[4:0],指代处理器模式位,如10000是usr mode。
  • t位,j位:[5] [24],指代寄存器是arm/thumb等状态。
  • i位:[7],是否启用中断,1禁止IRQ。
  • nzcv:[31:28] 条件位,比如根据这些位的值决定跳转到什么模式。image-20230519184826540

spsr 每种模式下自己专用的物理状态寄存器,用于异常发生时备份cpsr。sys usr没有spsr因为他俩不是异常模式。

协处理器

arm允许协处理器扩展指令集。比如控制cache,存储管理单元mmu,异常向量表地址设置等。了解即可,用到的时候再深入学习。

流水线

取指,移码,执行。这些都是串行的话,或者都给cpu做,效率极低。就像手术台上的大夫要完成重要的手术操作,护士辅助可以递工具准备药剂,而不是拿工具也要大夫自己亲自去拿。

一个程序需要三个步骤都来一遍,3个周期。但是我们可以依次开始更多的指令,比如一个周期入一个程序,一个周琦出一个指令,效率将大幅度提高。

最佳流水线:反应周期2

image-20230518213624742

但是实际上并非这么理想的每一个都是一个指令周期,因为有许多总线要传输数据,外存拷过来的数据更慢。

LDR流水线:

image-20230518215707697

执行ldr装载等指令时,需要先通过指令和数据总线把数据存入指定寄存器中,再写回原寄存器。在此期间其他并行的指令无法解码无法执行,因此只能延时stall。

分支流水线:反应周期2

image-20230518220811917

如图,BL指令要跳转到AND指令。

第2周期,Linkret做了两件事,第一是预取目的地址指令,预取AND指令。第二是保存当前函数返回位置,即把SUB的地址存入r14链接寄存器中,因此占用总线无法解码执行。

第3周期跳转,解码and的指令,预取下一条指令,且修改r14值,因为前面介绍过r14最后两位没用,清零以便简单返回。

中断流水线:反应周期7

image-20230518221647269

周期1:收到中断,不急,先把add指令执行完了。

周期2:保存cpsr到spsr,修改cpsr的当前模式改为中断模式,禁止中断进一步输入。

周期3:保存中断函数返回地址lr=当前pc=0x800c加了2条指令后的地址,预取指令。

周期4:跳转过去解码,且调整r14 lr=0x8008.

周期5:根据lr跳转回原函数对应位置。

周期6:根据lr修改回pc.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/551029.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解决MySQL无法输入中文字符的问题

文章目录 问题描述问题排查解决方案1️⃣创建数据库时设置字符集为utf82️⃣修改数据库配置文件【比较麻烦】 写在最后 前几日在使用MySQL数据库的时候,出现了一处保存,故作此记录✍ 问题描述 下面是我这样exam表的结构 mysql> desc exam; --------…

PETR 论文学习

1. 解决了什么问题? DETR3D 为端到端的 3D 目标检测提供了一个思路。但是,DETR3D 中的 2D 到 3D 的变换会带来一些问题。 Reference point 的预测坐标可能不够准确,采样特征可能位于目标区域之外;只有映射点周围的特征会被选取&…

“超越极限 - 如何使用 Netty 高效处理大型数据?“ - 掌握 Netty 技巧,轻松应对海量数据处理!

1 写大型数据 因为网络饱和的可能性,如何在异步框架中高效地写大块的数据是特殊问题。由于写操作是非阻塞的,所以即使没有写出所有的数据,写操作也会在完成时返回并通知 ChannelFuture。当这种情况发生时,如果仍然不停地写入&…

2023年最受欢迎的低代码平台排行榜

随着企业寻找在降低成本的同时加快软件开发的方法,低代码开发平台正变得越来越受欢迎。这些平台允许开发人员使用拖放界面和预置组件,以最少的代码创建复杂的应用程序。它不仅帮助企业加快了数字化转型的脚步,而且打破业务部门和IT部门之间的…

多元分类预测 | Matlab萤火虫算法(FA)优化BP神经网络分类预测,FA-BP分类预测,多特征输入模型

文章目录 效果一览文章概述部分源码参考资料效果一览 文章概述 多元分类预测 | Matlab萤火虫算法(FA)优化BP神经网络分类预测,FA-BP分类预测,多特征输入模型,多特征输入模型,多特征输入模型,多特征输入模型,多特征输入模型,多特征输入模型 多特征输入单输出的二分类及多…

商品领域十二张基础表设计思路与实现

欢迎大家关注公众号「JAVA前线」查看更多精彩分享文章,主要包括源码分析、实际应用、架构思维、职场分享、产品思考等等,同时欢迎大家加我微信「java_front」一起交流学习 1 文章概述 商品在电商领域中是一个非常重要的领域,交易行为前提是有…

Selenium + Java 的环境搭建

Selenium Java 的环境搭建 🔎Chrome 浏览器下载 Chrome 浏览器检查对应版本下载 Chrome 浏览器驱动 🔎配置环境变量🔎验证环境是否搭建成功🔎关于 pom.xml 出现错误的解决方案 🔎Chrome 浏览器 下载 Chrome 浏览器 下…

使用命令启动默认程序(例如启动系统默认浏览器打开指定网址)

文章目录 目的基础说明代码示例(Golang)总结 目的 通过命令调用系统默认应用程序打开对应格式的文件是比较常用的功能。这篇文章将介绍下相关内容。 基础说明 Windows windows下可以使用 start 指令来启动默认程序打开对应格式文件; 比如 …

iptables中SNAT、DNAT及iptables服务启动时会自动还原规则

目录 SNAT原理与应用​编辑 SNAT转换前提条件 临时打开: 永久打开: 示例​编辑 DNAT原理与应用​编辑 DNAT转换前提条件 示例​编辑 防火墙规则的备份和还原 导出(备份)所有表的规则 清空规则​编辑 导入(还…

【VMware】Ubunt 20.04时间设置

文章目录 设置本地时间 UTC8设置24小时制同步网络时间参考 Talk is cheap, show me the code. 设置本地时间 UTC8 查看当前时区状态 rootnode1:~/k8s# timedatectlLocal time: Sun 2023-05-21 15:24:02 CSTUniversal time: Sun 2023-05-21 07:24:02 UTCRTC time: Sun 2023-05-2…

计算机网络知识汇总(十万字超详细)

文章目录 1 计算机网络概述1.1 概念、组成、功能和分类1.2 标准化工作及相关组织1.3 速率相关的性能指标1.4 时延、时延带宽积、往返时间RTT、利用率1.5 分层结构、接口、协议、服务1.6 OSI参考模型1.7 TCP/IP与五层参考模型1.8 第一章知识大纲 2.物理层2.1 物理层基本概念2.2 …

GaussDB(for MySQL)云原生数据库技术演进和挑战

摘要:GaussDB(for MySQL)是华为自研云原生数据库,具有高性能,高扩展,高可靠的特点,完全兼容MySQL协议,自研架构和友好的生态兼容性,可以同时满足数据库管理员、应用开发者、CTO的运维、使用和业…

QT5.14.2下载安装与环境配置

1.QT5.14.2的下载 QT5.14.2的官方下载地址为 https://download.qt.io/archive/qt/5.14/5.14.2/ ![在这里插入图片描述](https://img-blog.csdnimg.cn/9ef2a92414cb48a482d3cde4dd19a9ac.png 由于exe文件名称只有x86,只能选择这个下载,但是在安装时可以选…

ChatGPT也能助力建筑设计,这么智能?

ChatGPT也称为 Generative Pre-trained Transformer,是一种强大的语言生成工具,具有生成类人文本的能力。这项技术有可能通过为建筑师提供与客户、承包商和其他利益相关者沟通和协作的新方式来彻底改变建筑行业。在这篇文章中,我们将探讨架构…

css学习-内容加载占位动画(渐变动画)

文章目录 学习链接纯CSS渐变动画结合vue指令简单使用 学习链接 Git Hub前端50天50个项目 | 第24 内容文本 纯CSS渐变动画 <style lang"scss" scoped> .card-wrapper {width: 100%;height: 100%;display: flex;align-items: center;justify-content: center; …

tinymce富文本编辑器使用到二开

tinymce tinymce 一款现代化的富文本编辑器&#xff0c;有专门团队维护&#xff0c;是目前主流的富文本编辑器选择。 安装注意事项&#xff1a; 有两种方案分别是安装对应的vue/react组件&#xff0c;然后直接用组件&#xff0c;或者直接使用tinymce去按原生操作会报找不到文…

HTML- 标签学习之- 列表、表格

无序列表/有序列表&#xff1a; 标签组成( 无序ul 有序 ol ) -> li 父子级标签&#xff0c; ul只能包含li标签&#xff0c; li标签可以包含任意内容。 自定义列表 dl :自定义列表的整体&#xff0c;用于包裹dt/dd 标签dt:自定义列表主题dd:自定义列表的针对主题的…

【VMware】VM安装虚拟机

文章目录 VMware教程创建新的虚拟机自定义安装选择稍后安装操作系统这里选择Linux操作系统&#xff0c;版本为Centos7 64位选择名称和安装位置选择处理器、内核数量&#xff08;可根据电脑硬件以及需求进行调整&#xff09;选择2G内存&#xff08;可根据电脑硬件以及需求进行调…

计算机视觉 day94 DDH - YOLOv5:基于双IoU感知解耦头改进的YOLOv5,用于对象检测

DDH - YOLOv5:基于双IoU感知解耦头改进的YOLOv5&#xff0c;用于对象检测 I. IntroductionII. Related workPrediction head 预测头 III. Methodology3.1 Decoupled Head3.2 Double IoU‑aware3.3 Training3.4 Inference IV. Experiments4.1 与YOLOv5等检测头对PASCAL VOC2007测…

Netty实战(五)

ByteBuf—Netty的数据容器 一、什么是ByteBuf二、 ByteBuf 的 API三、ByteBuf 类——Netty 的数据容器3.1 ByteBuf如何工作&#xff1f;3.2 ByteBuf 的使用模式3.2.1 堆缓冲区3.2.2 直接缓冲区3.2.3 复合缓冲区 四、字节级操作4.1 随机访问索引4.2 顺序访问索引4.3 可丢弃字节4…