xianshan分支预测器BPU

news2025/1/18 10:10:03

xianshan分支预测器BPU

  • 1 RISC-V分支预测
    • 1.0 分支预测基本类型
      • 1.0.1 条件分支指令
      • 1.0.2 无条件分支指令
    • 1.1 方向预测
      • 1.1.1 饱和计数器法
        • 1.1.1.1 Questions
      • 1.1.2 分支历史法--程序局部性原理
        • 1.1.2.1 Questions
    • 1.2 目标地址预测
      • 1.2.1 分支目标缓存--BTB
    • 1.3 预测指令类型
      • 1.3.1 直接预测指令类型

只有预测出地址,才回去取指;因此最最开始的第一步就是PC值;
如上篇所说,分支预测器存在两方面的原因:一是程序的执行流中含有分支指令;二是CPU使用流水线设计;
在这里举个CPU执行程序的例子:

int x = 10;
int y = 20;
int result = 0;

if(x>y){
    result = x + y;
}else{
    result = x - y;
}

进行翻译成RISC-V的代码:

li  a0, 10               # x = 10
li  a1, 20               # y = 20
li  a2, 0                # result = 0

blt a0, a1, else_branch  # 如果 x < y,则跳转到 else_branch
add a2, a0, a1           # 否则执行 result = x + y
j end                    # 跳转到 end
else_branch:
sub a2, a0, a1           # result = x - y
end:

解读上述程序:在代码的前三行,指令顺序执行,但在程序的第 5 行,出现了一条特殊指令blt–分支指令,它会根据 x 和 y 的大小关系决定指令流顺序往下执行还是跳转到其他地方,该指令的出现导致程序的执行出现了分支。

1 RISC-V分支预测

RISC-V分支预测的基本类型:条件分支指令和无条件分支指令;

1.0 分支预测基本类型

1.0.1 条件分支指令

  • 条件分支指令:RISC-V中的条件分支指令(如beq、bne、blt、bge等)根据两个寄存器的值或一个寄存器与一个立即数的值进行比较,然后根据比较结果决定是否跳转。分支预测器需要根据历史信息和当前的条件来预测分支是否会被执行。
    对于条件分支指令,既需要预测方向(即分支是否会被执行),也需要预测目标地址(即如果分支被执行,程序将跳转到哪个地址)。在RISC-V架构中,条件分支指令如beq(Branch if Equal)、bne(Branch if Not Equal)、blt(Branch if Less Than)、bge(Branch if Greater Than or Equal)等都属于这一类。
    分支预测器需要根据历史信息和当前的指令流来预测条件分支指令的执行方向。如果预测分支会被执行,那么它还需要预测跳转的目标地址。这是因为即使分支条件满足,程序也可能跳转到不同的目标地址,具体取决于指令中的立即数或寄存器值。

1.0.2 无条件分支指令

  • 无条件分支指令:RISC-V中的无条件分支指令(如jal、jalr等)总是会执行跳转,目标地址由指令中的立即数或寄存器值指定。对于这类指令,分支预测器的任务相对简单,因为它们总是会执行跳转。
    无条件分支指令只需要预测目标地址。因为无条件分支指令总是会执行跳转,所以分支预测器的任务就是预测跳转的目标地址。在RISC-V架构中,无条件分支指令如jal(Jump and Link)和jalr(Jump and Link Register)就是这样的指令。
    对于jal指令,它会将下一条指令的地址加上一个立即数,然后跳转到这个计算出来的目标地址。分支预测器需要预测这个目标地址,以便提前获取指令。
    对于jalr指令,它会将一个寄存器的值加上一个立即数,然后跳转到这个计算出来的目标地址。分支预测器同样需要预测这个目标地址。
    从前篇也可以得到分支预测的两大任务:方向预测(taken or not taken) 和 目标地址预测;

对于条件分支指令,处理器会评估条件表达式,如果条件满足,PC值会更新为分支目标地址;如果条件不满足,PC值会增加,指向下一条顺序指令的地址。
对于无条件分支指令,处理器会直接将PC值更新为分支目标地址,而不考虑任何条件。

1.1 方向预测

常用的方向预测方法;

1.1.1 饱和计数器法

两bit饱和计数器法–一种简单且十分高效的预测方法;具体原理在上篇有展示,就不在这里赘述了;
为每一条分支指令都维护一个两位计数器是不现实的,实际中是通过采取PC部分位或哈希方法来索引两位计数器。
在这里插入图片描述
在这里PC值是对应的分支指令的程序计数器值----即当CPU执行到这个分支指令(即该分支指令对应的的PC值)。

1.1.1.1 Questions

Good Question: 那下次再次执行到这个分支指令时,这个分支指令对应的PC值是和上一次一样的,还是有变化了?
Answer: 当程序再次执行到同一个分支指令时,分支指令对应的程序计数器(PC)值通常是不同的。这是因为程序计数器(PC)在处理器中是一个不断递增的寄存器,它指向当前正在执行的指令的地址。每次执行一条指令后,PC 值都会增加,以便指向下一条指令的地址。
然而,分支指令的执行会改变 PC 值的递增方式。当处理器执行到一条分支指令时,它会根据分支指令的类型(如条件分支或无条件分支)和当前的条件状态(如寄存器的值或标志位)来决定是否跳转以及跳转到哪个地址。如果分支指令导致了跳转,PC 值会被更新为分支目标地址,而不是简单地增加。
因此,即使程序再次执行到同一个分支指令,PC 值也会根据分支指令的执行结果而变化。如果分支指令再次导致了跳转,PC 值将被更新为新的分支目标地址;如果分支指令没有跳转,PC 值将继续按照顺序执行的方式递增。

Good Question:那既然该分支指令即使下次再执行到时,它的PC值依然会增加变化,那如何通过取它的PC的部分位来进行索引呢?

Answer: 尽管PC值在每次执行指令后都会增加,但分支指令的地址相对于当前PC值的偏移量通常是固定的。因此,可以通过取PC值的一部分来构建索引,以便在BHT中查找对应的分支预测信息。
尽管PC值在每次执行指令后都会增加,但分支指令的地址相对于当前PC值的偏移量通常是固定的。因此,可以通过取PC值的一部分来构建索引,以便在BHT中查找对应的分支预测信息。

1.1.2 分支历史法–程序局部性原理

程序的局部性原理–即程序在一段时间内的执行行为往往具有一定的规律性。通过分析分支指令的历史执行情况,处理器可以对未来的分支行为做出较为准确的预测,从而提高指令流水线的效率。
分支历史有两种基本类型:局部分支历史和全局分支历史;

  • 局部分支历史:为每一条分支指令维护一组寄存器,记录该条指令的历史跳转情况
    例如: 0101000000101 (0代表不跳转,1代表跳转)
  • 全局分支历史:所有指令共用一组寄存器,记录程序执行过程中的分支跳转情况
    例如:
    在这里插入图片描述
    执行完三条不同的分支指令后,全局分支历史变为 001;
1.1.2.1 Questions

Good Quetion:那既然是全局历史寄存器来存储程序指令的执行情况,那为什么还需要一组而不是只需要单个呢?
Answer: 最起码有以下三点考量:

  • 历史深度:程序的执行过程中可能会有大量的分支指令,使用一组寄存器可以提供更长的历史深度,从而更好地预测未来的分支行为。如果只使用一个寄存器,那么它只能记录最近的一次分支情况,这对于复杂的程序来说可能是不够的。
  • 并行处理:现代处理器通常具有多个执行单元,可以同时执行多条指令。使用一组寄存器可以允许处理器同时处理多个分支指令的预测,提高并行处理的效率。
  • 预测准确性:分支预测的准确性通常与可用的历史信息的数量和质量有关。使用一组寄存器可以提供更多的历史信息,从而可能提高预测的准确性。

1.2 目标地址预测

1.2.1 分支目标缓存–BTB

BTB分支目标缓存–使用一个缓存来存储以往无条件跳转指令的跳转目标,之后如果再次执行到这一条无条件跳转指令,就可以查看BTB中是存在该指令的记录,将记录的跳转目标作为本次预测的跳转目标。
示意图如下:
在这里插入图片描述
如何理解这个图:待确定补充?

1.3 预测指令类型

背景问题:拿到一个PC,我们并不清楚这个PC所对应的指令是什么,即我们根本不知道当前指令到底是一条普通指令还是一条分支指令,也就无法进行预测了。

1.3.1 直接预测指令类型

一种方法是,直接预测指令的类型,拿到一个PC之后,可以直接预测出这条指令是否是分支指令,并对指令行为进行预测。这样一来,我们就没有必要等待取指完成,并且预测出来的结果还可以指导 CPU 到什么地方去取指。
类型预测的方法,可以与BTB相似,在缓存中的某个字段中加入指令的类型,以供下一次预测使用。

这样总结起来分支预测的一般步骤:
1.获取到PC;
2.预测是否是分支指令(即预测该指令类型):
a.如果是条件分支指令,预测其跳转方向和跳转目标
b.如果是无条件跳转指令 ,预测其跳转目标

[Ref]
https://open-verify.cc/xs-bpu/docs/basic/00_bp/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2198589.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【小白向】机器人入门之ROS系统的学习(Ubuntu24.04+ROS2)

目录 一.复杂的机器人系统 二.ROS机器人系统 1.简介 1.节点 2.话题 2.安装 3.测试 4.可视化 RQT&#xff1a; RVIZ&#xff1a; 显示属性&#xff1a; 显示状态&#xff1a; 一.复杂的机器人系统 依照我们现在的技术来看&#xff0c;机器人系统仍是极其复杂的&#xff0c;往…

深入了解音频剪辑在线工具的特色与优势

在数字时代&#xff0c;音频内容已成为连接人心的重要桥梁。如果你也有同样的兴趣爱好&#xff0c;那不妨看看我今天要介绍的音频剪辑在线相关的工具们吧。 1.福昕音频剪辑 链接直达>>https://www.foxitsoftware.cn/audio-clip/ 福昕音频剪辑工具&#xff0c;专为音乐…

【H2O2|全栈】关于CSS(11)flex——更加优雅的布局

目录 CSS3入门 前言 准备工作 布局优化 如何使用flex布局 容器与成员 概念 轴线 容器的属性 成员的属性 预告和回顾 后话 CSS3入门 前言 本系列博客主要介绍CSS有关知识点&#xff0c;当前章节讲述CSS3相关内容。 本章节讲述flex布局的相关知识。 部分内容仅代…

数据结构 ——— 单链表oj题:环形链表

目录 题目要求 手搓简易环状单链表 代码实现 问题1&#xff1a;slow 指针和 fast 指针一定会相遇吗 问题2&#xff1a;slow 每次走一步&#xff0c;fast 每次走 n 步是否还能判断链表带环&#xff1f;&#xff08;n > 2&#xff09; 题目要求 有一个单链表的头节点 …

【翻译】在 Python 应用程序中使用Qt Designer的UI文件

原文地址&#xff1a;Using a Designer UI File in Your Qt for Python Application 直接上图&#xff0c;上代码 将UI文件转为Python To demonstrate, we use the Qt Widgets animation easing example. 为了演示&#xff0c;我们使用 Qt Widgets 动画简化示例。 这个应用程…

快递查询软件:实现单号识别与批量物流查询的高效工具

随着网络购物的普及&#xff0c;快递物流行业迎来了前所未有的发展机遇&#xff0c;同时也面临着巨大的挑战。跟踪物流信息成为一个难题&#xff0c;因此&#xff0c;快递查询软件的核心功能之一便是单号识别。传统的快递单号输入方式繁琐且易出错在此背景下&#xff0c;快递查…

游戏盒子推广全攻略:从用户洞察到策略实施

在移动互联网时代&#xff0c;游戏盒子的推广已经成为众多游戏代理商和开发者的重要课题。面对激烈的市场竞争&#xff0c;如何高效吸引并留住玩家&#xff0c;成为游戏盒子推广的关键。本文将结合Xinstall这一专业App推广工具&#xff0c;探讨游戏盒子推广的有效策略。 一、市…

详细分析Java8中的StringJoiner | 对比StringBuilder(附Demo)

目录 前言1. 差异对比2. 基本知识3. 源码分析4. Demo 前言 对于Java的基本知识推荐阅读&#xff1a; java框架 零基础从入门到精通的学习路线 附开源项目面经等&#xff08;超全&#xff09;【Java项目】实战CRUD的功能整理&#xff08;持续更新&#xff09; 1. 差异对比 展…

多种方式确定Linux是CentOS还是Ubuntu

目录 前言正文 前言 对应的基本知识比较少&#xff0c;以下只是记录总结 由于目前使用的是centos&#xff0c;后续找到linux会对应补充 正文 要确定Linux系统是CentOS还是Ubuntu&#xff0c;可以通过以下几种方式进行分析 一、查看发行版信息文件&#xff1a; CentOS&…

UE5运行时动态加载场景角色动画任意搭配-角色及动画(一)

通过《MMD模型及动作一键完美导入UE5》系列文章,我们可以把外部场景、角色、动画资产导入UE5,接下来我们将实现运行时动态加载这些资产,并任意组合搭配。 1、骨骼动画复用 1、大部分模型骨骼是不通用的,比如这些裙子也是有骨骼的,属于模型特有的,但是对于动画来说,很多…

【实时计算 Flink】SQL作业大状态导致反压的调优原理与方法

状态管理不仅影响应用的性能&#xff0c;还关系到系统的稳定性和资源的有效利用。如果状态管理不当&#xff0c;可能会导致性能下降、资源耗尽&#xff0c;甚至系统崩溃。本文为您介绍SQL作业大状态导致反压的调优原理与方法。 运行原理&#xff1a;状态算子的产生 作为一种特…

面试题:Redis(二)

1. 面试题 2. MoreKey案列 事故案例 2.1 生成上如何限制key*/flushdb/flushall等危险命令的使用&#xff1f; 通过redis.conf配置文件中在SECURITY选项中禁用这些命令 2.2 不用key*避免卡顿那用什么&#xff1f; 用scan命令&#xff0c;类似mysql中的limit命令 语法&…

数学建模算法与应用 第2章 整数规划及其求解方法

目录 2.1 概述 2.2 0-1整数规划模型 2.3 分枝定界法&#xff08;Branch and Bound&#xff09; 2.4 蒙特卡洛法&#xff08;随机取样法&#xff09; Matlab代码示例&#xff1a;蒙特卡洛法求解简单整数规划 2.5 整数规划的计算机求解工具 习题 2 总结 整数规划是线性规…

Window11 安装Java21教程

随着Java版本的迭代&#xff0c;最新的长期支持版本已经更新到Java21了&#xff0c;虽然笔者许多代码还是当年用Java8写的&#xff0c;但抱残守缺从来不适合IT人员&#xff0c;该来的我们始终要欣然面对。 其实随着各项技术的发展&#xff0c;Java许多组件现在其实都不需要或者…

Authentication Lab | Client Side Auth

关注这个靶场的其它相关笔记&#xff1a;Authentication Lab —— 靶场笔记合集-CSDN博客 0x01&#xff1a;Client Side Auth 前情提要 有些时候&#xff0c;开发人员会将身份验证的逻辑写于前端&#xff0c;这样写是十分不安全的&#xff0c;因为前端的代码几乎全部都是可见的…

借助微软 Teams 中的 Tableau,加速数据驱动型决策与协作流程

Tableau 应用已正式上线 Teams 商店&#xff01;如此&#xff0c;企业就能以一种更可靠和安全的方式在 Teams 中共享数据见解。 让团队能快速协作做出数据驱动型决策不再是可选项&#xff0c;而是业务成功的必备条件。 在几个月前的TC24 大会上&#xff0c;Tableau 再次表明了…

关于Amazon Linux 2023的版本及包管理器

在亚马逊上创建EC2实例时&#xff0c;会看到有一个Amazon Linux镜像。 那这个镜像与其他Linux有什么关系和区别呢&#xff1f; 网站是介绍&#xff1a;Amazon Linux 2023 是基于 Linux 的现代化通用操作系统&#xff0c;提供 5 年的长期支持。它针对 AWS 进行了优化&#xff0…

Stable Diffusion最新版nowebui的api使用详解

最近在使用stable diffusion最新版的Stable Diffusion WebUI Forge进行api调用,下面来一步一步的进行展开吧!!! 1、下载lllyasviel/stable-diffusion-webui-forge GitHub - lllyasviel/stable-diffusion-webui-forgeContribute to lllyasviel/stable-diffusion-webui-for…

gaussdb hccdp认证思考题01 GaussDB数据库介绍

01_GaussDB数据库介绍 1. &#xff08;判断题&#xff09;gsql是一款运行在Windows操作系统上的图形界面SQL客户端工具&#xff0c;用于连接GaussDB集群中的数据库以及管理数据库对象。 --错。

120页满分PPT | 企业级业务架构和IT架构规划方案

方案内容综述 方案涵盖了从战略分析到具体实施路径的内容。提出了IT架构规划的工作思路&#xff0c;包括项目启动、部门访谈、资料收集、内部数据库搜索与先进实践研究等步骤&#xff0c;旨在通过这些步骤完成现状及差距分析&#xff0c;并基于此设计未来的应用架构、数据架构…