《深入浅出计算机组成原理》学习笔记 Day16

news2024/12/30 0:46:25

冒险和预测(一)

    • 1. 超长流水线的缺点
    • 2. 冒险和分支预测
    • 参考

1. 超长流水线的缺点

增加流水线的深度,在同主频下,其实就是降低了 CPU 的性能。

一个 Pipeline Stage,就需要一个时钟周期。如果我们把任务分成 31 个阶段,就需要 31 个时钟周期才能完场一个任务;而把任务拆分成 11 个阶段,就需要 11 个时钟周期就能完成任务。在这种情况下,31 个 Stage 的 3GHz 主频的 CPU,其实和 11 个Stage 的 1 GHz 主频的 CPU 性能差不多。事实上,每个 Stage 都需要有对应的 Pipeline 寄存器的开销,此时,更深的流水线性能可能还会更差些。

流水线技术并不能缩短单条指令的响应时间这个性能指标,但是可以增加在运行很多指令时候的吞吐率

在这里插入图片描述
提升流水线深度,必须要和提升 CPU 主频同时进行。

因为在单个 Pipeline Stage 能够执行的功能变简单了,也就意味着单个时钟周期内能够完成的事情变少了。所以,只有提升时钟周期,CPU 在指令的响应时间这个指标上才能保持和原来相同的性能。同时,由于流水线深度的增加,我们需要的电路数量变多了,也就是所使用的晶体管也就变多了。

主频的提升和晶体管数量的增加都使得我们 CPU 的功耗变大了

2. 冒险和分支预测

流水线技术带来的性能提升,是一个理想情况。在实际的程序执行中,不一定能做得到

要想完全利用流水线,意味着:如果我们有 20 级流水线,意味着我们要确保这 20 条指令没有依赖关系。

这个依赖问题就是冒险(Hazard)问题。有数据冒险、结构冒险、控制冒险等其他的依赖问题。

为了解决这些依赖问题,我们有乱序执行、分支预测等相应的解决方案。

参考

极客时间《深入浅出计算机组成原理》:http://gk.link/a/11UMi

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/189896.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2014年408专业算法题

文章目录0 结果1 题目2 思路附录0 结果 1 题目 2 思路 二叉树的带权路径长度(WPL)的计算方法有两种: 1,定义:WPL所有叶结点的权值Wi∗该结点深度Di求和WPL所有叶结点的权值W_i*该结点深度D_i求和WPL所有叶结点的权值…

如何管理IC研发过程产生的bug

一款芯片的研发过程中总是伴随着bug、bug和bug,研发线上各端的IC工程师也是全程在debug、debug和debug,直到最终的GDSII文件交给Founry工厂加工,全程都是为了保证芯片最终能够安全保质的tape-out成功。由此可见,bug的跟踪管理是至…

【数据结构】题解:二叉树的非递归遍历

【数据结构】题解:二叉树的非递归实现 文章目录【数据结构】题解:二叉树的非递归实现一、问题描述二、递归实现三、非递归实现3.1 前序遍历3.2 中序遍历3.3 后序遍历一、问题描述 二叉树的前序遍历,非递归迭代实现 ,二叉树的前序遍…

Synology群晖小技巧之百度网盘远程下载同步

🎈 作者:互联网-小啊宇 🎈 简介: CSDN 运维领域创作者、阿里云专家博主。目前从事 Kubernetes运维相关工作,擅长Linux系统运维、开源监控软件维护、Kubernetes容器技术、CI/CD持续集成、自动化运维、开源软件部署维护…

[HCTF 2018]WarmUp1

http://ca039961-2ebb-4acd-8107-ece077539106.node4.buuoj.cn:81/ 按F12查看源码 根据提示访问source.php 分析源码,搞懂其中几个函数 mb_strpos() :返回要查找的字符串在要检查的字符串中首次出现的位置 mb_strpos (haystack ,needle) //haystack&…

AVS3变换系数编码:SRCC

AVS3摒弃了HEVC和AVS2中的基于CG(Coefficient Group)的变换系数编码方式,使用基于扫描区域的变换系数编码方法Scan Region-based Coefficient Coding(SRCC)。在基于块的预测变换混合编码框架里,当一个块完成预测、变换和量化后会获得相应的变换系数&…

盘点2022十大热门编程语言(上)

全球知名代码托管平台 GitHub发布的2022年GitHub Octoverse年度报告公布了全球最流行的十大编程语言,其中JavaScript蝉联第一,Python位列次席。 编程是技术革新的核心,对于所有的编程开发人员来说,对世界范围内编程语言发展和趋势…

APP UI自动化测试思路总结

pythonappium自动化测试系列就要告一段落了,本篇博客咱们做个小结。 首先想要说明一下,APP自动化测试可能很多公司不用,但也是大部分自动化测试工程师、高级测试工程师岗位招聘信息上要求的,所以为了更好的待遇,我们还…

算法该不该刷?如何高效刷算法?

一、算法该不该刷?最近有小伙伴向我咨询一个问题,就是算法该不该刷,该如何刷算法呢?这个问题可谓太大众化了,只要你去某乎、某度搜索一下相关的解答,会有无数种回答,可见这个问题困扰了多少学习…

Ruoyi-Cloud框架学习-【08 前端、后端服务打包】

后端打包部署 在ruoyi项目的bin目录下执行package.bat打包Web工程,生成war/jar包文件。 然后会在各个项目下生成target文件夹、包含war或jar 提示 不同模块版本会生成在ruoyi/ruoyi-xxxx模块下target文件夹 部署工程文件 1、jar部署方式 使用命令行执行&#xf…

docker学习(三):docker镜像分层原理及本地镜像推送到阿里云或私服

文章目录前言docker镜像分层加载原理docker镜像commit操作产生新镜像本地镜像发布到阿里云将本地镜像推送到私有库前言 大家好,这是我学习docker系列的笔记文章,目标是掌握docker,为后续学习K8s做准备。本文记录了docker镜像分层加载的原理,…

DSP_TMS320F28377D_使用定时器实现<获取代码块运算时间>的功能

前言 给大家拜个晚年,此博客是2023年的第一篇博客,希望在2023年我与各位大佬共同进步。以前在STM32上实现过相关的功能,链接如下: STM32_使用定时器实现<获取代码块运算时间>的功能_江湖上都叫我秋博的博…

发表计算机 SCI 论文有多难? - 易智编译EaseEditing

发表SCI论文的对本科生来说点难度,一般论文的水平是这样:普刊<核心<SCI。 不同的专业都可以发SCI,只是影响因子高低不用而已,有的领域分值高,有的偏低。 就是说不同领域SCI期刊,影响…

液晶12864显示图片

液晶12864简介12864是128*64点阵液晶模块的点阵数简称。基本参数1、低电源电压(VDD:3.0~5.5V)。2、显示分辨率:12864 点。3、内置汉字字库,提供8192 个1616 点阵汉字。4、内置128 个168 点阵字符。5、2MHZ时钟频率。6、显示方式&a…

HCIA-Datacom题库2023最新放送,能答对60%就拿下证书

HCIA的学习是网络工程师这条路的开始。如果你准备好了,就往下看!HCIA认证是华为公司认证体系中的初级认证,是一个入门认证,它包含的技术很简单,只是一个单核心的小网络,距离一个合格的网络工程师还有一段距…

电子文件全程管理与信息安全保障的并行之路

这篇文章是笔者2014年发表在《保密科学技术》第6期的一篇文章,时隔8年温习了一遍之后感觉还是有一定的可取之处,时至今日依然没有明显落伍,所以在修改完善其中部分内容之后分享给大家。 原文 Part. 01 引言 从上世纪八九十年代开始&#xff…

Nacos目录挂载并实现持久化

目录挂在docker pull ndocker pull nacos/nacos-server:v2.0.4 acos/nacos-server:v2.0.4 docker run -d --name nacos -e JVM_XMS256m -e JVM_XMX512m -e MODEstandalone --restartalways -p 8848:8848 nacos/nacos-server:1.4.2docker run -d --name nacos -e JVM_XMS256m -e…

作为一个合格的测试工程师如何跟开发有效沟通?

测试人员每天的例行工作之一就是与开发沟通代码改动,并对改动进行功能回归,我们称之为测试范围确认。对于每个测试人员来说,可能都会遇到以下问题: 1、拿到一个代码改动后我首先做什么? 2、跟开发沟通时问些什么&…

【Cocos新手入门】cocos creator操作 canvas绑定脚本及通过代码操作label组件变化的方法

本篇文章主要讲解利用cocos creator操作 canvas绑定脚本及通过代码操作label组件变化的方法 作者:任聪聪 日期:2023年1月31日 本篇文章仅适合cocos 2.4.3引擎版本下进行练习,其他版本可参考只有写法不同。 基本的操作说明 步骤一、通过cocos…

OJ万题详解––木板上的蚂蚁(C++详解)

题目 题目描述 有一块木板,长度为 n 个 单位 。一些蚂蚁在木板上移动,每只蚂蚁都以 每秒一个单位 的速度移动。其中,一部分蚂蚁向 左 移动,其他蚂蚁向 右 移动。 当两只向 不同 方向移动的蚂蚁在某个点相遇时,它们会同…