操作系统基础知识之处理器性能方程指标（包含阿达姆定律、CPI、Clock cycle time等）

操作系统基础知识之处理器性能方程指标（包含阿达姆定律、CPI、Clock cycle time等）

news2025/2/24 12:34:53

计算机设计人员通过持续时间或速率来指代时钟周期的时间。程序的 CPU 时间可以用两种方式表示：

CPU 时间=程序的 CPU 时钟周期 / 时钟频率

除了执行程序所需的时钟周期数外，我们还可以计算执行的指令数。如果我们知道时钟周期数和指令数，就可以计算每条指令的平均时钟周期数 (CPI)。设计人员有时还会使用每时钟指令 (IPC)，这是 CPI 的倒数。

CPI = 程序的 CPU 时钟周期/指令数

CPI英文为clock cycles per instruction ，物理含义为每个指令执行的时钟周期。

于是，又得到了一个新的CPU时间计算公式

CPU 时间 = 指令数*每条指令的周期数*时钟周期时间

CPU 时间 = （所有的指令数/程序数）*（程序的 CPU 时钟周期/指令数）*（时间/程序的 CPU 时钟周期）= 时间/程序数

如该公式所示，处理器性能取决于三个特性：时钟周期（或速率）、每条指令的时钟周期和指令数。此外，CPU 时间同样取决于这三个特征；例如，其中任何一个提高 10% 都会导致 CPU 时间提高 10%。

但存在一定问题就是更改每个特性所涉及的基本技术是相互依赖的：

但许多潜在的性能改进技术主要增强处理器性能的一个组成部分，而对其他两个组成部分的影响较小或可预测。

总处理器时钟周期数：

其中 ICi 表示指令 i 在程序中执行的次数，CPIi 表示指令 i 的每条指令的平均时钟数。

于是，新的计算公式如下：

CPU time = CPU clock cycles *Clock cycle time

举个例子：

假设我们进行了以下测量：
FP 操作的频率 =25%
FP 操作的平均 CPI = 4.0
其他指令的平均 CPI = 1.33
FSQRT 的频率 = 2%
FSQRT 的 CPI = 20
假设两种设计方案是将 FSQRT 的 CPI 降低到 2 或将所有 FP 操作的平均 CPI 降低到 2.5。使用处理器性能方程比较这两个设计备选方案。

首先，观察只有 CPI 发生变化；时钟速率和指令数保持不变。我们首先找到没有增强的原始 CPI：

首先尝试第一种方案：

其次尝试第二种方案：

（和第一种方式完全一样）

由于整体 FP 增强的 CPI 略低，因此其性能会略好一些。具体来说，整体 FP 增强的加速是

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/510870.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

金融学第二版笔记第一章1.1

金融学第二版笔记第一章1.1

第1部分金融和金融体系第一章金融学 1.1 一、对金融学进行界定 1.金融金融是货币流通、信用活动及与之相关的经济行为的总称。简言之，就是货币资金的融通。一般是指以银行、证券市场等为中心的货币流通和信用调节活动，包括货币的发行和流通、存…

阅读更多...

转置卷积(一) 搞懂转置卷积的计算

转置卷积(一) 搞懂转置卷积的计算

搞懂转置卷积的计算 0、参考文档1、转置卷积是什么？1.1 定义1.2 需要注意 2、转置卷积的计算2.1 从最简单的开始2.2 考虑stride2.3 考虑padding2.4 考虑dilation 3 转置卷积的加速文章首发于https://zhaodongyu-ak47.github.io/Transposed_Convolution/ 最近做了一…

阅读更多...

数据结构入门-二叉树

数据结构入门-二叉树

树的概念及结构树的概念树的一种非线性的数据结构，它是由n（n>0）个有限节点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一颗倒挂的树，也就是说它树根朝上，而叶子朝下。有一个特殊的节点&#xff…

阅读更多...

Web安全行业：零基础学习网络安全需要掌握哪些知识？（附系统路线+工具笔记）

Web安全行业：零基础学习网络安全需要掌握哪些知识？（附系统路线+工具笔记）

前言 “没有网络安全就没有国家安全”。当前，网络安全已被提升到国家战略的高度，成为影响国家安全、社会稳定至关重要的因素之一。一、网络安全行业特点行业发展空间大，岗位非常多网络安全行业产业以来，随即新增加了几十个…

阅读更多...

单元测试 - 集成H2 Dao测测试

单元测试 - 集成H2 Dao测测试

SpringBoot 2.7、Mybatis plus、H2 1. pom引入h2 <dependency><groupId>com.h2database</groupId><artifactId>h2</artifactId><version>2.1.214</version> </dependency> 2. 配置h2数据源 & mapper路径 spring:datas…

阅读更多...

地狱级的字节跳动面试，6年测开的我被按在地上摩擦.....

地狱级的字节跳动面试，6年测开的我被按在地上摩擦.....

前几天我朋友跟我吐苦水，这波面试又把他打击到了，做了快6年软件测试员。。。为了进大厂，也花了很多时间和精力在面试准备上，也刷了很多题。但题刷多了之后有点怀疑人生，不知道刷的这些题在之后的工作中能不能用到&…

阅读更多...

( 位运算 ) 260. 只出现一次的数字 III ——【Leetcode每日一题】

( 位运算 ) 260. 只出现一次的数字 III ——【Leetcode每日一题】

❓260. 只出现一次的数字 III 难度：中等给你一个整数数组 nums，其中恰好有两个元素只出现一次，其余所有元素均出现两次。找出只出现一次的那两个元素。你可以按任意顺序返回答案。你必须设计并实现线性时间复杂度的算法且仅使用常量额…

阅读更多...

精炼计算机网络——数据链路层（一）

精炼计算机网络——数据链路层（一）

文章目录前言3.1 数据链路和帧3.1.1 数据链路和帧3.1.2 三个基本问题总结前言上篇文章，我们一同学完了物理层的全部内容，在本篇文章中，我们初步学习数据链路层，理解数据链路和帧的相应概念，知晓封装成帧&#xff…

阅读更多...

信号完整性分析基础知识之传输线和反射（五）：较短阻抗不连续的传输线、残桩和末端容性负载引起的反射

信号完整性分析基础知识之传输线和反射（五）：较短阻抗不连续的传输线、残桩和末端容性负载引起的反射

首先来一首定场诗：难难难，道德玄，不对知音不可谈。对了知音谈几句，不对知音枉费舌尖。较短不连续点引起的反射很多时候，板载走线的宽度必须要收窄，特别是经过PF区域或者拥挤区域。如果传输线的某一小段…

阅读更多...

eSIM证书要求-证书验证-EID

eSIM证书要求-证书验证-EID

SM-DP 和 SM-DS 应该验证 EUM 和 eUICC 证书中限制的 IIN 和 EID 的一致性（参见第 4.5.2.1.0.2 和 4.5.2.1.0.3 节），并考虑 SGP.29 [ 89]。根据 SGP.29 [89] 颁发的 EID 没有 SGP.02 [2] 中定义的 8 位 IIN。相反，它们具有可变长…

阅读更多...

【计算机视觉 | Python】十个 Python 图像处理工具，建议点赞收藏

【计算机视觉 | Python】十个 Python 图像处理工具，建议点赞收藏

文章目录一、前言二、常见的库2.1 scikit-image2.2 NumPy2.3 SciPy2.4 PIL / Pillow2.5 OpenCV-Python2.6 SimpleCV2.7 Mahotas2.8 SimpleITK2.9 pgmagick2.10 Pycairo 一、前言这些 Python 库提供了一种简单直观的方法来转换图像并理解底层数据。今天的世界充满了数据&am…

阅读更多...

linux【网络编程】之UDP网络程序模拟实现

linux【网络编程】之UDP网络程序模拟实现

linux【网络编程】之UDP网络程序模拟实现一、开发环境二、服务端实现2.1 接口认识2.1.1 socket创建网络通信套接字2.1.2 bind：绑定Ip和端口号2.1.3 sockaddr_in结构体2.1.4 IP地址转换函数：inet_addr、inet_ntoa2.1.5 recvfrom：读取数据 2.2…

阅读更多...

大语言模型进化树重磅发布，感慨技术方向选择的残酷，文末有彩蛋

大语言模型进化树重磅发布，感慨技术方向选择的残酷，文末有彩蛋

文 / 高扬（微信公众号：量子论） 今天说点有深度的内容。五一假期，学习了一篇论文《Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond》。这篇论文来自 Amazon 以及 Texas A&M University 研究团队&…

阅读更多...

【2023 · CANN训练营第一季】应用开发深入讲解——第五章端到端案例讲解

【2023 · CANN训练营第一季】应用开发深入讲解——第五章端到端案例讲解

学习资源样例介绍使用DVPP加速预处理网络输入，并通过模型转换使能静态AIPP功能，使能AIPP功能后，YUV420SP_U8格式图片转化为RGB，然后减均值和归一化操作，并将该信息固化到转换后的离线模型中，对ResNet50…

阅读更多...

传统IDC服务器迁移上云流程

传统IDC服务器迁移上云流程

上云是趋势，越来越多企业的IDC服务器选择迁移上云，迁移上云的方式有很多，阿里云提供服务器迁移中心SMC来帮助用户迁移上云。使用SMC服务器迁移中心，将您的源服务器方便快捷地迁移至阿里云，支持的迁移源类型包括IDC服务…

阅读更多...

【Java EE 初阶】锁策略以及CAS问题

【Java EE 初阶】锁策略以及CAS问题

目录 1.常见的锁策略 1.乐观锁 vs 悲观锁 2.读写锁 3.重量级锁 vs 轻量级锁 4.自旋锁（Spin Lock） 5.公平锁 vs 非公平锁 6.可重入锁 vs 不可重入锁 7.Synchronized实现了哪些锁策略？ 1.是乐观锁也是悲观锁 2.既是轻量级锁也是重量级…

阅读更多...

K_A37_005 基于STM32等单片机驱动ADS1115 ADC模块串口与OLED0.96双显示

K_A37_005 基于STM32等单片机驱动ADS1115 ADC模块串口与OLED0.96双显示

K_A37_005 基于STM32等单片机驱动ADS1115 ADC模块串口与OLED0.96双显示所有资源导航一、资源说明二、基本参数参数引脚说明三、驱动说明IIC时序对应程序: 四、部分代码说明1、接线引脚定义1.1、STC89C52RCADS1115 ADC模块1.2、STM32F103C8T6ADS1115 ADC模块五、基础知识学习…

阅读更多...

解决“未在本地计算机注册“OraOLEDB.Oracle.1”提供程序“问题

解决“未在本地计算机注册“OraOLEDB.Oracle.1”提供程序“问题

由于本地使用Oracle.ManagedDataAccess批量插入问题，连接数据库时报错 : ProviderOraOLEDB.Oracle;Data Sourceorcl;User IdQueueDp;PasswordQueueDp 此问题之前解决过没记录，又遇到了，忘了怎么解决，试了很多没效果解决办法一、…

阅读更多...

用好git stash，工作超nice

用好git stash，工作超nice

一、介绍如果修改后的内容还不想commit，就可以用git stash命令。它会将工作区和暂存区中的修改(也就是还没commit的内容)都会被保存到堆栈里，并在之后恢复到任意指定的分支上。二、应用场景 1、在分支a进行开发feature 1时，突然需要紧急…

阅读更多...

2、Orangepi Zero2刷机和系统启动

2、Orangepi Zero2刷机和系统启动

目录 2.1 工具安装 2.2 刷机 2.3 登录系统 2.4 修改登陆密码 2.5 网络配置 2.6 SSH登陆开发板就像买了电脑，出厂带有 windows 操作系统，才算是正在的电脑，开发板需要烧写对应的系统固件，才能正常发挥作用工具 Orangepi Zero2…

阅读更多...

推荐文章

最新文章