【计算机架构】如何计算 CPU 时间

news2025/1/23 7:07:21

    

 目录

0x00 响应时间和吞吐量(Response Time and Throughput)

0x01 相对性能(Relative Performance)

0x02 执行时间测量(Measuring Execution Time)

0x03 CPU 时钟(Clocking)

0x04 CPU时间

0x05 指令计数和 CPI

0x06 性能摘要(Performance Summary)

0x07 功率趋势(Power Trends)


0x00 响应时间和吞吐量(Response Time and Throughput)

响应时间 (Response time):完成任务所需的时间

吞吐量 (Throughput):每个单位时间内完成的总工作量 (比如: tasks/transactions... per hours)

存在多种因素可以对响应时间和吞吐量造成影响,包括但不限于:

  • 处理能力:通过升级到更快的处理器或添加更多处理器,可以减少响应时间并增加吞吐量。这是因为更快或更强大的处理器可以在更短的时间内处理更多的任务。
  • 系统负载:如果系统过载,处理过多的任务或用户,将会对响应时间和吞吐量产生负面影响。这是因为系统可能无法处理工作负荷,导致响应时间更长,吞吐量降低。
  • 网络延迟:如果网络延迟较高,响应时间和吞吐量可能会受到影响。这是因为数据传输需要更长的时间,从而导致响应时间变长和吞吐量降低。

换更快的处理器?添加更多的处理器?本章我们更关注的是 响应时间 (Response time) 。

0x01 相对性能(Relative Performance)

📚 定义:性能 =  1 / 执行时间

 \textrm{ Performance }= 1\, /\, \textrm{Execution Time}

X 比 Y 快 n 倍:

\frac{\textrm{Performance}_X}{\textrm{Performance}, _Y}=\frac{\textrm{Execution time}_Y}{ {\textrm{Execution time}}_X}=n

💭 举个例子:运行程序所需时间,在 A 机器上为 10s,在 B 机器上为 15s 

E_B/E_A=15s/10s=1.5

因此,A 比 B 快 1.5 倍。

0x02 执行时间测量(Measuring Execution Time)

执行时间测量 (Measuring Execution Time) 指的是在计算机程序中测量代码执行所需的时间。这通常是通过在代码开始和结束时记录时间戳来实现的,然后计算时间戳之间的差异来计算程序执行所需的时间。

执行时间测量通常是性能优化和调试代码的重要工具。通过测量程序中不同部分的执行时间,开发人员可以确定哪些部分需要进行优化,以使程序更加高效。

在实际应用中,执行时间测量可以使用多种不同的技术和工具来实现,例如内置的计时器函数、性能分析工具、代码覆盖率工具等等。不同的方法适用于不同的场景和需求。

总的反应时间 (Elapsed time):

  • 总响应时间,包括所有方面 (Processing, I/O, OS overhead, idle time)
  • 确定系统性能

CPU 时间 (CPU time):

  • 用于处理给定作业的时间 (Discounts I/O time, other jobs’ shares) 
  • 包括用户 CPU 时间和系统 CPU 时间
  • 不同的程序受 CPU 和系统性能的影响不同

0x03 CPU 时钟(Clocking)

CPU Clocking(CPU 时钟)指的是计算机 CPU 内部的时钟系统。这个时钟系统会以固定的速率来发出脉冲信号,这些信号会让 CPU 的不同部件在每个时钟周期内执行相应的操作。

数字硬件的操作受到固定速率时钟的控制:

时钟周期 (Clock period):时钟信号一个完整的循环所需要的时间。

时钟频率 (Clock Rate):每秒钟时钟信号产生的周期数。

0x04 计算CPU时间(T=CC/CR)

性能可以通过减少时钟周期数、增加时钟速度来改善。

硬件设计人员通常需要在时钟速度和时钟周期数量之间进行权衡。

🔺 CPU Time 计算公式如下:

CPU 时间 = CPU 时钟周期数 × 时钟周期
                 = CPU 时钟周期数 ÷ 时钟频率

📜 简化记忆:

  • 求 CPU 时间: T=\frac{CC}{CR}, T=CC\times CCT
  • 求时钟频率 (Clock Rate) :CR=\frac{CC}{T}
  • 求时钟周期 (Clock Cycle) :CC=T\times CR

💭 举个例子:

计算机 A 有 2GHz 的时钟, 10s 的CPU 时间,请设计计算机 B,目标达到 10s 的 CPU 时间。可以使用更快的时钟,但会导致 1.2 × 时钟周期,问计算机 B 的时钟应该多快?

💡 解答:已知 \textrm{Clock Rate}_A=2\textrm{GHz},\, \, \textrm{CPU Time}_A=10s计算 \textrm{Clock Rate}_B

* 根据上述公式 T=\frac{CC}{CR }那么 CR=\frac{CC}{T}

根据题意,使用更快时钟导致 1.2 倍 CC,并且目标 CPU 时间 T 为 6s,可列出公式:

\textrm{Clock Rate}_B=\frac{\textrm{Clock Cycles}_B}{\textrm{CPU Time}_B}=\frac{1.2\times\textrm{ Clock Cycles}_A}{6s}

此时我们需要计算 A 的时钟周期,根据公式 T=\frac{CC}{CR },那么时钟周期 CC=T\times CR

\textrm{Clock Cycles}_A=\textrm{CPU Time}_A\times \textrm{Clock Rate}_A=10s\times 2\textrm{GHz}={\color{Blue} 20\times 10^9}

此时我们已经得到了 CC_A,带入即可计算出 \textrm{ClockRate}_B

\textrm{CR}_B=\frac{1.2\times \textrm{CC}_{B(A)}}{\textrm{T}_B}= \frac{1.2\times {\color{Blue} 20\times 10^9}}{6s}=\frac{​{\color{Blue} 24\times10^9}}{6s}={\color{Red} 4}\textrm{\, GHz}

0x05 指令计数 IC 和 每条指令所需的时钟周期数 CPI

\textrm{IC} (Instruction Count),指的是 指令计数

\textrm{CPI} (Cycle Per Instrution),指的是 每条指令所需的时钟周期数。即 平均执行周期数

是指在一个程序中,每个时钟周期所执行的平均指令数。这两个概念都是计算机性能评估中的关键指标。通过减少指令计数或降低 CPI,可以提高计算机系统的性能。

 📃 简化记忆:

  • {\color{Blue} CC} = \textrm{ IC}\times\textrm{ CPI}
  • T ={\color{Blue} IC\times CPI}\times CCT=\frac{​{\color{Blue} IC\times CPI}}{CR}

Execution time = (Instruction count * CPI) / Clock rate

程序的指令计数是由程序本身、指令集架构 (ISA) 和编译器所决定的。每个指令的平均时钟周期数取决于CPU硬件。如果不同的指令具有不同的CPI,则平均 CPI 受指令组合的影响。

💭 CPI 计算例子:

计算机 A 的周期时间 = 250ps,CPI = 2.0,计算机 B 的周期时间 为 500ps,CPI = 1.2

ISA 相同,哪台计算机更快?快多少?

💡 题解:根据题意得知:CT_A=250ps,CPI_A=2.0CT_B=500ps,CPI_B=1.2

既然要比谁更快,那么我们分别计算出 A, B 的 CPU Time:

\textrm{CPU Time}_A=IC\times CPI_A\times \textrm{CycleTime}_A=l\times 2.0\times 250ps=l\times 500ps

\textrm{CPU Time}_B=IC\times CPI_B\times \textrm{CycleTime}_B=l\times 1.2\times 500ps=l\times 600ps

\textrm{CPU Time}_A < \textrm{CPU Time}_B,因此 A 速度更快。

下面计算快多少:

\frac{\textrm{CPU Time}_B}{\textrm{CPU Time}_A}=\frac{l\times 600ps}{l\times 500ps}=1.2

0x06 关于CPI 的更多细节

如果不同的指令类别需要不同的时钟周期数:

 \textrm{ClockCycle}=\sum_{i=1}^{n}(IC_i\times CPI_i)

 加权平均 CPI (Avg):

CPI=\frac{\textrm{Clock\, Cycles}}{\textrm{IC}}=\sum_{i=1}^{n}(\textrm{CPI}_i\times \frac{IC_i}{IC})

💭 例子:Alternative compiled code sequences using instructions in classes A, B, C:

💡 解读:Sequence 1 中  IC=2+1+2=5

根据公式:\textrm{ClockCycle}=\sum_{i=1}^{n}(IC_i\times CPI_i)

再根据图表给出的 IC, CPI 即可计算出 Clock Cycles:

\textrm{Clock Cycles}=IC\times CPI=(2\times 1)+(1\times 2)+(2\times 3)={\color{Blue} 10}

然后通过公式计算平均:CPI=\frac{\textrm{Clock\, Cycles}}{\textrm{IC}}=\sum_{i=1}^{n}(\textrm{CPI}_i\times \frac{IC_i}{IC})

 \textrm{Avg. CPI}=\frac{\textrm{CC}}{IC}=\frac{​{\color{Blue} 10}}{5}={\color{Red} 2.0}

0x07 性能摘要(Performance Summary)

\textrm{CPU Time}=\frac{\textrm{Instructions}}{\textrm{Program}}\times \frac{\textrm{Clock Cycles}}{\textrm{Instruction}}\times \frac{\textrm{Seconds}}{\textrm{Clock Cycle}}

性能摘要 (Performance Summary) 是指对计算机系统、软件或应用程序性能进行评估、分析和总结的过程。在性能摘要中,可以考虑多种性能指标,如执行时间、吞吐量、响应时间、负载等。通常,性能摘要的目的是发现瓶颈、评估系统的优化潜力、指导系统设计和优化、以及进行比较评估等。在实践中,性能摘要是计算机系统开发和维护中非常重要的一环,可以帮助提高系统的性能、可靠性和稳定性。

性能取决于 算法 (影响 IC,可能影响 CPI)、编程语言 (影响 IC,CPI)、编译器(影响 IC,CPI)、指令集架构(影响 IC,CPI,Tc)。

🔺 计算公式总结: 

📌 [ 笔者 ]   王亦优
📃 [ 更新 ]   2022.3.
❌ [ 勘误 ]   /* 暂无 */
📜 [ 声明 ]   由于作者水平有限,本文有错误和不准确之处在所难免,
              本人也很想知道这些错误,恳望读者批评指正!

📜 参考资料 

C++reference[EB/OL]. []. http://www.cplusplus.com/reference/.

Microsoft. MSDN(Microsoft Developer Network)[EB/OL]. []. .

百度百科[EB/OL]. []. https://baike.baidu.com/.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/442462.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

用docker承载mysql

这两天部署系统到生产服务器&#xff0c;前端后端部署docker是毫无疑义的&#xff0c;但mysql呢&#xff1f; 答案是mysql可以部署到docker。 1、数据文件挂载到宿主机 将mysql部署于docker&#xff0c;会有一个担心&#xff0c;就是docker容器的删除非常的容易&#xff0c;…

修改树莓派系统的更新源,软件安装源和pip安装源

本文目录 1、更换系统更新源2、更改软件源3、更换 pip 源4、更新系统与软件5、附加知识 Linux系统常用的安装源主要有系统更新源和软件安装源二大类&#xff0c;系统更新源是用于对Linux系统本身进行升级更新的&#xff0c;软件安装源是用于通过apt命令安装软件的。随着python的…

【Zigbee】解密Zigbee地址分配——你需要知道的一切

&#x1f496; 作者简介&#xff1a;大家好&#xff0c;我是Zeeland&#xff0c;全栈领域优质创作者。&#x1f4dd; CSDN主页&#xff1a;Zeeland&#x1f525;&#x1f4e3; 我的博客&#xff1a;Zeeland&#x1f4da; Github主页: Undertone0809 (Zeeland) (github.com)&…

URL 转为QR code(二维码)

推荐一个良心的网站&#xff0c;能够免费地将url、text编码为二维码&#xff0c;而且还能设计logo、颜色等。 https://www.the-qrcode-generator.com/ 如下图&#xff1a; 可以自己定义logo、颜色&#xff1a; 还能查看扫描历史等统计信息&#xff1a; 上述所有功能都是免…

【人工智能概论】 RNN、LSTM、GRU简单入门与应用举例

【人工智能概论】 RNN、LSTM、GRU简单入门与应用举例 文章目录 【人工智能概论】 RNN、LSTM、GRU简单入门与应用举例一. RNN简介1.1 概念简介1.2 方法使用简介 二. 编码层embedding2.1 embedding的参数 一. RNN简介 1.1 概念简介 循环神经网络(Recurrent Neural Network)理念…

苹果电容笔值得买吗?ipad电容笔推荐平价

在当今时代&#xff0c;高科技已经成为推动数字产品发展的重要推动力。无论是在工作上&#xff0c;还是在学习上&#xff0c;大屏幕都能起到很好的作用。IPAD将会更好地融入我们的生活&#xff0c;不管是现在还是未来。而ipad配上一支简单的电容笔&#xff0c;不仅可以提高工作…

【机器学习】P22 过拟合和欠拟合的探究2,高偏差与高方差

过拟合与欠拟合的探究2&#xff0c;高偏差与高方差 高偏差和高方差过拟合与欠拟合的解决策略带有L2正则化的神经网络带有早停法的神经网络的完整案例 MINST 高偏差和高方差 高偏差和高方差是机器学习中常见的两个问题&#xff0c;会影响模型的性能。 高偏差&#xff08;High …

MySQL数据库,聚合查询

目录 1、聚合查询 1.1聚合函数 1.1.1count函数 1.1.2sum函数 1.1.3avg函数 1.1.4max函数 1.1.5min函数 1.2group by子句 1.3having 1、聚合查询 1.1聚合函数 聚合函数查询又叫函数查询&#xff0c;它是通过一些特定的函数根据需求来查询相关的信息&#xff0c;常见的…

代码随想录|day52| 动态规划part13● 300.最长递增子序列 ● 674. 最长连续递增序列 ● 718. 最长重复子数组

300 最长递增子序列 链接&#xff1a;力扣 看了思路之后写的代码&#xff0c;不知道为什么报错了。 错误一&#xff1a; int nnums.size();vector<int>dp(n,0);dp[0]1;for(int i1;i<n;i){for(int j0;j<i;j){if(nums[i]>nums[j]){dp[i]max(dp[i],dp[j]1);}}}retu…

Java版本企业电子招投标采购系统源代码——功能模块功能描述+数字化采购管理 采购招投标

​ 功能模块&#xff1a; 待办消息&#xff0c;招标公告&#xff0c;中标公告&#xff0c;信息发布 描述&#xff1a; 全过程数字化采购管理&#xff0c;打造从供应商管理到采购招投标、采购合同、采购执行的全过程数字化管理。通供应商门户具备内外协同的能力&#xff0c;为外…

ChatGPT 聊天接口API 使用

一、准备工作 1.准备 OPENAI_ACCESS_TOKEN 2.准备好PostMan 软件 二、测试交流Demo 本次使用POSTMAN工具进行快速测试&#xff0c;旨在通过ChatGPT API实现有效的上下文流。在测试过程中&#xff0c;我们发现了三个问题&#xff1a;    1.如果您想要进行具有上下文的交流&…

【prettier Error resolving prettier configuration for x:\xxx\.prettierrc.js】

Prettier Error resolving prettier configuration for x:\xxx.prettierrc.js 解决方法 Prettier 出现如下错误 错误 内容内联代码片 Error resolving prettier configuration for d:\map\user_package\Leaflet.FileLayer-master\.prettierrc.js ["ERROR" - 10:38…

Facebook、Google、亚马逊,谁将成为跨境电商的营销宠儿?

跨境电商在全球范围内的发展日益迅猛&#xff0c;而营销渠道的选择也变得越来越多样化。在众多的广告平台中&#xff0c;Facebook、Google和亚马逊被公认为是跨境电商卖家们最主要的营销平台。那么&#xff0c;这三个平台中哪个会成为跨境电商的营销宠儿呢&#xff1f; 一、Fac…

自动驾驶——智能底盘构造详解及新发展

摘要&#xff1a; 汽车底盘是指汽车上由传动系统、行驶系统、转向系统和制动系统等部分的组合&#xff0c;其功能包括支承、安装汽车车身、发动机及其它各部件及总成&#xff0c;形成汽车的整体造型&#xff0c;承受发动机动力&#xff0c;保证车辆正常行驶等。 底盘构造介绍 …

摄像头/视频读取_写入

摄像头/视频读取_写入 ➢VideoCapture类: 使用 OpenCV 播放视频&#xff0c;几乎与使用它来显示图像一样容易。播放视频时只需要处理的新问题就是如何循环地顺序读取视频中的每一顿&#xff0c;以及如何从枯燥的电影视频的读取中退出该循环操作。具体如例如下&#xff1a; #…

【计算机架构】如何计算 CPU 动态功耗

&#x1f4dc; 本章目录&#xff1a; 0x00 动态功耗&#xff08;Dynamic Power&#xff09; 0x01 集成电路成本&#xff08;Integrated Circuit Cost&#xff09; 0x02 基准测试&#xff08;SPEC CPU Benchmark&#xff09; 0x03 SPEC功率基准测试&#xff08;SPEC Power B…

vs2022下配置zxing cpp环境

生成zxing 下载zxing&#xff0c;zxing-cpp-master https://github.com/zxing-cpp/zxing-cpp Cmake生成项目&#xff0c;点Generate&#xff0c;把OpenCV_DIR修改了&#xff0c;NameValue没有报红就点Generate。然后点Open Project打开项目。 打开项目后&#xff0c;右击解决…

赋值法写基础解系中解向量

赋值法写基础解系中解向量 &#xff08;一&#xff09;背景引入 通常解方程组时&#xff0c;将系数矩阵化为行阶梯型&#xff0c;进而可化为行最简型 &#xff08;说一嘴&#xff1a;行最简型是指阶梯口元素全是1&#xff0c;该1所在列全其余全为0&#xff1b;广义行阶梯的阶梯…

maven作用讲解---以及怎么配置阿里的maven镜像

目录 Maven介绍 传统的java项目的结构和maven的对比 传统 Maven的项目 如何配置阿里 maven 2. 修改 Maven介绍 传统的java项目的结构和maven的对比 传统 Maven的项目 如何配置阿里 maven (1) 把 D:\program\JavaIDEA 2020.2\plugins\maven\lib\maven3\conf\settings.xml…

DNS服务

DNS服务 使用背景 在日常生活中人们习惯使用域名访问服务器&#xff0c;但机器间互相只认IP地址&#xff0c;域名与IP地址之间是多对一的关系&#xff0c;一个ip地址不一定只对应一个域名&#xff0c;且一个完整域名只可以对应一个ip地址&#xff0c;它们之间的转换工作称为域…