计算机组成与设计 - 1.7 功耗墙 - 1.8 单处理器向多处理器的转变 - 1.9 基准

news2025/1/11 11:18:04

1.7 功耗墙

在这里插入图片描述
25 年间 1ntel x86 八代微处理器的时钟频率和功耗 。 奔腾 4 处理器时钟频率和功耗提高很大 ,但是性能提升不大 。 Prescott 发热问题导致奔腾 4 处理器的生产线被放弃 。 Core 2 生产线恢复使用低时钟频率的简单流水线和片上多处理器 。 Core i5 采用同样的流水线

功耗提供了能够冷却的极限,在后PC时代,能量是真正关键的资源,对于个人移动设备来说,电池寿命比性能更关键。设计者要尽量降低功耗。
评价功耗时,使用能耗,比使用功耗,更加科学。

能耗的单位是 焦耳/秒

占统治地位的集成电路技术是 CMOS (互补型金属氧化半导体),其主要的能耗来源是动态能耗,即在晶体管开关过程中产生的能耗,即晶体管的状态从 0 翻转到 1 或从 1 翻转到 0 消耗的能董 。

动态能耗取决千每个晶体管的负载电容和工作电压:

能耗 ∝ 负载电容 x 电压^2

这个等式表示的是一个0->1->0或者1->0->1的逻辑转换过程中消耗的能量 。一个晶体管消耗的能量为:

能耗 ∝ 1/2 X 负载电容 x 电压^2

每个晶体管需要的功耗是一个翻转需要的能耗和开关频率的乘积:

功耗 ∝1/2 X 负载电容 x 电压^2 X 开关频率

开关频率是时钟频率的函数,负载电容是连接到输出上的晶体管数量 (称为扇出)和 工艺的函数,该函数决定了导线和晶体管的电容 。

为什么时钟频率增长为 1 000 倍,而功耗只增长为 30 倍呢?因为能耗和功耗是电压平方的函数,能够通过降低电压来大幅减少,每次工艺更新换代时都会这样做。一般来说,每代的电压降低大约 15% 。 20 多年来,电压从 5V 降到了1V 。 这就是功耗只增长 30 倍的原因所在 。

一个例题:
假设我们需要开发一种新处理器,其负载电容只有旧处理器的 85% 。 再假设其电压可以调节,与旧处理器相比电压降低了 15%, 进而导致频率也降低了 15%, 问这对新处理器的动态功耗有何影响?

在这里插入图片描述
功耗比:
在这里插入图片描述
新处理器的功耗大约是旧的处理器的功耗的一半。

如果电压继续下降会使晶体管泄漏电流过大,就像水龙头不能被完全关闭 一样 。 目前 40% 的功耗是由泄漏造成的,如果晶体管的泄漏电流再大,情况将会变得无法收拾 。

为了解决功耗问题,设计者连接大设备以增加冷却,而且将芯片中的一些在给定时钟周期内暂时不用的部分关闭 。 尽管有很多更加昂贵的方式来冷却芯片,但继续提高芯片的功耗(比如到300 瓦)对个人计算机甚至服务器来说成本太高了,对个人移动设备就更不用说了 。

注解:
动态功耗时CMOS能耗的主要来源,但静态能耗也是存在的,晶体管即使在关闭的状态下,也会存在泄漏电流。
增加晶体管的数目,就会增加漏电功耗,即使这些晶体管总是关闭的 。

1.8 单处理器向多处理器的转变

功耗的极限迫使微处理器的设计产生了巨变 。 下图给出了桌面微处理器的程序响应时间的发展 。 从 2002 年起,其每年的增长速率从 1.5 下降到 1. 2 。
在这里插入图片描述
在 2006 年,**所有桌面和服务器公司都在单片微处理器中加入了多个处理器,以求更大的吞吐率,**而不再继续追求降低单个程序运行在单个处理器上的响应时间 。 为了减少 processor 和microprocessor (微处理器)这两个词语之间的混淆,一些公司将 processor 作为 “cores” 的代称,这样 microprocessor 就是多核处理器了 。 因此,一个“四核“微处理器是一个包含了 4 个processor 或者 4 个 core 的芯片 。

硬件/软件接口:并行性对计算性能一直十分重要,但它往往是隐蔽的 。 流水线是一种漂亮的技术,通过指令重叠执行使程序运行得更快 。 这是指令级并行性的一个例子 。在抽取了硬件的并行本质之后,程序员或编译程序可认为在硬件中指令是串行执行的 。

迫使程序员意识到硬件的并行性,并显式地按并行方式重写其程序,曾经是计算机体系结构的“第三抱怨",以致很多采用此种方式进行革新的公司都失败了

编写显式并行的程序的困难点:

  1. 调度
  2. 负载平衡
  3. 通信开销
  4. 同步开销
  5. 其他开销

1.9 基准

用户日复一日使用的程序是用于评价新型计算机最完美的程序 。 所运行的一组程序集构成了工作负载 (workload) 。 要评价两台计算机系统,只需简单地比较工作负载在两台计算机上的执行时间 。 然而大多数用户并不这样做,他们通过其他方法测量计算机的性能,希望这些方法能够反映计算机执行用户工作负载的情况 。 最常用的测量方法是使用一组专门用于测量性能的基准测试程序 (benchmark) 。 这些测试程序形成负载,用户期望预测实际负载的性能 。 我们在前面提到,要加速大概率事件的执行,必须先准确地知道哪些是大概率事件,因此基准测试程序在计算机系统结构中具有非常重要的作用 。

SPEC (system perlormance evaluation cooperative) 是由许多计算机销售商共同出资赞助并支持的合作组织,目的是为现代计算机系统建立基准测试程序集 。 1989 年, SPEC 建立了重点面已面向处理器性能的基准程序集(现在称为 SPEC89) 。 历经 5 代发展,目前最新的是 SPEC CPU2006, 它包括 12 个整数基准程序集 (CINT 2006) 和 17 个浮点基准程序集 (CFP 2006) 。 CINT2006 包括 C 编译程序、量子计算机仿真、下象棋程序等, CFP 2006 包括有限元模型结构化网格法、分子动力学质点法 、 流体动力学稀疏线性代数法等 。

下图,列举了 SPEC 整数基准程序及其在 Intel Core i7 上的执行时间、指令数、 CPI 和时钟周期时间等组成的 SPEC 分值 。
在这里插入图片描述
为了简化测试结果, SPEC 决定使用单一的数字来归纳所有12 种整数基准程序 。 具体方法是将被测计算机的执行时间标准化,即将被测计算机的执行时间除以一个参考处理器的执行时间,结果称为 SPECratio 。 SPEC ratio 值越大,表示性能越快(因为 SPEC ratio 是执行时间的倒数) 。

SPECINTC2006 基准程序在 2. 66GHz 的 Intel Core i7 920 上的运行结果 。 按照经典的 CPU 性能公式的等式,执行时间是本表的 三个因素的乘积:以亿为单位的指令数 、 每条指令的时钟数 (CPI) 以及纳秒级的时钟周期时间 。 SPEC ratio 仅仅是参考时间,由 SPEC 提供,被所测量的执行时间相除 。 SPECINTC2006 所引用的单个数目是 SPEC ratio 的几何平均数。
在这里插入图片描述
其中,执行时间比 , 是总共 n 个工作负载中第 L 个程序的执行时间按参照计算机进行标准化的
结果,并且
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2076026.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

前端常见问题

一、<!DOCTYPE html>作用 <!DOCTYPE>是html文档的第一行&#xff0c;用于声明文档的类型&#xff0c;它会告诉浏览器要用哪一种HTML规范来渲染文档&#xff0c;确保正确渲染页面。 二、src与 href 的区别 &#xff08;一&#xff09;、请求资源类型的不同 在请…

研究生如何利用 ChatGPT 帮助开展日常科研工作?

研究生可以通过以下几种方式利用 ChatGPT 来帮助开展日常科研工作&#xff1a; 文献综述和研究方向&#xff1a;ChatGPT 可以帮助研究生快速了解某一领域的研究现状和热点问题。通过提供相关的文献综述、研究趋势和技术细节&#xff0c;ChatGPT 可以协助确定研究方向和课题。 …

来抄作业!企业财务报表还可以做出这样的可视化效果

从繁琐的手工记账到智能化的数据分析&#xff0c;每一步都标志着企业向更加高效、精准的管理模式迈进。大家可以想象一下&#xff0c;将复杂多变的财务数据以直观、动态的形式展现在眼前的大屏之上&#xff0c;会是一种怎样的体验&#xff1f; 这里就要说到使用山海鲸报表工具搭…

解读2024年国自然资助情况:史上最卷,三无人员也能中

2024年国自然资助情况 面上史上最难&#xff01; 面上项目申请近18万&#xff0c;资助20758项&#xff0c;资助率为11.66%&#xff0c;较2023年下降5.33个百分点。这与今年取消了"申二停一"限制有关&#xff0c;导致资历老的教授、各类人才帽子大量涌入&#xff0c…

昇腾 AscendCL C++应用开发 获取模型的信息

昇腾 AscendCL C应用开发 获取模型的信息 flyfish 举例说明 程序在香橙派 AIpro 下获取到的模型信息 从ACLLite代码里看一些类型&#xff0c;因为获取模型信息的时候&#xff0c;会获取到数字&#xff0c;所以要看数字代表的意思&#xff0c;所有要看常量的名字 数据类型 # …

ch32v307vct6从头移植FreeRTOS

使用官方的ide可以直接创建带FreeRTOS的工程,但是不利于我们学习移植,所以特此记录怎么从头开始移植FreeRTOS到CH32V307VCT6芯片使用。 下载FreeRTOS源码 首先进入https://www.freertos.org/官网,然后找到如下Download字样,进入下载即可 下载完成后我们解压使用。移植开始…

Anzo Capital昂首资本:外汇市场交易策略与平均价格优化

在外汇市场的波动中&#xff0c;Anzo Capital昂首资本通过优化开仓头寸的平均价格&#xff0c;以最小的风险获取最大的利润&#xff0c;致力于帮助投资者实现更精准的交易策略。本文将探讨如何通过策略性地设置订单&#xff0c;来降低平均成本并提高盈利潜力。 Anzo Capital昂…

TypeSript7 class类

ES6提供了更接近传统语言的写法&#xff0c;引入了Class&#xff08;类&#xff09;这个概念&#xff0c;作为对象的模板。通过class关键字&#xff0c;可以定义类。基本上&#xff0c;ES6的class可以看作只是一个语法糖&#xff0c;它的绝大部分功能&#xff0c;ES5都可以做到…

IF 17.3|植物细胞器想发高分文章?你缺的可能是这些内容

文章内容导读 叶绿体和线粒体是唯一拥有内共生起源基因组的细胞器。近年来&#xff0c;测序技术的进步促进了大量植物细胞器基因组的发表&#xff0c;并揭示了它们之间极大的进化轨迹差异。本综述量化了在植物进化树中分布广泛的已测序植物细胞器基因组的数量和分布情况。 文章…

DHCP详解与应用——从原理到实战模拟

1. 引言 在现代网络中&#xff0c;IP地址的自动分配已成为基础设施管理中不可或缺的一部分。动态主机配置协议&#xff08;DHCP&#xff0c;Dynamic Host Configuration Protocol&#xff09;作为一种广泛应用的网络协议&#xff0c;通过自动为设备分配IP地址、子网掩码、网关等…

实用Python自动化脚本案例分享

前言 每天你都可能会执行许多重复的任务&#xff0c;例如阅读新闻、发邮件、查看天气、打开书签、清理文件夹等等&#xff0c;使用自动化脚本&#xff0c;就无需手动一次又一次地完成这些任务&#xff0c;非常方便。而在某种程度上&#xff0c;Python就是自动化的代名词。 1、自…

【书生大模型实战营第三期 | 进阶岛第5关-茴香豆:企业级知识库问答工具】

学习心得&#xff1a;茴香豆&#xff1a;企业级知识库问答工具 摘要 《茴香豆&#xff1a;企业级知识库问答工具》课程详细介绍了由书生浦语团队开发的开源知识问答工具——茴香豆。该系统针对国内企业级使用场景进行了专门的设计和优化&#xff0c;具备三阶段Pipeline架构&am…

【Node】【3】回调函数

nodejs 是一个基于事件驱动和非阻塞异步的JavaScript运行时环境。 Node.js 采用单线程模型&#xff0c; 单线程意味着 Node.js 在任何给定时刻只能执行一段代码&#xff0c;但通过异步执行回调函数&#xff0c;可以在等待 I/O 操作完成的同时继续执行其他代码&#xff0c;从而…

【PL/pgSQL】华为数据库GaussDB及PostgreSQL 数据库系统的过程语言

文章目录 介绍 PL/pgSQL为什么选择 PL/pgSQL&#xff1f;基本语法和结构1. 基本结构2. 变量声明3. 控制结构4. 循环 存储过程与函数1. 创建存储过程2. 调用存储过程3. 自定义函数 触发器1. 创建触发器函数2. 创建触发器 异常处理高级语法特性示例控制结构条件语句循环 异常处理…

【Linux】06.Linux 下的编译器——gcc/g++

在之前的C语言的博客中&#xff0c;我们有谈到过编译与链接 从源代码到可执行程序要经过如下过程&#xff1a; 预处理&#xff08;进行宏替换&#xff09;编译&#xff08;将C语言代码翻译成汇编代码&#xff09;汇编&#xff08;将汇编代码解析成二进制指令&#xff09;链接&…

Python基础—Python保护代码和数据的方法

保护代码和数据的安全性至关重要。无论是防止代码被轻易修改&#xff0c;还是确保数据的隐私与完整性&#xff0c;采取适当措施都是必不可少的。今天&#xff0c;我们就来揭开六大保护策略的神秘面纱&#xff0c;让初学者也能轻松掌握这些实用技巧。 1. 使用加密技术保护敏感…

无需代码,快速搭建:JNPF低代码平台的创新应用案例

在数字化转型的浪潮中&#xff0c;企业对于迅速开发和部署应用的需求不断上升。传统的软件开发方法耗时较长、成本较高&#xff0c;难以适应快速变化的市场需求。低代码平台应运而生&#xff0c;它通过可视化界面和配置化手段&#xff0c;显著简化了应用开发流程。JNPF作为一款…

Java 中的抽象工厂模式:优雅地掌握对象创建

文章目录 一、概述三、抽象工厂设计模式的意图四、抽象工厂模式的详细解释及实际示例五、Java 中抽象工厂模式的编程示例六、抽象工厂模式类图七、Java 中何时使用抽象工厂模式八、抽象工厂模式 Java 教程九、抽象工厂模式的优点和权衡十、Java 中抽象工厂模式的实际应用十一、…

Python中的random模块及相关模块详解例子2解析

Python 的 random 模块提供了生成随机数的函数&#xff0c;这些函数可以用于各种场景&#xff0c;如模拟、游戏开发、加密等。以下是 random 模块的一些常用功能和示例。 基本函数 random.seed(aNone, /) - 初始化随机数生成器。如果提供相同的种子值&#xff0c;将生成相同的…

elastic-job定时任务

静态任务案例 ​ 使用elastic-job很容易&#xff0c;我们接下来学习下elastic-job的使用&#xff0c;这里的案例我们先实现静态任务案例&#xff0c;静态任务案例也就是执行时间事先写好。 实现步骤&#xff1a; 1.引入依赖包 2.配置zookeeper节点以及任务名称命名空间 3.实…