缓存一致性(cache coherency)解决方案:MESI 协议状态转换详解

news2024/11/24 4:23:57

MESI 协议

  • 一,MESI状态释义
  • 二,MESI状态转换
    • 1 Invalid after Reset
    • 2, Invalid => Exclusive
    • 3, Exclusive => Modified
    • 4 Modified => Shared, Invalid => Shared
    • 5 Shared => Invalid, Shared => Modified
  • 三,状态转换场景总结
    • Invalid to Shared/ Invalid to Exclusive
    • Invalid to Modified.
    • Shared to Modified.
    • Shared to Invalid.
    • Exclusive to Modified.
    • Exclusive to Invalid.
    • Modified to Shared.
    • Modified to Invalid.
  • 四,参考文档

一,MESI状态释义

ARMv8架构使用 MESI 协议来维护在多个core之间的数据一致性,MESI 协议描述了 L1 Data Cache中的一个共享的cache line的状态可以是:

  • M,Modified, Unique Dirty((UD), 只存在于当前cache中(unique),并且该cache line上的数据与下一级存储单元中的数据不同(dirty)。换言之,cache line中最新的数据位于当前cache,其他cache中没有备份 ,cache line中的内容与主存中的不一致。
  • E,Exclusive, Unique Clean(UC),数据只存在于当前cache line中,并且为clean的。cache中cache line中的数据于主存中的一致,并且其他core中的cache没有该地址的数据备份,只存在一个cache中。
  • S,Shared Clean (SC), Shared ,cache line中的data不一定与主存中的一致,但是shared cache line中的数据是最新的,且存在于多个core中。
  • I,Invalid,无效的数据,或者可以说当前cache line里没有数据。

Data Cache Unit (DCU)会将cache line的 MESI状态信息保存在tag RAM和 dirty RAM中,关于如何读取cache line中的MESI信息,将在下篇文章中讲解。本文主要探讨MESI的状态转换过程以及转换示例。

二,MESI状态转换

下图为MESI协议的状态转换图:在这里插入图片描述
接下来,本文将结合一个在多核场景下的状态转换用例,来解释具体的MESI状态转换:

1 Invalid after Reset

假设当前系统有四个core,每个core有自己独立的data cache,在系统上电后,所有core的cache line默认都为 invalid状态:
在这里插入图片描述

2, Invalid => Exclusive

然后core0 试图读取内存中地址为 0x44013F00上的数据,在core0 的data cache中会发生read miss以及linefill,与该地址相关的cache line的状态将由Invalid 转为 VE,其中V 为Valid,表明该cacheline中的数据有效。E为Exclusive,表明该数据只在core0中,并且是clean的。

在这里插入图片描述
上图中的 invalid状态到Exclusive的转换,也就是下图标红的部分:
在这里插入图片描述

3, Exclusive => Modified

之后,core0试图对该地址写入一个新值,该cache line的状态将由VE会变成VDM,其中V为,valid,D为Dirty,表示数据为脏,当前cache line中的数据与主存中的不一致。M 为Modified,表明该cache line中的数据是Unique且Dirty的。
在这里插入图片描述
也就是下图标红的部分:
在这里插入图片描述

4 Modified => Shared, Invalid => Shared

接下来,让core 1,core2,core3也对对该地址进行读取操作,core0的状态将会从VDM 转为 VS,其他三个core的cache line将由Invalid 转为 VS, S表示Shared。此外,从下图中,也可知,core1,core2,core3读取到的数据是core0 cache中的备份,而不是真正内存中的值。
在这里插入图片描述
下图红色部分即上述状态的转换过程:
在这里插入图片描述

5 Shared => Invalid, Shared => Modified

接4的步骤, 如果core1 试图对该地址写入一个新值,core0、core2和core3中该cache line的状态将会由Shared 变为 Invalid,而core1的状态将由Shared 变为 Modified(VDM)。此外,由于使用的是write back策略,所以当前的写入操作仅写入到了cache中,主存中的内容仍未改变。
在本示例中,出现了两个core先后对同一个内存地址进行读写操作, core0写入的值(蓝色)由于没有被写回到主存中,之后core1又对该地址写入一个新值(绿色),就把core0写入的值给覆盖了。

在这里插入图片描述
下图红色部分即上述状态的转换过程:
在这里插入图片描述

三,状态转换场景总结

Invalid to Shared/ Invalid to Exclusive

当一个core对某地址发生了read miss,需要进行linefill的时候,如果检查到其他core里保存着该地址的数据,则发生Invalid to Shared,否则就是Invalid to Exclusive。

Invalid to Modified.

当一个core对某地址发生Write miss,需要进行linefill的时候,会广播消息,通知其他core:如果也保存了该地址的数据(无论是E状态或者是S状态),对该地址上的数据进行invalidate操作。所以根据不同的架构实现,可能会发生dirty cache line的write back或者data corruption。

Shared to Modified.

当一个core对某地址发生Write hit(S状态或者M状态)时,会广播通知其他core将对应该地址的数据(如果其他core中存在,其状态只能是S)给invalidate掉。

Shared to Invalid.

检测到其他core对该地址进行了写操作。

Exclusive to Modified.

当一个core对某地址发生Write hit(E状态)时Write hit,无需发出任何广播消息。

Exclusive to Invalid.

检测到其他core对该地址进行了写操作。

Modified to Shared.

检测到其他core对该地址进行了读操作。 改dirt cache line将会分享给发起读操作的core(invalid to shared)。根据具体的实现架构,可能还会发生write back。

Modified to Invalid.

检测到其他core对该地址进行了写操作。根据具体的实现架构,可能还会发生write back。

四,参考文档

https://handwiki.org/wiki/MESI_protocol
https://community.cadence.com/cadence_blogs_8/b/breakfast-bytes/posts/what-39-s-the-difference-between-moesi-and-mesi-cache-coherence-for-poets
https://celery1124.github.io/MESI-protocol/
https://users.cs.utah.edu/~bojnordi/classes/7810/s20/slides/07-snooping.pdf
https://inst.eecs.berkeley.edu/~cs152/sp16/handouts/quiz5sol_s2016.pdf
https://inst.eecs.berkeley.edu/~cs61c/su18/disc/11/Disc11Sol.pdf
https://www.geeksforgeeks.org/cache-coherence-protocols-in-multiprocessor-system/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1051119.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

最小生成树 | 市政道路拓宽预算的优化 (Minimum Spanning Tree)

任务描述: 市政投资拓宽市区道路,本着执政为民,节省纳税人钱的目的,论证是否有必要对每一条路都施工拓宽? 这是一个连问带答的好问题。项目制学习可以上下半场,上半场头脑风暴节省投资的所有可行的思路&a…

因果引擎(Causal Engine)是基于因果推理的人工智能系统

因果引擎(Causal Engine)是一种基于因果推理的人工智能系统。 其关键思想是通过学习事件之间的因果关系,对环境进行模型化和推理,从而指导AI系统采取行动。 因果引擎的主要特征包括: 建立因果图(Causal Graph):通过统计方法学习不同事件之间的因果关系,构建表示这些因果关系的…

基于微信小程序的游戏账号交易买卖平台设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言系统主要功能:具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计…

通过 Azure 日志分析加强云安全

Microsoft Azure 云服务在安全日志存储、访问、可伸缩性、降低成本和易于部署方面提供了巨大的优势,因此在企业中很受欢迎。 Microsoft Azure 日志记录工具(如 Log360)可帮助管理 Azure 云基础结构中所有设备和应用程序(如虚拟机…

Linux:nginx---web文件服务器

我这里使用的是centos7系统 nginx源码包安装 Linux:nginx基础搭建(源码包)_鲍海超-GNUBHCkalitarro的博客-CSDN博客https://blog.csdn.net/w14768855/article/details/131445878?ops_request_misc%257B%2522request%255Fid%2522%253A%25221…

Spring | 基于SpringBoot的多数据源实战 - 使用seata实现多数据源的全局事务管理

Spring | 基于SpringBoot的多数据源实战 - 使用seata实现多数据源的全局事务管理 引言1.1 多数据源的必要性1.2 多数据源的应用场景 实战演示2.1 创建实体类2.2 配置数据源2.3 实现数据源配置类2.4 配置Repository类2.5 运行与验证 事务管理与数据一致性3.1 事务管理3.2 使用Se…

长假,GPT来敲(Jué)门(Fén)

引 马上十一了,本拐在干了XX和XX事情以后,开始划水,欢天喜地的等放假。 然后,GPT4说更新了,据说加了一个读图的功能,本拐不以为然,不就是什么文生图,图生文么,TOOOLD。 不…

案例题-系统开发

案例题-系统开发 结构化分析方法概述面向对象分析方法真题1真题2 结构化分析方法概述 面向对象分析方法 了解一下符号就行 依赖关系:一个事务的变化影响另外一个事务的变化 泛化关系,父类子类 聚合:部分和整体之间的生命周期不同 组合&#x…

Cache系列直播,这次真的来了!

1、要学cache,一大堆一大堆待讨论的问题。例如近期的一些问题: L1、L2、L3 cache的替换策略是怎样的?什么类型的内存永远不会进L3 cache?L3 cache一般都是多大?L3 cache的组织形式一般是怎样的?什么是cache…

MySQL体系结构和四层架构介绍

MySQL体系结构图如下: 四层介绍 1. 连接层: 它的主要功能是处理客户端与MySQL服务器之间的连接(比如Java应用程序通过JDBC连接MySQL)。当客户端应用程序连接到MySQL服务器时,连接层对用户进行身份验证、建立安全连接并管理会话状态。它还处理…

医疗图像分割指标

医疗图像其中两种图像格式:MRI(Magnetic Resonance Imaging,磁共振成像)、CT(Computed Tomography,计算机断层),常存成 .nii.gz 格式。都是 3D 的 H W L H \times W \times L HWL…

数字孪生智慧能源:风光储一体化能源中心

自“双碳”目标提出以来,我国能源产业不断朝着清洁低碳化、绿色化的方向发展。其中,风能、太阳能等可再生能源在促进全球能源可持续发展、共建清洁美丽世界中被寄予厚望。风能、太阳能具有波动性、间歇性、随机性等特点,主要通过转化为电能再…

jvm内存分配与回收策略

自动内存管理 解决两个问题 自动给对象分配内存 对象一般堆上分配(而实际上也有可能经过即时编译后被拆散为标量类型并间接地在栈上分配) 新生对象通常会分配在新生代,少数情况下(例如对象大小超过一定阈值)也可能…

[H5动画制作系列 ]变量,帧频,监听器等的生命周期基础测试

模式:按照上述抓图,actions层,1帧,写初始化代码,10帧写返回代码到2帧代码,2-10帧之间一直循环。1帧及10帧代码如下: 如果程序在1-10之间循环,会反复创建变量i,多个监听器等。所以,第一帧最好执行一次即可,程序在2-10帧之间一直循环。

《Upload-Labs》01. Pass 1~13

Upload-Labs 索引前言Pass-01题解 Pass-02题解总结 Pass-03题解总结 Pass-04题解 Pass-05题解总结 Pass-06题解总结 Pass-07题解总结 Pass-08题解总结 Pass-09题解 Pass-10题解 Pass-11题解 Pass-12题解总结 Pass-13题解 靶场部署在 VMware - Win7。 靶场地址:https…

Leetcode290. 单词规律

给定一种规律 pattern 和一个字符串 s ,判断 s 是否遵循相同的规律。 这里的 遵循 指完全匹配,例如, pattern 里的每个字母和字符串 s 中的每个非空单词之间存在着双向连接的对应规律。 解题思路:哈希 力扣(LeetCode&…

软件测试中的测试工具和自动化测试

1. 测试工具 测试工具也分为不同人员使用的 开发人员:测试框架,编写测试用例;各类线上dump分析工具如windgb;开发时的集成IDE工具如Visual Studio,idea等等 面向不同测试需求的测试工具 软件测试是软件开发生命周期…

网络子网划分练习

网络子网划分练习 1.背景: 在一个仓储企业网络拓朴结构如图1-所示,该企业占地500亩。有五层办公楼1栋,大型仓库10栋。每栋仓库内、外部配置视频监控16台,共计安装视频监控160台,Switch A、服务器、防火墙、管理机、Rou…

UE4/5数字人MetaHuman通过已有动画进行修改

目录 通过已有动画修改动画 开始制作 创建一个关卡序列 将动画序列烘焙到控制绑定 打开我们自己创建的动画序列 之后便是烘焙出来 通过已有动画修改动画 首先架设我们已经有相关的MetaHuman的动画,但是这个动画因为是外部导入进来的,所以可能会出…

基于微信小程序的刷题考试系统设计与实现(适用于各类考试类、答题类程序)

文章目录 前言系统主要功能:具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序(小蔡coding)有保障的售后福利 代码参考源码获取 前言 💗博主介绍:✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计…