memory consistency

news2024/12/27 11:27:35

memory consistency model

        定义了对于programmer和implementor来说,访问shared memory system的行为;

        对于programmer而言,他知道期望值是什么, 知道会返回什么样的数据;;

        对于implementro而言,他知道应该取怎么实现,知道需要提供什么样的数据;

shared memory的访问,会带来什么问题?

 本意是,想要在flag==SET时,获取r2的内容为NEW;
 但是如果core1 进行reorder, S2先执行,S1后执行,则可能拿到的数据为0(初始值);

因为core可以进行重排序,因此,如果core c1先执行S2(有可能,因为两个store地址不同),则可能会拿到r2=0, 而不是预期的new;

有哪些reorder memory access的方式?

  •  store-store reordering

        如果一个core的write buffer不是fifo结构的,则两个store可能会被重排序;

        例如:

                如果第一个store在cache中是miss的,第二个是hit的;

                或者第二个store可以与更早的进行merge;

        所以,即使core是按照po的顺序来执行的,reorder也可能发生;

        对于单个thread而言,究竟以什么顺序执行无所谓,但是多余多线程,如上图所示,其执行的顺序,就会影响程序预期的结果;

  • load-load reordering

        现代的动态调度的core, 可能执行顺序与po不同。例如,在上面的例子中,Core C2, 可能会先执行L1, 再执行L2, 抑或相反;

        对于单线程而言,这种乱序,不会有影响,因为其地址是不同的;

        对于多线程而言,如果两个core之间,存在相同地址的访问,则可能出现如图所示的各种执行顺序,对程序的执行结果,也会有相应影响;

  • Load-store and store-load reordering.

        对于不同地址的store和load,也会发生乱序;

        考虑load,xxx, store, 乱序后,可能会有各种问题,例如load/store本来是受lock保护的,store是release lock, 如果交换了顺序,此load不再受保护;

        考虑store, xxx, load,如下图所示:

        store-load reorder, 会导致r1/r2的值,都读到0;
        这个例子,也是满足SWMR Invariant的,所以造成这个的原因,与coherence没关系;

        需要注意的是,store-load reordering, 可能也是因为FIFO write buffer的local bypassing造成的,所以,即使core是按照PO的顺序来执行,也可能导致程序未按照预期执行;

这些例子都引出一个问题:对于一段特定的programm order的程序,其具体的执行结果,是不确定的;Thus, we must consider non-determinism when defining shared memory behavior(因此,在定义共享内存行为时,我们必须考虑不确定性。)

        

什么是memory consistency model?

上面的例子说明了,share memory的具体行为是微妙的,所以这就使得解决:

  • programmer可以预期怎样的行为;
  • implementors可以做什么样的优化;

 这两个问题有了意义;

memory consistency model就是为了解决这两个问题;

  • 它是定义了多线程访问share memory的一种规范;
  • 对于多线程,如果给定了输入数据,它定义了load可能返回的值;
  • 不同于单线程,多线程通常有多个正确的行为;

通常情况下, memory consistency model(MC)定义的rule支持两种规则:

  • 需要服从MC的partiion
  • 以及不需要服从MC的partition;

memory consistency model VS memery coherence

  • coherence只是简单的提供给处理器piple一个抽象的memory system;
  • 它自己并不能决定shared memory behavior, 而是要受pipeline的影响;
    • 例如,pipeline对memory operation进行了reorder, coherence即使工作正确,对share memory的操作也是错误的;
  • In summary:
    • Cache coherence does not equal memory consistency. 
    • A memory consistency implementation can use cache coherence as a useful “black box.” 
    • consistency model由core pipeline与一致性协议相结合来实现;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1646057.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

npy文件如何追加数据?

.npy 文件是 NumPy 库用于存储数组数据的二进制格式,它包含一个描述数组结构的头部信息和实际的数据部分。直接追加数据到现有的 .npy 文件并不像文本文件那样直接,因为需要手动修改文件头部以反映新增数据后的数组尺寸,并且要确保数据正确地…

电子信息工程专业就业前景怎么样

电子信息工程专业的就业前景十分广阔,主要得益于现代社会对信息技术的依赖不断加深以及科技的快速发展,以下是上大学网(www.sdaxue.com)对该专业就业前景的具体分析,供大家参考! 行业需求广泛:随…

Partisia Blockchain 生态zk跨链DEX上线,加密资产将无缝转移

在 5 月 1 日,由 Partisia Blockchain 与 zkCross 创建合作推出的 Partisia zkCrossDEX 在 Partisia Blockchain 生态正式上线。Partisia zkCrossDEX 是 Partisia Blockchain 上重要的互操作枢纽,其融合了 zkCross 的 zk 技术跨链互操作方案,…

vue2实现生成二维码和复制保存图片功能(复制的同时会给图片加文字)

<template><divstyle"display: flex;justify-content: center;align-items: center;width: 100vw;height: 100vh;"><div><!-- 生成二维码按钮和输入二维码的输入框 --><input v-model"url" placeholder"输入链接" ty…

重写muduo之EPollPoller

1、EPollPoller.h EPollPoller的主要实现&#xff1a;作为poller的派生类&#xff0c;把基类给派生类保留的这些纯虚函数的接口实现出来。 override表示在派生类里面&#xff0c;这些方法是覆盖方法。必须由编译器来保证在基类里面一定有这些函数的接口的声明。在派生类要重写…

[蓝桥杯2024]-PWN:ezheap解析(堆glibc2.31,glibc2.31下的double free)

查看保护 查看ida 大致就是只能创建0x60大小的堆块&#xff0c;并且uaf只能利用一次 完整exp&#xff1a; from pwn import* #context(log_leveldebug) pprocess(./ezheap2.31)def alloc(content):p.sendlineafter(b4.exit,b1)p.send(content) def free(index):p.sendlineaft…

代码随想录算法训练营DAY46|C++动态规划Part8|139.单词拆分、多重背包理论基础、背包问题总结篇

文章目录 139.单词拆分思路CPP代码 多重背包理论基础处理输入把所有个数大于1的物品展开成1个开始迭代&#xff0c;计算dp数组代码优化 背包问题总结篇 139.单词拆分 力扣题目链接 文章讲解&#xff1a;139.单词拆分 视频讲解&#xff1a;你的背包如何装满&#xff1f;| LeetCo…

体育老师工资高吗,奖金有吗

教师的薪资水平与多种因素相关&#xff0c;包括教育经验、工作地点、学校类型以及个人的教学成果等。在讨论体育教师的工资问题时&#xff0c;不能仅仅关注数字&#xff0c;更应了解教育价值和个人发展。 初中体育教师的工资水平受多种因素影响。根据网络统计的数据&#xff0c…

STM32F4xx开发学习—GPIO

GPIO 学习使用STM32F407VET6GPIO外设 寄存器和标准外设库 1. 寄存器 存储器映射 存储器本身是不具有地址的&#xff0c;是一块具有特定功能的内存单元&#xff0c;它的地址是由芯片厂商或用户分配&#xff0c;给存储器分配地址的过程就叫做存储区映射。给内存单元分配地址之后…

页面多开、谷歌浏览器解决不能批量打开问题、批量打开被限制

目录 问题原因谷歌浏览器解决办法来看效果 问题 我们使用批量打开页面的时候 只能打开第一个页面 原因 这种问题是因为 浏览器限制了浏览器的弹出 并不是人家页面功能不能用 谷歌浏览器解决办法 在浏览器输入这个路径 chrome://settings/content/popups?search%E9%87%…

Vue MVVM这一篇就够啦!

Vue vs React 相似之处: 它们都有使用 Virtual DOM虚拟DOM-CSDN博客&#xff1b;提供了响应式&#xff08;Reactive&#xff09;和组件化&#xff08;Composable&#xff09;的视图组件。将注意力集中保持在核心库&#xff0c;而将其他功能如路由和全局状态管理交给相关的库。R…

Python安装以及环境配置

目录 一、下载安装包二级目录三级目录 一、下载安装包 方式网址Python官网python.org镜像下载地址Download pythonpycharmDownload PyCharm https://blog.csdn.net/sun80760/article/details/135256627 二级目录 三级目录

Spring+SpringMVC+Jsp实现校园二手交易系统

前言介绍 在社会快速发展的影响下&#xff0c;使校园二手交易系统的管理和运营比过去十年更加理性化。依照这一现实为基础&#xff0c;设计一个快捷而又方便的网上校园二手交易系统是一项十分重要并且有价值的事情。对于传统的管理控制模型来说&#xff0c;网上校园二手交易系…

C++构造函数和析构函数的调用顺序

一般情况下&#xff0c;调用析构函数的次序正好与调用构造函数的次序相反&#xff0c;也就是最先被调用的构造函数&#xff0c;其对应的析构函数最后被调用&#xff0c;而最后被调用的构造函数&#xff0c;其对应的析构函数最先被调用。 当然对象的构造函数和析构函数调用时机和…

图片浏览器-PicView

一、前言 PicView 是一款适用于 Windows 10 或 11 的快速高效的图像查看器&#xff0c;配备了干净简洁的用户界面&#xff0c;可以在不需要时方便地隐藏。 二、支持类型 它支持广泛的图像文件类型&#xff0c;包括&#xff1a;WEBP、GIF、SVG、PNG、JXL、HEIC、PSD 三、软件特…

Docker 的网络实现

简介 标准的 Docker 支持以下 4 类网络模式&#xff1a; 1&#xff09;host 模式&#xff1a;使用 --nethost 指定 2&#xff09;container 模式&#xff1a;使用–netcontainer:NAME_or_ID 指定 3&#xff09;none模式&#xff1a;使用 --netnone 指定 4&#xff09;bridge 模…

2.5W字 一文读懂汽车智能座舱的FLASH 存储市场、技术

吃瓜群众&#xff1a;机哥&#xff0c;存储是什么玩意&#xff0c;我买手机、电脑的时候导购员都说买内存大的&#xff0c;三星的好&#xff0c;品牌大&#xff0c;问题少&#xff0c;我也只有看哪个内存大就买那个。 机哥&#xff1a;额&#xff0c;这个嘛&#xff0c;说来话长…

SpringBoot+Vue+Element-UI实现学生综合成绩测评系统

前言介绍 学生成绩是高校人才培养计划的重要组成部分&#xff0c;是实现人才培养目标、培养学生科研能力与创新思维、检验学生综合素质与实践能力的重要手段与综合性实践教学环节。而学生所在学院多采用半手工管理学生成绩的方式&#xff0c;所以有必要开发学生综合成绩测评系…

Day62:单调栈 LeedCode503. 下一个更大元素 II 42. 接雨水

503. 下一个更大元素 II 给定一个循环数组 nums &#xff08; nums[nums.length - 1] 的下一个元素是 nums[0] &#xff09;&#xff0c;返回 nums 中每个元素的 下一个更大元素 。 数字 x 的 下一个更大的元素 是按数组遍历顺序&#xff0c;这个数字之后的第一个比它更大的数…

分布式与一致性协议之ZAB协议(三)

ZAB协议 主节点崩溃了&#xff0c;怎么办&#xff1f; 众所周知&#xff0c;系统在运行中不可避免会出现各种各样的问题&#xff0c;比如进程崩溃了、服务器死机了&#xff0c;这些问题会导致很严重的后果&#xff0c;让系统没办法继续运行。在ZAB协议中&#xff0c;写请求是…