深入理解Go语言GC机制

news2025/1/12 12:15:02

1、Go 1.3之前的标记-清除(mark and sweep)算法

Go 1.3之前的时候主要用的是普通的标记-清除算法,此算法主要由两个主要的步骤:

  • 标记(Mark phase)
  • 清除(Sweep phase)
1)、标记-清除算法的具体步骤

第一步,暂停程序业务逻辑,分类出可达和不可达的对象,然后做上标记

图中表示是程序与对象的可达关系,目前程序的可达对象有对象1->2->3,对象4->7等五个对象

第二步,开始标记,程序找出它所有可达的对象,并做上标记

对象1->2->3、对象4->7等五个对象被做上标记

第三步,标记完了之后,然后开始清除未标记的对象

操作非常简单,但是有一点需要额外注意:mark and sweep算法在执行的时候,需要程序暂停,即STW(stop the world)。STW的过程中,CPU不执行用户代码,全部用于垃圾回收,这个过程影响很大,所以STW也是一些回收机制最大的难题和希望优化的点。所以在执行第三步的这段时间,程序会暂停任何工作,卡在那等待回收执行完毕

第四步,停止暂停,让程序继续运行,然后重复这个过程,直到进程生命周期结束

2)、标记-清除的缺点

标记-清除算法明了,过程鲜明干脆,但是也有非常严重的问题

  1. STW让程序暂停,程序出现卡顿(重要问题
  2. 标记需要扫描整个heap
  3. 清除数据会产生heap碎片

Go 1.3版本之前就是以上来实施的,在执行GC的基本流程就是首先启动STW暂停,然后执行标记,再执行数据回收,最后停止STW

在这里插入图片描述

从上图来看,全部的GC时间都是包裹在STW范围之内的,这样貌似程序暂停的时间过长,影响程序的运行性能。所以Go 1.3做了简单的优化,将STW的步骤提前,减少STW暂停的时间范围

在这里插入图片描述

上图主要是将STW的步骤提前了一步,因为在sweep清除的时候,可以不需要STW停止,因为这些对象已经是不可达对象了,不会出现回收写冲突等问题

但是无论怎么优化,Go 1.3都面临这个一个重要问题,就是标记-清除算法会暂停整个程序

2、Go 1.5的三色并发标记法

Go中的垃圾回收主要应用三色标记法,GC过程和其他用户goroutine可并发运行,但需要一定时间的STW,所谓三色标记法实际上就是通过三个阶段的标记来确定清除的对象都有哪些

1)、三色标记法的过程

第一步,每次新创建的对象,默认的颜色都是标记为白色

如上图所示,左边为程序可抵达的内存对象关系,右边的标记表用来记录目前每个对象的标记颜色分类。这里需要注意的是,所谓程序则是一些对象的根结点集合。所以我们如果将程序展开,会得到类似如下图的表现形式

第二步,每次GC回收开始,会从根节点开始遍历所有对象,把遍历到的对象从白色集合放入灰色集合

这里要注意的是,本次遍历是一次遍历,非递归形式,是从程序抽出可抵达的对象遍历一层,如上图所示,当前可抵达的对象是对象1和对象4,那么自然本轮遍历结束,对象1和对象4就会被标记为灰色,灰色标记表就会多出这两个对象

第三步,遍历灰色集合,将灰色对象引用的对象从白色集合放入灰色集合,之后将此灰色对象放入黑色集合

这一次遍历是只扫描灰色对象,将灰色对象的第一层遍历可抵达的对象由白色变为灰色,如对象2、对象7。而之前的灰色对象1和对象4则会被标记为黑色,同时由灰色标记表移动到黑色标记表中

第四步,重复第三步,直到灰色中无任何对象

当全部的可达对象都遍历完后,灰色标记表将不再存在灰色对象,目前全部内存的数据只有两种颜色,黑色和白色。那么黑色对象就是我们程序逻辑可达(需要的)对象,这些数据是目前支撑程序正常业务运行的,是合法的有用数据,不可删除,白色的对象是全部不可达对象,目前程序逻辑并不依赖它们,那么白色对象就是内存中目前的垃圾数据,需要被清除

第五步,回收所有的白色标记表的对象,也就是垃圾回收

将全部的白色对象进行删除回收,剩下的就是全部依赖的黑色对象

以上便是三色并发标记法,不难看出,上面已经清楚的体现三色的特性。但是这里面可能会有很多并发流程均会被扫描,执行并发流程的内存可能相互依赖,为了在GC过程中保证数据的安全,我们在开始三色标记之前就会加上STW,在扫描确定黑白对象之后再放开STW。但是很明显这样的GC扫描的性能实在是太低了

2)、没有STW的三色标记法

假设没有STW,那么也就不会再存在性能上的问题。那么接下来假设如果三色标记法不加入STW会发生什么事情?

当前已经经历了第一轮扫描,目前黑色的有对象1和对象4,灰色的有对象2和对象7,其他的为白色对象,且对象2是通过指针p指向对象3的,如下图所示:

现在如果三色标记过程不启动STW,那么在GC扫描过程中,任意的对象均可能发生读写操作,如下图所示,在还没有扫描到对象2的时候,已经标记为黑色的对象4,此时创建指针q,并且指向白色的对象3

与此同时灰色的对象2将指针p移除,那么白色的对象3实则就是被挂在了已经扫描完成的黑色的对象4下,如下图所示:

然后正常执行三色标记的算法逻辑,将所有灰色的对象标记为黑色,那么对象2和对象7就被标记为了黑色,如下图所示:

那么就执行了三色标记的最后一步,将所有白色对象当做垃圾进行回收,如下图所示:

但是本来是对象4合法引用的对象3却被GC给误杀回收掉了

3)、触发三色标记法不安全的必要条件

可以看出,有两种情况在三色标记法中是不希望被发生的

  • 条件1:一个白色对象被黑色对象引用(白色被挂在黑色下
  • 条件2:灰色对象与它之间的可达关系的白色对象遭到破坏(灰色同时丢了该白色

如果当以上两个条件同时满足时,就会出现对象丢失现象

并且,如图所示的场景中,如果示例的白色对象3还有很多下游对象的恶化,也会一并都清理掉

为了防止这种现象的发生,最简单的方式就是STW,直接禁止掉其他用户程序对对象引用关系的干扰,但是STW的过程有明显的资源浪费,对所有的用户程序都有很大影响。那么是否可以在保证对象不丢失的情况下合理的尽可能的提高GC效率,减少STW时间呢?答案是可以的,只要使用一种机制,尝试去破坏上面的两个必要条件就可以了

3、屏障机制

让GC回收器满足下面两种情况之一时,即可保证对象不丢失。这两种方式就是强三色不变式和弱三色不变式

1)、强弱三色不变式

强三色不变式:

不存在黑色对象引用到白色对象的指针

强三色不变式实际上是强制性的不允许黑色对象引用白色对象,这样就不会出现有白色对象被误删的情况

弱三色不变式:

所有被黑色对象引用的白色对象都处于灰色保护状态

弱三色不变式强调,黑色对象可以引用白色对象,但是这个白色对象必须存在其他灰色对象对它的引用,或者可达它的链路上游存在灰色对象。这样实则是黑色对象引用白色对象,白色对象处于一个危险被删除的状态,但是上游灰色对象的引用,可以保护该白色对象,使其安全

为了遵循上述的两个方式,GC算法演进到两种屏障方式:插入屏障、删除屏障

2)、插入屏障

具体操作:在A对象引用B对象的时候,B对象被标记为灰色(将B挂在A下游,B必须被标记为灰色)

满足:强三色不变式(不存在黑色对象引用到白色对象的情况了,因为白色会强制变为灰色)

伪代码:

添加下游对象(当前下游对象slot, 新下游对象ptr) {   
  // 1
  标记灰色(新下游对象ptr)   
  // 2
  当前下游对象slot = 新下游对象ptr  				  
}

场景:

A.添加下游对象(nil, B)  // A之前没有下游,新添加一个下游对象B,B被标记为灰色
A.添加下游对象(C, B)    // A将下游对象C更换为B,B被标记为灰色

这段伪代码逻辑就是写屏障。黑色对象的内存槽有两种位置,栈和堆。栈空间的特点是容量小,但是要求响应速度快,因为函数调用弹出频繁使用,所以插入屏障机制在栈空间的对象操作中不使用,而仅仅使用在堆空间对象的操作中

但是如果栈不添加,当全部三色标记扫描之后,栈上有可能依然存在白色对象被引用的情况(如上图的对象9)。所以要对栈重新进行三色标记扫描,但这次为了对象不丢失,要对本次扫描启动STW暂停,直到栈空间的三色标记结束

最后将栈和堆空间扫描剩余的全部白色节点清除。这次STW大约的时间在10-100ms间

3)、删除屏障

具体操作:被删除的对象,如果自身为灰色或者白色,那么被标记为灰色

满足:弱三色不变式(保护灰色对象到白色对象的路径不会断)

伪代码:

添加下游对象(当前下游对象slot, 新下游对象ptr) {
  // 1
  if (当前下游对象slot是灰色 || 当前下游对象slot是白色) {
  		标记灰色(当前下游对象slot)  // slot为被删除对象,标记为灰色
  }
  // 2
  当前下游对象slot = 新下游对象ptr
}

场景:

A.添加下游对象(B, nil)  // A对象删除B对象的引用.B被A删除,被标记为灰(如果B之前为白)
A.添加下游对象(B, C)    // A对象更换下游B变成C.B被A删除,被标记为灰(如果B之前为白)

这种方式的回收精度低,一个对象即使被删除了最后一个指向它的指针也依旧可以活过这一轮,在下一轮GC中被清理掉

4、Go 1.8的混合写屏障(hybrid write barrier)机制

插入屏障和删除屏障的短板:

  • 插入屏障:结束时需要STW来重新扫描栈,标记栈上引用的白色对象的存活
  • 删除屏障:回收精度低,GC开始时STW扫描堆栈来记录初始快照,这个过程会保护开始时刻的所有存活对象

Go 1.8版本引入了混合写屏障机制(hybrid write barrier),避免了对栈re-scan的过程,极大的减少了STW的时间,结合了两者的优点

1)、混合写屏障规则

具体操作:

  1. GC开始将栈上的对象全部扫描并标记为黑色(之后不再进行第二次重复扫描,无需STW)
  2. GC期间,任何在栈上创建的新对象均为黑色
  3. 堆上被删除的对象标记为灰色
  4. 堆上被添加的对象标记为灰色

混合写屏障实际上满足的是一种变形的弱三色不变式。它的伪代码如下:

添加下游对象(当前下游对象slot, 新下游对象ptr) {
  // 1 
  标记灰色(当前下游对象slot)  // 只要当前下游对象被移走,就标记灰色
  // 2 
  标记灰色(新下游对象ptr)
  // 3
  当前下游对象slot = 新下游对象ptr
}

注意:屏障技术不在栈上应用,因为要保证栈的运行效率。混合写屏障是GC的一种屏障机制,所以只是当程序执行GC的时候,才会触发这种机制

2)、混合写屏障的具体场景分析
1)GC开始:扫描栈区,将可达对象全部标记为黑
2)场景一: 对象被一个堆对象删除引用,成为栈对象的下游

场景1主要描述的是对象被堆对象删除引用,成为栈对象的下游情况,伪代码如下:

// 前提:堆对象4->对象7 = 对象7;  // 对象7被对象4引用
栈对象1->对象7 = 堆对象7;  // 将堆对象7挂在栈对象1下游
堆对象4->对象7 = null;    // 对象4删除引用对象7
3)场景二: 对象被一个栈对象删除引用,成为另一个栈对象的下游

场景2主要描述的是对象被一个栈对象删除引用,成为另一个栈对象的下游情况,伪代码如下:

new 栈对象9;
对象8->对象3 = 对象3;  // 将栈对象3挂在栈对象9下游
对象2->对象3 = null;  // 对象2删除引用对象3
4)场景三:对象被一个堆对象删除引用,成为另一个堆对象的下游

场景3主要描述的是对象被一个堆对象删除引用,成为另一个堆对象下游的情况,伪代码如下:

堆对象10->对象7 = 堆对象7;  // 将堆对象7挂在堆对象10下游
堆对象4->对象7 = null;     // 对象4删除引用对象7
5)场景四:对象从一个栈对象删除引用,成为另一个堆对象的下游

场景4主要描述的是对象从一个栈对象被删除引用,成为另一个堆对象的下游情况,伪代码如下:

堆对象10->对象7 = 堆对象7;  // 将堆对象7挂在堆对象10下游
堆对象4->对象7 = null;     // 对象4删除引用对象7

Go中的混合写屏障满足弱三色不变式,结合了删除屏障和插入屏障的优点,只需要在开始时并发扫描各个goroutine的栈,使其变黑并一直保持,这个过程不需要STW,而标记结束后,因为栈在扫描后始终是黑色的,也无需再进行re-scan操作了,减少了STW的时间

6、小结

Go 1.3使用普通标记清除法,整体过程需要启动STW,效率极低

Go 1.5使用三色标记法, 堆空间启动写屏障,栈空间不启动,全部扫描之后,需要重新扫描一次栈(需要STW),效率普通

Go 1.8使用三色标记法,混合写屏障机制, 栈空间不启动,堆空间启动。整个过程几乎不需要STW,效率较高

参考:

Golang三色标记混合写屏障GC模式全分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1281868.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

geemap学习笔记019:监督分类与精度验证(上)

前言 上一节中介绍了非监督分类,今天就详细介绍一下监督分类与精度验证。从这一节开始,我也是配置了本地的geemap,就可以不用colab了,配置也是花了挺长时间,但好在也是能够成功应用了,准备用两节的时间介绍…

【备忘干货】c/c++ (wasm)和js互相调用记录

c/c(wasm)和js互相调用记录 废话 :)准备工作:安装Emscripten初探:C(wasm)之hello world进一步探究:接口调用1.js调用c,一些基本类型的传递(char*,int,float)以…

博客访问量到达2万了!

博客访问量到达2万了!这也发生的太快了吧,前两天才1万7千访问量,用了平台送的1500的流量券,粉丝从1个(N年前的),蹭蹭的往上涨,这也太“假”了吧。关键我也是个菜鸟自学者&#xff0c…

前端组件库开发

通常我们会使用很多组件库,有时候我们会去看源码比如element,antd,然后发现多少是按需导出,和vue.use全局注册,依赖于框架的拓展。 组件库的开发依赖框架的版本和node的版本,这个是需要说明的,然…

Redis--15--缓存穿透 击穿 雪崩

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录 缓存穿透 击穿 雪崩运行速度:1 缓存穿透问题描述:如何解决: 2 缓存击穿问题描述:如何解决: 3 缓存雪崩说明:解决方案: 缓存穿透 击穿 雪崩 问题描述: 由于海量的用…

BurpSuite 请求/响应解密插件开发

BurpSuite 请求/响应解密插件开发 本文主要记录如何利用burp官方的新版API即MontoyaApi 写一个请求/响应的解密插件。背景下面是主要的操作步骤:根据上述操作做完之后,生成,然后在burp中加载插件,然后通关抓包看效果,具…

VSCode 中将头文件和头文件函数分离,编译主函数跳出 undefined reference to 的问题解决

VSCode 编写 C (.h,.cpp 文件分离)代码,编写完成后,编译遇到了编译错误 undefined reference to xxx。 开始还以为使用了 -stdc20 而不能使用 #include “xxx.h" 方式头文件,但仔细一想虽然引入了 im…

Java 不要在父类的构造方法里面调用可以被子类重写的方法

不要在父类的构造方法(代码块)里面调用可以被子类重写的方法 我们从第一天学习Java开始,就对Java的类初始化顺序牢记于心。但是在实际开发过程中,似乎很难能接触这一部分的应用。在这之前,我也认为它只是面试中八股文而已,直到最…

版本依赖冲突问题排查过程记录

问题 开发平台在集成minio时&#xff0c;pom引入了sdk。 <dependency><groupId>io.minio</groupId><artifactId>minio</artifactId><version>8.5.7</version> </dependency>在调用上传文件API时&#xff0c;控制台报错&…

JDK1.8_X64在LINUX下安装

JDK1.8在LINUX下安装步骤&#xff1a; 在/usr/lib/目录下新建jvm文件夹&#xff0c;如果已有jvm文件夹&#xff0c;则将之前的JDK版本删除&#xff0c;即在jvm目录下执行命令&#xff1a;rm–rf *将JDK文件jdk-8u40-linux-x64.gz拷贝到/home/目录下&#xff1b;在/home/目录下…

探索JavaScript BOM:了解浏览器的内部机制和强大的API

​&#x1f308;个人主页&#xff1a;前端青山 &#x1f525;系列专栏&#xff1a;JavaScript篇 &#x1f516;人终将被年少不可得之物困其一生 依旧青山,本期给大家带来JavaScript篇专栏内容:JavaScript-BOM的概念和常用API BOM的概念和常用API BOM BOM&#xff08;Browser O…

免费网站快速收录工具,2023最新网站收录方法

在当今数字化时代&#xff0c;拥有一个被搜索引擎快速收录的网站对于个人、企业或机构而言至关重要。网站的快速收录意味着更广泛的曝光和更多的访问流量&#xff0c;这对于网络存在的任何实体都是非常有价值的。 网站快速收录的重要性 在庞大的互联网世界中&#xff0c;一切…

精神衰弱怎么办?如何改变精神衰弱?

精神衰弱也叫神经衰弱&#xff0c;跟个人体质有一定的关系&#xff0c;更多是因为环境因素的长期作用所致&#xff0c;比如长期处于紧张和压力之下&#xff0c;这容易产生精神衰弱。当下有个流行词叫“精神内耗”&#xff0c;这个严重的精神内耗其实同样会导致精神衰弱。 精神…

使用Prometheus监控Padavan路由器

Prometheus监控Padavan路由器 1、背景 近期在Synology&#xff08;群辉&#xff09;中安装一套Prometheus监控程序&#xff0c;目前已经监控Synology&#xff0c;然后家中有有路由器&#xff08;Padavan&#xff09;型号&#xff0c;也准备使用PrometheusGrafan进行监控。 ‍…

计算机网络扫盲(4)——时延

一、概述 在这里&#xff0c;我们考虑分组交换网的情况&#xff0c;因特网可以被看成是一种基础设施&#xff0c;该基础设施为运行在端系统上的分布式应用提供服务。在理想情况下&#xff0c;我们希望因特网服务能够在任意两个端系统之间随心所欲地移动数据而没有任何数据地丢失…

智能优化算法应用:基于海洋捕食者算法无线传感器网络(WSN)覆盖优化 - 附代码

智能优化算法应用&#xff1a;基于海洋捕食者算法无线传感器网络(WSN)覆盖优化 - 附代码 文章目录 智能优化算法应用&#xff1a;基于海洋捕食者算法无线传感器网络(WSN)覆盖优化 - 附代码1.无线传感网络节点模型2.覆盖数学模型及分析3.海洋捕食者算法4.实验参数设定5.算法结果…

已解决:虚拟机集群xsehll连接不上

问题描述&#xff1a; hadoop102能连上&#xff0c;hadoop103、hadoop104无法连接&#xff0c;以前都能连上&#xff0c;今天突然就连不上了 解决方案&#xff1a; 使用ifconfig命令查看有没有ens33 如果没有的话那就证明你的问题和我一样 依次使用以下命令&#xff1a; sys…

Docker 简介,Docker 安装——3

目录&#xff1a; Docker 简介 什么是虚拟化、容器化&#xff1f;为什么要虚拟化、容器化&#xff1f;虚拟化实现方式 应用程序执行环境分层虚拟化常见类别 虚拟机容器JVM 之类的虚拟机常见虚拟化实现 主机虚拟化(虚拟机)实现容器虚拟化实现 容器虚拟化实现原理容器虚拟化基础…

SSM新闻发布管理系统

SSM毕设分享 序号1&#xff1a;SSM新闻发布管理系统 1 项目简介 Hi&#xff0c;各位同学好&#xff0c;这里是郑师兄&#xff01; 今天向大家分享一个毕业设计项目作品【SSM新闻发布管理系统】 师兄根据实现的难度和等级对项目进行评分(最低0分&#xff0c;满分5分) 难度系数…

人工智能发展史

人工智能&#xff08;AI&#xff09;的发展史是一段跨越数十年的旅程&#xff0c;涵盖了从早期理论探索到现代技术革新的广泛内容。人工智能的发展历程展示了从最初的概念探索到现代技术突破的演变。尽管经历了多次起伏&#xff0c;但AI领域持续进步&#xff0c;不断拓展其应用…