一文搞懂堆外内存(模拟内存泄漏)

news2024/10/5 23:31:03

一、前言

平时编程时,在 Java 中创建对象,实际上是在堆上划分了一块区域,这个区域叫堆内内存

  • 使用这 -Xms -Xmx 来指定新生代老年代空间大小的初始值和最大值,这初始值和最大值也被称为 Java 堆的大小,即 堆内内存大小。
  • 这个堆内内存完全受 JVM 管理JVM 有垃圾回收机制,所以我们一般不必关系对象的内存如何回收。

剖开 JVM 内存模型,来看下其堆划分:

由图可知 Java8 使用元空间替代永久代且元空间放在堆外内存上,这是为啥?

  1. 类的元数据信息常用到,在 GC 时回收效率偏低。
  2. 类的元数据信息比较难以确定其大小,指定太小容易出现永久代溢出、指定太大则容易造成老年代溢出。

那什么是堆外内存?

堆外内存与堆内内存相对应,对于整个机器内存而言,除堆内内存以外部分即为堆外内存

Java 程序一般使用 -XX:MaxDirectMemorySize 来限制最大堆外内存

还有个问题:堆外内存属于用户空间还是内核空间? 用户空间。

(1)为什么需要堆外内存?

使用堆外内存,有这些好处:

  1. 直接使用堆外内存可以减少一次内存拷贝: 当进行网络 I/O 操作、文件读写时,堆内内存都需要转换为堆外内存,然后再与底层设备进行交互。
  2. 降低 JVM GC 对应用程序影响:因为堆外内存不受 JVM 管理。
  3. 堆外内存可以实现进程之间、JVM 多实例之间的数据共享。

那我就有个问题:为什么使用堆外内存可以减少一次内存拷贝呢?

原因:当进行网络 I/O操作或文件读写时,如果使用堆内内存(HeapByteBufferJDK 会先创建一个堆外内存(DirectBuffer,再去执行真正的读写操作。

具体原因是:调用底层系统函数(writeread等),必须要求使用是连续的地址空间

  1. 操作系统并不感知 JVM 的堆内存,而且 JVM 的内存布局与操作系统所分配的是不一样的,操作系统并不会按照 JVM 的行为来读写数据。
  2. 同一个对象的内存地址随着 JVM GC 的执行可能会随时发生变化,例如 JVM GC 的过程中会通过压缩来减少内存碎片,这就涉及对象移动的问题了。

当然使用堆外内存,有这些弊端:

  1. 排查内存泄漏问题相对困难: 因为堆外内存需要手动释放,不熟悉对应框架源码,可能稍有不慎就会造成应用程序内存泄漏。
  2. 对开发人员的基础技能要求高。

由此可以看出,如果想实现高效的 I/O 操作、缓存常用的对象、降低 JVM GC 压力,堆外内存是一个非常不错的选择。

(2)如何分配堆外内存?

Java 中堆外内存的分配方式有两种:

  1. NIO类中的ByteBuffer#allocateDirect

  2. Unsafe#allocateMemory

首先来看下 Java NIO 包中的 ByteBuffer 类的分配方式,使用方式如下:

// 分配 10M 堆外内存
ByteBuffer byteBuffer = ByteBuffer.allocateDirect(10 * 1024 * 1024);
// 释放堆外内存
((DirectBuffer) byteBuffer).cleaner().clean();

跟进 ByteBuffer.allocateDirect 源码,发现其中直接调用的 DirectByteBuffer 构造函数:

DirectByteBuffer(int cap) { 
    super(-1, 0, cap, cap);
    boolean pa = VM.isDirectMemoryPageAligned();
    int ps = Bits.pageSize();
    long size = Math.max(1L, (long)cap + (pa ? ps : 0));
    Bits.reserveMemory(size, cap);  // 注意这里会调用 System.gc();

    long base = 0;
    try {
        // 1\. 真正分配堆外内存
        base = unsafe.allocateMemory(size);
    } catch (OutOfMemoryError x) {
        Bits.unreserveMemory(size, cap);
        throw x;
    }
    unsafe.setMemory(base, size, (byte) 0);
    if (pa && (base % ps != 0)) {
        // Round up to page boundary
        address = base + ps - (base & (ps - 1));
    } else {
        address = base;
    }
    // 2\. 用于回收堆外内存
    cleaner = Cleaner.create(this, new Deallocator(base, size, cap));
    att = null;
}

DirectByteBuffer 对象: 存放在堆内存里,仅仅包含堆外内存的地址、大小等属性。同时还会创建对应的 Cleaner 对象,通过 ByteBuffer 分配的堆外内存不需要手动回收,它可以被 JVM 自动回收。

当堆内的 DirectByteBuffer 对象被 GC 回收时,Cleaner 就会用于回收对应的堆外内存

真正分配堆外内存的逻辑还是通过 unsafe.allocateMemory(size)

Unsafe 是一个非常不安全的类,它用于执行内存访问、分配、修改等敏感操作,可以越过 JVM 限制的枷锁。Unsafe 最初并不是为开发者设计的,使用它时虽然可以获取对底层资源的控制权,但也失去了安全性的保证,所以使用 Unsafe 一定要慎重。

在 Java 中是不能直接使用 Unsafe 的,但是可以通过反射获取 Unsafe 实例,使用方式如下所示:

private static Unsafe unsafe = null;

static {
    try {
        Field getUnsafe = Unsafe.class.getDeclaredField("theUnsafe");
        getUnsafe.setAccessible(true);
        unsafe = (Unsafe) getUnsafe.get(null);
    } catch (NoSuchFieldException | IllegalAccessException e) {
        e.printStackTrace();
    }
}

获得 Unsafe 实例后,可以通过 allocateMemory 方法分配堆外内存,allocateMemory 方法返回的是内存地址,使用方法如下所示:

// 分配 10M 堆外内存
long address = unsafe.allocateMemory(10 * 1024 * 1024);

// Unsafe#allocateMemory 所分配的内存必须自己手动释放,否则会造成内存泄漏
// 这也是 Unsafe 不安全的体现。
unsafe.freeMemory(address);

(3)如何回收堆外内存?

堆外内存回收,有两种方式:

  1. Full GC 时以及调用 System.gc() 通过 JVM 参数 -XX:MaxDirectMemorySize 指定堆外内存的上限大小,当堆外内存的大小超过该阈值时,就会触发一次 Full GC 进行清理回收,如果在 Full GC 之后还是无法满足堆外内存的分配,那么程序将会抛出 OOM 异常。

  2. 使用unsafe.freeMemory(address); 来回收: DirectByteBuffer 在初始化时会创建一个 Cleaner 对象Cleaner 内同时会创建 Deallocator,调用 Deallocator#run() 来回收。

1)System.gc() 触发

那就有个问题,什么时候会触发 System.gc() ?

ByteBuffer.allocateDirect 分配的过程中: 如果没有足够的空间分配堆外内存,在 Bits.reserveMemory 方法中也会主动调用 System.gc() ,就会触发 Full GC(并不是马上执行)。

// ByteBuffer.allocateDirect 直接调用 DirectByteBuffer 构造函数
DirectByteBuffer(int cap) { 
    ... 
    Bits.reserveMemory(size, cap);  // 注意这里会调用 System.gc();
    ...
}

Tips: 如果环境中设置了 -XX:+DisableExplicitGCSystem.gc() 会不起作用的。

所以依赖 System.gc() 并不是一个好办法。

2)Cleaner 对象

通过前面堆外内存分配方式的介绍,我们知道 DirectByteBuffer 在初始化时会创建一个 Cleaner 对象,它会负责堆外内存的回收工作,那么 Cleaner 是如何与 GC 关联起来的呢?

先来看下 Cleaner 的源码:

public class Cleaner extends java.lang.ref.PhantomReference<java.lang.Object> {
    private static final ReferenceQueue<Object> dummyQueue = new ReferenceQueue<>();
    // 双向链表
    private static sun.misc.Cleaner first;
    private sun.misc.Cleaner next;
    private sun.misc.Cleaner prev;

    private final java.lang.Runnable thunk;
    public void clean() {
        if (!remove(this)) // 把自己从链表上移除
            return;
        try {
            thunk.run(); // thunk 是 Deallocator
        } catch (final Throwable x) {
           // ... ...
        }
    }
}

可以看到 Cleaner 属于 PhantomReference 的子类,那 Cleaner#clean() 执行是否跟 JVM GC 或Reference 有关呢?

TipsJava 对象有四种引用方式, 强引用 StrongReference、软引用 SoftReference、弱引用 WeakReference、虚引用 PhantomReference

这里先了解下 Reference 核心处理流程:

  1. JVM 垃圾收集器扫描到对象 O 可回收。

  2. 把对象 O 对应的 Reference 实例 R 添加到 PendingReference 链表中。

  3. 通知 ReferenceHandler 线程处理,最后完成清理逻辑。

下面是其源码:

// Reference.java, 部分代码省略
public abstract class Reference<T> {
    static {
        Thread handler = new ReferenceHandler(tg, "Reference Handler");
        handler.setPriority(Thread.MAX_PRIORITY);
        handler.setDaemon(true);
        handler.start();
    }

    private static class ReferenceHandler extends Thread {
        public void run() {
            while (true) {
                tryHandlePending(true);
            }
        }
    }

    static boolean tryHandlePending(boolean waitForNotify) {
        Reference<Object> r;
        Cleaner c;
        try {
            synchronized (lock) {
                if (pending != null) {
                    r = pending;
                    // 判断是否为 Cleaner
                    c = r instanceof Cleaner ? (Cleaner) r : null;
                    // unlink 'r' from 'pending' chain
                    pending = r.discovered;
                    r.discovered = null;
                } else {
                    // ... ...
                }
            }
        } catch (OutOfMemoryError x) {
            // 等待CG后的通知
            // ... ...
        } catch (InterruptedException x) {
            // ... ...
        }

        // 是为 Cleaner, 则调用 Cleaner.clean() 方法
        if (c != null) {
            c.clean();
            return true;
        }

        ReferenceQueue<? super Object> q = r.queue;
        if (q != ReferenceQueue.NULL) q.enqueue(r);
        return true;
    }
}

总结一下: 当 DirectByteBuffer 被回收的时候,会调用 Cleaner 的 clean() 方法来释放堆外内存。

拓展:Netty 的 noCleaner 策略

Netty 提供分配堆外内存时,不带 Cleaner 的方法:

// UnpooledByteBufAllocator#newDirectBuffer();
// 会创建 InstrumentedUnpooledUnsafeNoCleanerDirectByteBuf 不带 Cleaner

UnpooledUnsafeNoCleanerDirectByteBuf.allocateDirect(); // 创建内存
UnpooledUnsafeNoCleanerDirectByteBuf.freeDirect(); // 释放内存

Tips -XX:MaxDirectMemorySize 无法限制 Netty 中 noCleaner 策略的 DirectByteBuffer(堆外内存)的大小。

需要使用:-Dio.netty.maxDirectMemory

  • 用于限制 **noCleaner 策略下 DirectByteBuffer **分配的最大堆外内存的大小
  • 如果该值为0,则使用 hasCleaner 策略,代码位于PlatformDependent#incrementMemoryCounter() 方法中。

二、案例 堆外内存泄漏

(1)模拟堆外内存泄漏

模拟堆外内存泄漏,设置堆外内存大小 10MB,代码如下:

public class Test {
    // -Xmx10M -XX:MaxDirectMemorySize=10M -Xloggc:gc.log
    private static final int _10MB = 10 * 1024 * 1024;
    public static void main(String[] args) throws Exception {
        List<ByteBuffer> list = new ArrayList<>();
        // 分配 20MB
        list.add(ByteBuffer.allocateDirect(_10MB));
        list.add(ByteBuffer.allocateDirect(_10MB));
    }
}

在 IDEA 里需要设置下 JVM 参数:

运行果如下:

gc.log 日志如下:

OpenJDK 64-Bit Server VM (25.162-b12) for linux-amd64 JRE (1.8.0_162-8u162-b12-1-b12), built on Mar 15 2018 17:19:50 by "buildd" with gcc 7.3.0
Memory: 4k page, physical 16306984k(1783576k free), swap 2097148k(7912k free)
CommandLine flags: -XX:InitialHeapSize=10485760 -XX:MaxDirectMemorySize=10485760 -XX:MaxHeapSize=10485760 -XX:+PrintGC -XX:+PrintGCTimeStamps -XX:+UseCompressedClassPointers -XX:+UseCompressedOops -XX:+UseParallelGC 
0.093: [GC (Allocation Failure)  2048K->701K(9728K), 0.0020135 secs]
0.140: [GC (System.gc())  2147K->857K(9728K), 0.0039815 secs]
0.144: [Full GC (System.gc())  857K->663K(9728K), 0.0069431 secs]

可以看到:分配堆外内存失败,会调用 System.gc(),之后会触发 Full GC

运行上面代码同时,观察 Linux 中所占内存情况:

# 1\. 先找到应用程序对应的 PID
$ jps
# 2\. top 观察
$ top | grep 25131

发现应用程序所占内存( RES)约 40MB,远超堆内内存 10MB 和 堆外内存 10MB

为什么不用 unsafe.allocateMemory() 来模拟分配内存?

因为 Unsafe.allocateMemory() 是系统调用的os::malloc一个包装,并没有关心 VM 要求的内存限制,所以会绕过了 MaxDirectMemorySize 的限制。

可能会写这样的代码:

public class Test {
    private static final int _10MB = 10 * 1024 * 1024;
    public static void main(String[] args) throws Exception {
        Field unsafeField = Unsafe.class.getDeclaredFields()[0];
        unsafeField.setAccessible(true);
        Unsafe unsafe = (Unsafe) unsafeField.get(null);
        while (true) { // 会导致机子直接卡死,直至耗尽内存
            unsafe.allocateMemory(_10MB);
        }
    }
}
// Exception in thread "main" java.lang.OutOfMemoryError
//    at sun.misc.Unsafe.allocateMemory(Native Method)
//    at org.fenixsoft.oom.DMOOM.main(DMOOM.java:20)

最后抛出这个异常 Exception in thread "main" java.lang.OutOfMemoryError,内存溢出才 kill 进程,且代价是期间机子卡死。

那为什么使用 ByteBuffer.allocateDirect() 就不会出现 unsafe 问题呢?

因为其每次分配内存,都会检查进程的内存占用情况并抛出异常。对应代码 Bits.reserveMemory(size, cap);

DirectByteBuffer(int cap) { 
    ...
    // 进行检测
    Bits.reserveMemory(size, cap);  // 注意这里会调用 System.gc();

    ... 
}

所以使用 ByteBuffer.allocateDirect() 相比更为安全些。

(2)美团堆外内存泄漏

WebSocket断开连接后无法正常释放内存,之后添加Packet packet = new Packet(PacketType.MSSAGE)` 就好了,框架能正常识别并释放内存了。

他的排查问题步骤,总结如下:

  1. 看监控:收到监控告警,去监控平台 CAT 查看整个集群的各项指标。
  2. 猜一猜:怀疑可能出现问题的地方,并去 Review 代码。
  3. 硬头皮:查看日志文件,查看对应堆栈信息
  4. 上手段:代码中打点日志来进一步监控(注意:这里直接改生产代码,看生产日志
  5. 模拟下:线下模拟,复现场景,线下验证
  6. 上生产:线上验证

以上就是所有学习啦,Have fun

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/30702.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2022亚太C题赛题分享

是否全球变暖&#xff1f; 加拿大的49.6C创造了地球北纬50以上地区的气温新纪录&#xff0c;一周内数百人死于高温&#xff1b;美国加利福尼亚州死亡谷是54.4C&#xff0c;这是有史以来地球上记录的最高温度&#xff1b;科威特53.5C&#xff0c;甚至在阳光下超过70多个C&#x…

模板进阶模板分离编译的问题与解决

&#x1f9f8;&#x1f9f8;&#x1f9f8;各位大佬大家好&#xff0c;我是猪皮兄弟&#x1f9f8;&#x1f9f8;&#x1f9f8; 文章目录一、模板参数1.非类型模板参数比如库中的array2.类型模板参数二、模板参数的特化1.全特化2.偏特化&#xff08;半特化&#xff09;三、模板的…

RTSP 和 RTMP原理 通过ffmpeg实现将本地摄像头推流到RTSP服务器

RTSP 和 RTMP原理 & 通过ffmpeg实现将本地摄像头推流到RTSP服务器 文章目录RTSP 和 RTMP原理 & 通过ffmpeg实现将本地摄像头推流到RTSP服务器一、流媒体&#xff1a;RTSP 和 RTMP0、参考资料1、RTSP 和 RTMP的工作原理1&#xff09;RTSP工作原理2&#xff09;RTMP工作原…

计算机组成原理期末复习第三章-3(唐朔飞)

计算机组成原理期末复习第三章-3&#xff08;唐朔飞&#xff09; ✨欢迎关注&#x1f5b1;点赞&#x1f380;收藏⭐留言✒ &#x1f52e;本文由京与旧铺原创&#xff0c;csdn首发&#xff01; &#x1f618;系列专栏&#xff1a;java学习 &#x1f4bb;首发时间&#xff1a;&am…

C树和森林的研究学习随记【一】

文章目录树与森林树结构初识树基本的相关概念森林二叉树(Binary Tree)满二叉树【饱满】完全二叉树【少了叶子的满二叉树】总结树和森林的转换快速转换技巧森林转化为二叉树分辨二叉树的五大性质树与森林 树是一种的数据结构。顾名思义&#xff0c;类似于我们生活中的树一样。【…

C++11标准模板(STL)- 算法(std::stable_sort)

定义于头文件 <algorithm> 算法库提供大量用途的函数&#xff08;例如查找、排序、计数、操作&#xff09;&#xff0c;它们在元素范围上操作。注意范围定义为 [first, last) &#xff0c;其中 last 指代要查询或修改的最后元素的后一个元素。 将范围内的元素排序&#…

m基于Simulink的高速跳频通信系统抗干扰性能分析

目录 1.算法描述 2.仿真效果预览 3.MATLAB部分代码预览 4.完整MATLAB程序 1.算法描述 信道为Rayleigh衰落信道下的性能分析和Nakagami-m衰落信道下的性能分析。本课题我们采用的仿真参数如下&#xff1a; simulink仿真模型如下所示&#xff1a; 跳频是最常用的扩频方式之一…

Hadoop笔记-01概述

文章目录1 什么是大数据&#xff1f;1.1 大数据计算模式及代表产品1.2 云计算与物联网1.2.1 云计算1.2.1.1 虚拟化1.2.1.2 分布式存储1.2.1.3 分布式计算1.2.1.4 多租户1.3 物联网1.3.1 识别和感知技术1.3.2 网络与通信技术1.3.3 数据挖掘与融合技术1.4 大数据与云计算、物联网…

正态分布,二维正态分布,卡方分布,学生t分布——概率分布学习 python

目录 基本概念 概率密度函数(PDF: Probability Density Function) 累积分布函数(CDF: Cumulative Distribution Function) 核密度估计&#xff08;(kernel density estimation&#xff09; 1.正态分布 概率密度函数&#xff08;pdf&#xff09; 正态分布累积分布函数(CD…

山东大学软件学院操作系统课程设计(2021秋季,nachos)实验6

一、实验内容 二、源码分析 1. 理解nachos单线程地址映射机制 Machine::Run()中调用Machine::OneInstruction(Instruction *instr)逐条执行可执行文件中的指令&#xff0c;执行指令过程中和获取下一条指令时如果访问内存&#xff0c;通过machine->ReadMem(…)/WriteMem(……

嵌入式开发学习之--用蜂鸣器来传递摩斯码

本篇文章致力于从开发的角度思考问题&#xff0c;而不是搞学术的东西。 文章目录前言一、项目概况1.1、项目需求1.2、项目来源1.3、项目开发环境1.4、项目意义二、开发步骤2.1、了解什么是摩斯码2.2、构建项目流程图2.3、找到合适的模板2.4、增加文件2.5、添加代码2.6、读入数据…

学生HTML个人网页作业作品 (水果商城HTML+CSS)

&#x1f380; 精彩专栏推荐&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb;&#x1f447;&#x1f3fb; ✍️ 作者简介: 一个热爱把逻辑思维转变为代码的技术博主 &#x1f482; 作者主页: 【主页——&#x1f680;获取更多优质源码】 &#x1f393; web前端期末大作业…

通过写循环判断对称数:将一个整型数逆置,我们判断逆置后的整型数如果和最初的数相等,那么它就是对称数,如果不相等,就不是对称数

将一个整型数逆置&#xff0c;我们判断逆置后的整型数如果和 最初的数相等&#xff0c;那么它就是对称数&#xff0c;如果不相等&#xff0c;就不是对称数#include <stdio.h>int main() {int i,j0;scanf("%d",&i);int ki;//备份写在scanf之后while(i){jj*1…

Dubbo入门实战(SpringBoot + Nacos)

本文主要介绍 Dubbo 3.0 整合 SpringBoot 的样例&#xff0c;这里使用 Nacos 作为注册中心&#xff0c;读者也可以使用 Zookeeper&#xff0c;项目结构为&#xff1a; interface-service&#xff1a;接口服务user-service-provider&#xff1a;服务提供者order-service-consume…

浅谈中小企业的供应商管理

一、供应商管理的概念 供应商管理&#xff0c;是在新的物流与采购经济形势下&#xff0c;提出的管理机制。现代管理学如MBA、EMBA等将其分为竞争式及双赢式两种模式。供应商管理是供应链采购管理中一个很重要的环节&#xff0c;它在实现准时化采购中有很重要的作用。供应商管理…

Linux | 进程间通信 | 匿名管道 | 命名管道 | 模拟代码实现进程通信 | 控制多子进程时的资源回收问题

文章目录进程通信的意义匿名管道通信原理管道的访问控制进程控制管道的特点命名管道进程通信的意义 之前聊进程时&#xff0c;讲过一个性质&#xff0c;即进程具有独立性&#xff0c;两个进程之间的交互频率是比较少的。就连父子进程也只是共享代码&#xff0c;修改父子进程中…

Bezier曲线与B-Spline曲线

贝塞尔曲线 一阶贝塞尔曲线P01P_0^1P01​由两个控制点P0P_0P0​和P1P_1P1​完全定义&#xff0c;相当于线性插值。随着ttt从0到1变化&#xff0c;贝塞尔点从P0P_0P0​移动到P1P_1P1​. P01(1−t)P0tP1,t∈[0,1]P_{0}^{1}\left( 1-t\right) P_{0}tP_{1}\quad,t\in[0,1] P01​(1−…

服务器是什么

服务器是什么 服务器是什么&#xff1a;服务器英文名称为“Server”&#xff0c;指的是网络环境下为客户机(Client)提供某种服务的专用计算机&#xff0c;服务器安装有网络操作系统(如Windows Server、Linux、Unix等)和各种服务器应用系统软件(如Web服务、电子邮件服务)&#…

操作系统:进程的创建(fork函数)、进程的替换(exec函数)、进程的阻塞(wait函数)、进程的终止(exit函数)、进程的挂起(sleep函数)

文章目录1.进程的创建2.进程的替换3.进程的阻塞4.进程终止5.进程的挂起1.进程的创建 ①调用fork函数的进程为父进程&#xff0c;调用后生成一个子进程&#xff1b; ②创建子进程成功时&#xff0c;父进程中fork函数的返回值是子进程的进程号PID&#xff1b; ③创建子进程失败时…

关于Java代码如何项目部署

在研究注解的时候会用到反射&#xff0c;在学习反射的时候会涉及到关于class文件的生成&#xff0c;以及Class文件是如何被执行的等一系列关于文件转换的问题&#xff0c;接下来就借助学习反射来学习一下项目整体部署的过程和每个阶段要生成的文件. 我们写的代码写完并测试之后…