log4j日志打印导致OOM问题

news2024/10/5 20:49:37

一、背景

某天压测,QPS压到一定值后机器就开始重启,出现OOM,好在线上机器配置了启动参数-XX:+HeapDumpOnOutOfMemoryError -XX:HeapDumpPath=/**/**heapdump.hprof。将dump文件下载到本地,打开Java sdk bin目录下的jvisualvm工具,导入dump文件,发现有非常多的char[]对象,于是开始分析原因。
在这里插入图片描述

二、问题定位

点击工具栏概要,找到发生OutOfMemoryError的线程堆栈,发现报错跟log4j相关。点击工具栏实例数,靠前的对象也基本跟日志打印有关。
在这里插入图片描述在这里插入图片描述在这里插入图片描述
定位到具体的代码行,RequestLogAspect.java:194(对应下面代码倒数第二行),部分代码如下:

// aop 执行后的日志
StringBuilder afterReqLog = new StringBuilder(200);
// 日志参数
List<Object> afterReqArgs = new ArrayList<>();
afterReqLog.append("\n\n================  Response Start  ================\n");
try {
    Object result = point.proceed();
    // 打印返回结构体
    afterReqLog.append("===Result===  {}\n");
    afterReqArgs.add(toJson(result));
    return result;
} finally {
    long tookMs = TimeUnit.NANOSECONDS.toMillis(System.nanoTime() - startNs);
    afterReqLog.append("<=== {}: {} ({} ms)\n");
    afterReqArgs.add(requestMethod);
    afterReqArgs.add(requestURI);
    afterReqArgs.add(tookMs);
    afterReqLog.append("================  Response End   ================\n");
    log.info(afterReqLog.toString(), afterReqArgs.toArray());
}

三、问题分析

上面这段代码的目的是打印出参,当出参result对象非常大时,高并发情况下,会占用比较多的堆内存。而且这段日志打印的代码,将result转为Json串保存在afterReqArgs里,最后通过log.info输出,而log.info又通过StringBuilder将字符串拼接输出,导致堆内存中有非常多的大字符串对象,最终导致OOM。见log4j源码org.apache.logging.log4j.message.ParameterizedMessage#getFormattedMessage。
在这里插入图片描述

四、问题复现

本机配置:Apple M1芯片,内存16G。设置JVM启动参数-Xmx256m -Xms256m,Jmeter配置如下图。执行后稳定复现OOM。
在这里插入图片描述
在这里插入图片描述

五、解决方案

1、不打印大对象

由于这个压测接口查询的内容就是会很大,所以最简单的方式就是不打印这个大对象出参。通过excludeFullLogPatterns配置哪些接口不打印result。

try {
    result = point.proceed();
    return result;
} finally {
    if (requestLogProperties.getResponseLogEnable() && !isExcludeResponseLog(requestURI)) {
        printLogDiv(requestMethod, requestURI, result, startNs);
    }
}

/**
 * 分情况打印日志
 */
private void printLogDiv(String requestMethod, String requestURI, Object result, long startNs) {
    if (isExcludeFullResponseLog(requestURI)) {
        long tookMs = TimeUnit.NANOSECONDS.toMillis(System.nanoTime() - startNs);
        log.info("Response log method[{}], path[{}], tookMs[{}]", requestMethod, requestURI, tookMs);
    } else {
        printFullLog(requestMethod, requestURI, result, startNs);
    }
}
/**
 * 打印日志-全量
 */
private void printFullLog(String requestMethod, String requestURI, Object result, long startNs) {
    long tookMs = TimeUnit.NANOSECONDS.toMillis(System.nanoTime() - startNs);
    if (result == null) {
        log.info("Response log method[{}], path[{}], tookMs[{}]", requestMethod, requestURI, tookMs);
    } else {
        log.info("Response log method[{}], path[{}], tookMs[{}], result[{}]", requestMethod, requestURI, tookMs,
                toFastJson(result));
    }
}
/**
 * 是否排除全量出参日志
 */
private final AntPathMatcher antPathMatcher = new AntPathMatcher();
private boolean isExcludeFullResponseLog(String path) {
    if (CollectionUtils.isEmpty(requestLogProperties.getExcludeFullLogPatterns())) {
        return false;
    }
    return requestLogProperties.getExcludeFullLogPatterns()
            .stream()
            .anyMatch(pattern -> antPathMatcher.match(pattern, path));
}
@Data
@Component
public class RequestLogProperties {

    /**
     * 开启出参打印日志
     */
    @Value("${gaotu.request.log.responseEnable:true}")
    private Boolean responseLogEnable;

    /**
     * 不打印完整日志的url
     */
    @Value("#{'${gaotu.request.log.excludeFullLogPatterns:/query/question-list}'?.split(',')}")
    private List<String> excludeFullLogPatterns;

    /**
     * 不打印出参日志的url
     */
    @Value("#{'${gaotu.request.log.excludeResponseLogPatterns:}'?.split(',')}")
    private List<String> excludeResponseLogPatterns;
}

2、修改log4j配置

设置log4j对应ringBuffer的大小和ringBuffer满时日志的丢弃策略。工具栏实例数显示,ringBuffer中entry对象也非常多。可以参考https://blog.csdn.net/ryo1060732496/article/details/135966098。
在这里插入图片描述
在这里插入图片描述
ringBuffer设置的源码在org.apache.logging.log4j.core.async.DisruptorUtil#calculateRingBufferSize:
在这里插入图片描述
拒绝策略的源码在org.apache.logging.log4j.core.async.AsyncQueueFullPolicyFactory#create:
在这里插入图片描述
具体修改方式为:
(1)通过JVM启动参数配置:-Dlog4j2.asyncLoggerConfigRingBufferSize=512 -DLog4jAsyncQueueFullPolicy=Discard。
在设置-Xmx256m -Xms256m情况下,RingBufferSize设置为1024时会OOM,ringBuffer具体配置看压测而定。
(2)通过log4j2.component.properties配置:

AsyncLoggerConfig.RingBufferSize=512
log4j2.AsyncQueueFullPolicy=Discard
log4j2.DiscardThreshold=INFO

配置文件读取源码在org.apache.logging.log4j.util.PropertiesUtil:
在这里插入图片描述

3、限流

通过限流的方式来打印日志,当超过限流值时不打印出参日志。(本文限流用的RateLimiter)

Object result = null;
try {
    result = point.proceed();
    return result;
} finally {
    if (requestLogProperties.getResponseLogEnable() && !isExcludeResponseLog(requestURI)) {
        printLogLimiter(requestMethod, requestURI, result, startNs);
    }
}

/**
 * 限流的方式
 */
private static Double questionLimit = 20D; //具体设置多少看压测
private static DynamicRateLimiter questionLimiter = DynamicSuppliers
        .dynamicRateLimiter(() -> questionLimit);
private void printLogLimiter(String requestMethod, String requestURI, Object result, long startNs) {
    if (questionLimiter.tryAcquire()) {
        printFullLog(requestMethod, requestURI, result, startNs);
    } else {
        log.info("日志打印限流中……");
    }
}

// 创建一个固定大小的线程池,并使用LinkedBlockingQueue作为工作队列
private static ExecutorService logExecutor = new ThreadPoolExecutor(
        1, // 核心线程数(根据需要调整)
        1, // 最大线程数(根据需要调整)
        10L, TimeUnit.MILLISECONDS, // 线程保活时间和单位
        new LinkedBlockingQueue<>(10), // 有界队列
        (r, executor) -> log.info("日志线程池已满,拒绝执行任务")); // 队列满时的拒绝策略,直接丢弃任务

4、其他

考虑过日志截断,但是截断仍然需要将对象转为Json串再截取,对性能和内存仍然有影响,依然会OOM。

参考资料:

《Log4j2-29-log4j2 discard policy 极端情况下的丢弃策略 同步+异步配置的例子》https://blog.csdn.net/ryo1060732496/article/details/135966098
《Log4j2异步情况下怎么防止丢日志的源码分析以及队列等待和拒绝策略分析》https://www.cnblogs.com/yangfeiORfeiyang/p/9783864.html
《log4j2异步详解及高并发下的优化》:https://blog.csdn.net/qq_35754073/article/details/104116487
《Disruptor详解》:https://www.jianshu.com/p/bad7b4b44e48
《从阿里来个技术大佬,入职就给我们分享Java打日志的几大神坑!》https://blog.csdn.net/qq_42046105/article/details/127626058

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1809663.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2024PTA算法竞赛考试编程题代码

目录 前言 题目和代码 L1-006 连续因子 L1-009 N个数求和 L2-004 这是二叉搜索树吗&#xff1f; L2-006 树的遍历 L2-007 家庭房产 L4-118 均是素数 L4-203 三足鼎立 L2-002 链表去重 L2-003 月饼 L2-026 小字辈 L4-201 出栈序列的合法性 L4-205 浪漫侧影 前言 所…

BarTender 常见的使用要点

BarTender 简述 BarTender是由美国海鸥科技&#xff08;Seagull Scientific&#xff09;推出的一款条码打印软件&#xff0c;被广泛应用于标签、条形码、证卡和RFID标记的设计和打印领域。它在全球范围内拥有众多用户&#xff0c;被公认为标签打印方面的全球领先者。BarTender…

把 FolkMQ 内嵌到 SpringBoot2 项目里(比如 “诺依” 啊)

FolkMQ &#xff08;消息中间件&#xff09;支持内嵌、单机、集群、多重集群等多种部署方式。 内嵌版&#xff0c;就相当于 H2 或 SQLite 数据库一样。给一些小项目&#xff08;或者特别需求&#xff09;带来了方便。大项目&#xff0c;则可以使用独立部署的 “单机版” 或 “…

搞懂银行的各类号码 — Account Number, Routing Number 和 Swift Code

1. 前言2. 名词解释 2.1. Debit Card Number 储蓄卡卡号2.2. Account Number 账户号码2.3. Routing Number 路由号码2.4. SWIFT Code SWIFT 号码3. 查找信息 3.1. 支票3.2. 网上银行3.3. 手机银行4. SWFIT Code 4.1. 看懂 SWIFT Code4.2. 询问银行4.3. Google 大神4.4. 部分常用…

24.6.9( 概率dp)

星期一&#xff1a; abc356 D atc传送门 思路&#xff1a;按位与操作&#xff0c;M的非零位对答案一定没有贡献&#xff0c;对M为1的位&#xff0c;考虑有多少k此位也为1 按位枚举&#xff0c;m此位为0跳…

CAS Server Restful接口实现后台认证

背景 对于一些比较复杂定制化登录页的情况下&#xff0c;之前提到过可以自定义修改使用CAS Server提供的登录页这种操作已经明显跟不上复杂定制场景了&#xff0c;所以CAS Server也提供了支持Restful接口&#xff0c;支持服务端后台登陆&#xff0c;对于复杂登陆场景时&#x…

vscode 访问容器的方式

方法一&#xff1a;先连服务器&#xff0c;再转入容器 配置客户机A M1. 客户机A通过 vscode 连接服务器B&#xff0c;再连接容器C 配置vscode的ssh配置文件&#xff1a;~.ssh\config&#xff08;当需要多个不同的连接时&#xff0c;使用 IdentityFile 指定公钥位置&#xff09;…

20240605解决飞凌的OK3588-C的核心板刷机原厂buildroot不能连接ADB的问题

20240605解决飞凌的OK3588-C的核心板刷机原厂buildroot不能连接ADB的问题 2024/6/5 13:53 rootrootrootroot-ThinkBook-16-G5-IRH:~/repo_RK3588_Buildroot20240508$ ./build.sh --help rootrootrootroot-ThinkBook-16-G5-IRH:~/repo_RK3588_Buildroot20240508$ ./build.sh lun…

280 基于matlab的摇号系统GUI界面仿真MATLAB程序

基于matlab的摇号系统GUI界面仿真MATLAB程序&#xff0c;输入总数量及摇号需求&#xff0c;进行随机性摇号&#xff0c;并对摇取的号码进行双重随机性数据检测&#xff0c;确定是否符合要求。程序已调通&#xff0c;可直接运行。 280 GUI人机交互 摇号系统GUI界面仿真 - 小红书…

本地搭建支持语音和文本的中英文翻译服务-含全部源代码

实现目标 1、支持文本中英文互译&#xff1b; 2、支持中文语音输入&#xff1b; 3、支持英文语言输入&#xff1b; 进阶&#xff08;未实现&#xff09; 4、优化web界面&#xff1b; 5、优化语音输入js实现逻辑&#xff1b; 6、增加语音输入自纠错模型&#xff0c;纠正语音识别…

【PR2019】怎样批量添加转场效果及修改默认持续时间

一&#xff0c;设置“交叉溶解”效果到所有素材 选择效果&#xff0c;右击“将所选过渡设置为默认过渡”&#xff1a; 框选所有素材&#xff0c;“Ctrl D”&#xff1a; 每个素材中间有有了交叉溶解的效果&#xff1a; 二&#xff0c;修改效果属性 2.1&#xff0c;单个修…

从零开始,手把手教你文旅产业策划全攻略

如果你想深入了解文旅策划的世界&#xff0c;那么有很多途径可以获取知识和灵感。 首先&#xff0c;阅读一些专业书籍也是一个不错的选择。书店或图书馆里有许多关于文旅策划的书籍&#xff0c;它们通常涵盖了策划的基本理论、方法和实践案例。通过阅读这些书籍&#xff0c;你…

激光点云配准算法——Cofinet / GeoTransforme / MAC

激光点云配准算法——Cofinet / GeoTransformer / MAC GeoTransformer MAC是当前最SOTA的点云匹配算法&#xff0c;在之前我用总结过视觉特征匹配的相关算法 视觉SLAM总结——SuperPoint / SuperGlue 本篇博客对Cofinet、GeoTransformer、MAC三篇论文进行简单总结 1. Cofine…

热题系列章节5

169. 多数元素 给定一个大小为 n 的数组&#xff0c;找到其中的多数元素。多数元素是指在数组中出现次数大于 ⌊ n/2 ⌋ 的元素。 你可以假设数组是非空的&#xff0c;并且给定的数组总是存在多数元素。 示例 1: 输入: [3,2,3] 输出: 3 示例 2: 输入: [2,2,1,1,1,2,2] 输出:…

【C语言】11.字符函数和字符串函数

文章目录 1.字符分类函数2.字符转换函数3.strlen的使用和模拟实现4.strcpy的使用和模拟实现5.strcat的使用和模拟实现6.strcmp的使用和模拟实现7.strncpy函数的使用8.strncat函数的使用9.strncmp函数的使用10.strstr的使用和模拟实现11.strtok函数的使用12.strerror函数的使用 …

【MySQL】聊聊唯一索引是如何加锁的

首先我们要明确&#xff0c;加锁的对象是索引&#xff0c;加锁的基本单位是next-key lock&#xff0c;由记录锁和间隙锁组成。next-key是前开后闭区间&#xff0c;间隙锁是前开后开区间。根据不同的查询条件next-key 可能会退化成记录锁或间隙锁。 在能使用记录锁或者间隙锁就…

认识Spring中的BeanFactoryPostProcessor

先看下AI的介绍 在Spring 5.3.x中&#xff0c;BeanFactoryPostProcessor是一个重要的接口&#xff0c;用于在Spring IoC容器实例化任何bean之前&#xff0c;读取bean的定义&#xff08;配置元数据&#xff09;&#xff0c;并可能对其进行修改。以下是关于BeanFactoryPostProce…

31-捕获异常(NoSuchElementException)

在定位元素的时候&#xff0c;经常会遇到各种异常&#xff0c;遇到异常又该如何处理呢&#xff1f;本篇通过学习selenium的exceptions模块&#xff0c;了解异常发生的原因。 一、发生异常 打开百度搜索首页&#xff0c;定位搜索框&#xff0c;此元素id"kw"。为了故意…

定个小目标之刷LeetCode热题(15)

这道题直接就采用两数相加的规则&#xff0c;维护一个进阶值&#xff08;n&#xff09;即可&#xff0c;代码如下 class Solution {public ListNode addTwoNumbers(ListNode l1, ListNode l2) {// 新建一个值为0的头结点ListNode newHead new ListNode(0);// 创建几个指针用于…

央视频官方出品,AI高考智友助你成就高考梦想

大家好&#xff0c;我是小麦。今天分享一款由央视频官方出品的AI工具套件&#xff0c;不仅支持直接使用&#xff0c;同时还具备了开发能力&#xff0c;是一款非常不错的AI产品工具&#xff0c;该软件的名称叫做扣子。 扣子是新一代 AI 应用开发平台。无论你是否有编程基础&…