Flink 常用问题及常用配置(有用)

news2024/11/23 6:11:10
一、Flink 常用问题及常用配置

参数

示例

说明

execution.checkpointing.interval

3min

Checkpoint 触发间隔

state.backend

rocksdb / filesystem

用于设置statebackend类型, 默认会以内存为statebackend(无法支持大状态)

taskmanager.memory.jvm-overhead.max

2048m

如果使用rocksdb Statebackend可能会出现堆外内存超用导致container lost问题,配置此参数可避免出现该问题

taskmanager.memory.jvm-overhead.fraction

0.2

默认是0.1 , 如果调整超过了1G,则需要调整taskmanager.memory.jvm-overhead.max, 增大max

taskmanager.memory.managed.fraction

0.5

设置managed memory的内存使用比例

taskmanager.memory.managed.size

2048m

设置managed memory的大小

state.backend.rocksdb.memory.partitioned-index-filters

true

对RocksDB 的 partitioned Index 做了多级索引, 如果rocksdb的性能较差,可以尝试开启次参数进行优化

state.checkpoint.fs.ignore-missing-file

false

当误删checkpoint导致作业无法启动时,通过设置该参数为true(默认false),使作业能够正常启动,仅在TM日志中记录一条异常(一般强烈建议不开启,可能会丢失状态,待出现该异常后再确定是否开启)

state.backend.checkpoint.stream-concat-enabled

true

开启状态文件合并,减少状态文件的数量.

env.java.opts.jobmanager=""

配置 jobManager jvm 参数

env.java.opts.taskmanager=""

配置 taskmanager jvm 参数

pipeline.operator-chaining

true

是否开启operator chain

flink.log.level

info / debug

flink日志级别

二、另外,CGroup内存和taskmanager heap 内存的区别

区别总结:

特性TaskManager Heap MemoryCGroup Memory
定义Flink 配置项 taskmanager.heap.size 设置的 JVM 堆内存操作系统(Linux)通过 CGroup 限制的 总内存
管理方式JVM(Java) 内部的垃圾回收(GC)进行管理Linux 内核 的 CGroup 进行管理
配置位置Flink 配置文件中的 taskmanager.heap.size通过操作系统或容器配置(如 Docker 的 --memory
内存类型仅限于 JVM 堆内存包括 堆内存非堆内存网络缓冲区
影响影响 Flink 任务的内存分配和垃圾回收频率控制整个 TaskManager 进程的内存使用限制
资源限制只影响 JVM 堆内存,不包括非堆内存限制 TaskManager 进程的所有内存消耗,包括堆内存、非堆内存和其他内存
超出限制时的处理可能导致频繁的垃圾回收,影响性能可能导致 OOM(Out of Memory)错误,TaskManager 崩溃

结论:

  • taskmanager.heap.size 主要影响 JVM 堆内存,它是 Flink 任务内存管理的一个核心部分。
  • CGroup 内存限制 是操作系统级别的限制,控制的是 TaskManager 进程的总体内存使用,包括堆内存、非堆内存以及其他类型的内存(例如网络缓冲区等)。CGroup 用于防止 TaskManager 因为内存使用过多而导致系统稳定性问题。

三、一般报错,报task manager was lost错误时:

task manager was lost只是现象,经常是内存OOM,container被kill掉了。具体是堆内内存不够还是堆外内存不够,需要具体看监控上的heap和cgroup内存监控,然后调整对应的内存资源分配。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2245788.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

开源远程桌面工具:RustDesk

在远程办公和远程学习日益普及的今天,我们经常需要远程访问办公电脑或帮助他人解决电脑问题。 市面上的远程控制软件要么收费昂贵,要么需要复杂的配置,更让人担心的是数据安全问题。 最近我发现了一款名为 RustDesk 的开源远程桌面工具&…

双通道CAN转以太网(三格电子)

一、功能描述 SG-CANET-210 是一款用来把 CAN 总线数据转为网口数据的设备。网口支 持 TCP Sever 、TCP Client 、UDP Sever 、UDP Client 、UDP Broadcast 模式,可以 通过软件配置和网页配置。设备提供两路 CAN 接口,两路 CAN 可分别配置为 不同的工作…

WebApis学习笔记,第二节:高级语法

WebApis学习笔记,第二节:高级语法 一、JS组成 我们再回顾一下JS的组成:ECMAScript: 规定了js基础语法核心知识。 比如:变量、分支语句、循环语句、对象等等Web APIs : DOM 文档对象模型, 定义了一套操作HTML文档的AP…

【ubuntu24.04.1最简洁安装方案】

我的电脑配置: 128GB固态硬盘,1TB 机械硬盘,我把整个 windows 系统全噶掉了,只安装ubuntu24.04.1一个Linux系统噶windows系统, 推荐使用 DiskGenius这个工具,好用,但是也要弄明白了再用啊&#…

【spring的底层原理】Bean的生命周期

文章目录 什么是Bean的生命周期Bean的生命周期可以分为几个步骤Bean的定义阶段加载BeanDefinition中指定的类实例化前(可选)实例化属性注入Aware接口回调BeanPostProcessor前置处理初始化初始化前(可选)初始化初始化后&#xff08…

全面前端显示:鹅成熟与否识别

1.背景意义 研究背景与意义 随着生态保护意识的增强和生物多样性的重要性日益凸显,水鸟尤其是加拿大鹅的保护与管理成为了生态学研究的一个重要领域。加拿大鹅在北美地区广泛分布,其种群数量的变化不仅反映了生态环境的健康状况,也对当地生…

label studio+sam实现半自动标注

1、主要参考:https://github.com/open-mmlab/playground/tree/main/label_anything 这里提醒大家一点,有人使用过程中,出现自动标注无反应,就是操作步骤出现了问题!一定记住按这个顺序操作!!&a…

Python爬虫案例八:抓取597招聘网信息并用xlutils进行excel数据的保存

excel保存数据的三种方式: 1、pandas保存excel数据,后缀名为xlsx; 举例: import pandas as pddic {姓名: [张三, 李四, 王五, 赵六],年龄: [18, 19, 20, 21],住址: [广州, 青岛, 南京, 重庆] } dic_file pd.DataFrame(dic) dic_file…

Hutool工具类生成二维码

1、引入依赖 <dependency><groupId>com.google.zxing</groupId><artifactId>core</artifactId><version>3.3.3</version></dependency><dependency><groupId>cn.hutool</groupId><artifactId>hutoo…

Java 基于SpringBoot+vue框架的老年医疗保健网站

大家好&#xff0c;我是Java徐师兄&#xff0c;今天为大家带来的是Java Java 基于SpringBootvue框架的老年医疗保健网站。该系统采用 Java 语言开发&#xff0c;SpringBoot 框架&#xff0c;MySql 作为数据库&#xff0c;系统功能完善 &#xff0c;实用性强 &#xff0c;可供大…

华为FusionCube 500-8.2.0SPC100 实施部署文档

环境&#xff1a; 产品&#xff1a;FusionCube 500版本&#xff1a;8.2.0.SPC100场景&#xff1a;虚拟化基础设施平台&#xff1a;FusionCompute两节点 MCNA * 2硬件部署&#xff08;塔式交付场景&#xff09;免交换组网&#xff08;配置AR卡&#xff09; 前置准备 组网规划 节…

社团管理新体验:SpringBoot技术

摘要 随着信息技术在管理上越来越深入而广泛的应用&#xff0c;管理信息系统的实施在技术上已逐步成熟。本文介绍了社团管理系统的开发全过程。通过分析社团管理系统管理的不足&#xff0c;创建了一个计算机管理社团管理系统的方案。文章介绍了社团管理系统的系统分析部分&…

SSM之Bean

前言 这一节讲bean 1.初始spring 点projects Framework是spring的基础 spring官网 这三个主流 2. 系统架构 3. 核心概念 4. Ioc入门案例 其中Dao就是我们原来管理数据库的&#xff0c;service就是业务层 这个代码很简单 要交给spring管理&#xff0c;首先要有一个配置文…

Spring循环依赖如何解决的?

一、什么是循环依赖 循环依赖&#xff1a;说白是一个或多个对象实例之间存在直接或间接的依赖关系&#xff0c;这种依赖关系构成了构成一个环形调用。 第一种情况&#xff1a;自己依赖自己的直接依赖 第二种情况&#xff1a;两个对象之间的直接依赖 第三种情况&#xff1a;多个…

Mac vscode 激活列编辑模式

列编辑模式在批量处理多行文本时&#xff0c;非常有效&#xff0c;但 vscode 默认情况下&#xff0c;又没有激活&#xff0c;因此记录一下启动方法&#xff1a; 激活列编辑模式 然后就可以使用 Alt&#xff08;Mac 上是 Option 或 Command 键&#xff09; 鼠标左键 滑动选择了…

【MARL】深入理解多智能体近端策略优化(MAPPO)算法与调参

&#x1f4e2;本篇文章是博主强化学习&#xff08;RL&#xff09;领域学习时&#xff0c;用于个人学习、研究或者欣赏使用&#xff0c;并基于博主对相关等领域的一些理解而记录的学习摘录和笔记&#xff0c;若有不当和侵权之处&#xff0c;指出后将会立即改正&#xff0c;还望谅…

商用密码应用安全性评估,密评整体方案,密评管理测评要求和指南,运维文档,软件项目安全设计相关文档合集(Word原件)

一、 密码应用安全性评估方案 &#xff08;一&#xff09; 密码应用测评工作思路 1.1.1. 测评准备活动的主要任务 1.1.2. 测评准备活动的输出文档 1.2. 方案编制活动 1.2.1. 方案编制活动的主要任务 1.2.2. 方案编制活动的输出文档 1.3. 现场预评估活动 1.3.1. 现场测评…

docker run m3e 配置网络,自动重启,GPU等 配置渠道要点

启动命令&#xff1a; docker run -d --restart always -p 6008:6008 --gpus all --name m3e --network fastgpt_fastgpt stawky/m3e-large-api 配置渠道m3e base url要像我这样填写才行&#xff0c;不然回出问题 模型要选m3e 密钥填&#xff1a;sk-aaabbbcccdddeeefffggghhhi…

OceanBase Shell开放内核运维接口,运维更便捷

DBA在日常业务中面临着繁琐的运维管理任务&#xff0c;亟需高效的工具和灵活的解决方案帮助他们简化操作、提升效率。因此&#xff0c;命令行操作和维护工具&#xff08;CLI工具&#xff09;&#xff0c;因其高效、灵活、可远程管理以及技术深度等特点&#xff0c;成为DBA和开发…

基于MATLAB的混沌序列图像加密程序

设计目的 图像信息生动形象&#xff0c;它已成为人类表达信息的重要手段之一&#xff0c;网络上的图像数据很多是要求发送方和接受都要进行加密通信&#xff0c;信息的安全与保密显得尤为重要&#xff0c;因此我想运用异或运算将数据进行隐藏&#xff0c;连续使用同一数据对图…