记一次azkaban调度异常处理

news2024/9/25 7:17:24

一、背景

        预发布环境使用的数据库性能比较低,根据业务测试的需求,需要将数据库更换成 稳定高性能的数据库。更换业务数据库后azkaban定时任务失败

二、数据库服务信息

        说明:该部分使用代号来代替,非真实信息

  1. 该数据库存储了azkaban 运行的数据库 : azkaban
  2. 该数据存储了预发布环境业务测试数据 :  test
  3. 就数据库地址:192.168.1.110
  4. 新数据库地址:192.168.1.142

三、azkaban定时任务失败问题分析

  1、web查看定时任务失败日志

        业务相关的任务都失败,自己创建的任务执行成功;业务调度工作报错:没有获取到资源对象

 2、在服务器分析定时任务日志

            azkaban web和exec执行都没有发现异常的报错。只有回调失败的关键字眼。无法定位问题所在。

3、深入排查分析

        a、检查azkaban 执行器和web 数据库相关配置文件: azkaban.properties ,然而数据库信息都是 正确的。

        b、在azkaban 创建简单的 job测试,能成功执行。

 4、疑点

        a、azkaban依赖的azkaban数据库连接信息正常,并且通过创建的测试 job 可以推测 azkaban 服务是正常的。

        b、突然有个疑问,有没有可能迁移数据库,业务相关的测试库的接口没更改完全?深思和继续排查,这个可能已被排除,azkaban数据库核对了遍都没有发现可以的地方,该更改的地方都改完成了。

        c、曾经有过怀疑azkaban容器内存限制,以及azkaban配置文件里面对内存的配置;azkaban配置里面默认小于6GB 就不会调度到该节点的,但这个问题再次确认配置,早已解除了azkaban最小6GB内存配置的限制了。该疑问也排除了。

        d、有没有可能是业务的问题呢?跟azkaban本身没有关系呢?azkaban容器是我亲手构建交付给开发人员调整的,azkaban本身配置都核对了遍了,突然灵机一闪,有没有可能是 有相关的配置藏在azkab某个角落呢? 毕竟构建azkaban基础镜像时候,创建按照开发的要求,创建一个跟业务有关,并存放有我们自己开发的代码,那么有没有可能在这个目录里面隐藏了和业务有关的配置呢?

5、经过 重重的疑点思考,决定登录azkab容器再好好核对一番。刚好发现业务目录隐藏了连接业务数据库的配置没有更改过来。没想好开发把业务配置直接打包到镜像里面了。

 三、问题复盘

        1、azkaban基础镜像是我按照开发负责人的需求出方案并且构建的,azkaban本身用到的数据库配置和应用配置等都是通过configMap方式挂载的。

        2、没想到开发他们把跟业务有关的配置,如业务数据库连接信息等配置文件直接打包到镜像里面了。我们环境是基于CICD,一键把源码打包成应用,基于基础镜像构建迭代的镜像,然后发布到k8s环境,完成应用迭代部署。

        3、开发也没有告知我业务配置打包在镜像面了,让我产生了误解,一直以为除了azkaban本身的配置没有其他配置了。

        

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/505092.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

docker 搭建 Elasticsearch和Kibana 8.x版本

参考: docker入门:单机elasticsearch安装记录,保证无坑_8月日更_小鲍侃java_InfoQ写作社区 新建文件夹 同上文所述相同,需要在宿主机上挂载配置文件与数据文件。 mkdir -p /Users/louye/data/learn-data/elastic/config mkdir -p /Users/lo…

学系统集成项目管理工程师(中项)系列19a_成本管理(上)

1. 要确保在批准的预算内完成项目 2. 必须考虑项目决策对项目产品、服务或成果的使用成本、维护成本和支持成本的影响 3. 对成本的影响力在项目早期最大 4. 失控原因 4.1. 对工程项目认识不足 4.1.1. 对信息系统工程成本控制的特点认识不足,对难度估计不足 4.…

大数据|实验三:PageRank算法实现

文章目录 📚PageRank概述🐇什么是PageRank🐇PageRank的简化模型🐇PageRank的随机浏览模型 📚实验目的📚实验平台📚实验内容🐇在本地编写程序和调试🐇在集群上提交作业并执…

【Linux脚本篇】流程控制语句-if

目录 🍁流程控制语句if 🍂单分支语句 🍂双分支语句 🍂多分支语句 🍁流程控制语句:文件比较 🍁流程控制语句:整数比对 🍁流程控制语句:字符对比 🍁…

校园企业车辆维修报修管理系统设计与开发

本研究课题重点主要包括了下面几大模块:在本基于.net平台的车辆系统中分为管理员和用户2个模块,主要功能包括管理员信息管理,车辆信息管理,驾驶员信息管理,事故信息管理,维修信息管理,维修点管理…

【Leetcode -463.岛屿的周长 - 476.数字的补码】

Leetcode Leetcode -463.岛屿的周长Leetcode - 476.数字的补码 Leetcode -463.岛屿的周长 题目:给定一个 row x col 的二维网格地图 grid ,其中:grid[i][j] 1 表示陆地, grid[i][j] 0 表示水域。 网格中的格子 水平和垂直 方向…

C/C++每日一练(20230509) 分割回文串II、盛水容器、Atoi

目录 1. 分割回文串 II 🌟🌟🌟 2. 盛最多水的容器 🌟🌟 3. 字符串转换整数 (atoi) 🌟🌟 🌟 每日一练刷题专栏 🌟 Golang每日一练 专栏 Python每日一练 专栏 C/…

Springboot +Flowable,三种常见网关的使用(排他、并行、包容网关)(二)

一.简介 Flowable 中常用的网关主要有三种类型,分别是: 排他网关并行网关包容网关 下面来说下这三种的网关的概念和用法。 二.并行网关 并行网关,这种网关一般用在并行任务上,截图如下: 并行网关一般是成对出现的…

Vue学习笔记3 - Vue中 radio/select 如何设定初期值

使用 v-model 如何设定 radio的初期值呢&#xff1f; 使用v-model 绑定 value 属性&#xff0c;然后设置初始 value 属性的值即可。 比如 sexValue设置为 女&#xff0c;那么 女 那项就会被默认选中。 <!DOCTYPE html> <html lang"en"> <head>&…

数字孪生模型构建理论及应用

源自&#xff1a;计算机集成制造系统 作者&#xff1a;陶飞 张贺 戚庆林 徐 俊 孙铮 胡天亮 刘晓军 刘庭煜 关俊涛 陈畅宇 孟凡伟 张辰源 李志远 魏永利 朱铭浩 肖斌 摘 要 数字孪生作为实现数字化转型和促进智能化升级的重要使能途径&#xff0c;一直备受各…

Vue-01---初识Vue

一.搭建Vue开发环境 不建议初学者直接使用vue-cli脚手架 不建议初学者使用开发工具直接创建Vue工程 直接在html中用script引入 浏览器安装Vue Devtools插件 CDN链接引入&#xff08;不建议&#xff09;&#xff1a; <script src"h…

什么是电子负载?

1、简介 电子负载在硬件测试中是使用频率比较高的设备之一&#xff0c;是一种从电源吸收电流并消耗功率的测试仪器&#xff0c;基本都是通过控制内部功率器件&#xff08;Mosfet&#xff09;导通量&#xff0c;依靠功率管的耗散功率消耗电能。很多初入硬件或者硬件测试的小伙伴…

物联网安全工作梳理(0)

物联网相比互联网,设备更多,协议更多,标准不统一,安全更脆弱,因此相当于互联网的安全漏洞增量。物联网安全整改流程相比互联网在增量上工作更多些。本篇将从八个方面阐述物联网安全整改工作总结,每个面都是一项大工程。 物联网与互联网差异 物联网安全可分为8大类来说明…

PostgreSQL 新闻速递 谷歌基于POSTGRESQL 兼容数据库提供更大规模的数据库服务

开头还是介绍一下群&#xff0c;如果感兴趣polardb ,mongodb ,mysql ,postgresql ,redis 等有问题&#xff0c;有需求都可以加群群内有各大数据库行业大咖&#xff0c;CTO&#xff0c;可以解决你的问题。加群请联系 liuaustin3 &#xff0c;在新加的朋友会分到2群&#xff08;共…

国产仪器 6595A户外多通道光伏组件测试仪

6595A测试仪主机具备自主测试和显示能力&#xff0c;提供真6路电子负载&#xff0c;提供多至6通道的实时同步测试能力&#xff0c;并可根据用户需求订制通道数量及测试模块的测试功率。多台测试仪通过联网控制组成评测系统&#xff0c;可进行多至300个光伏组件的同步测试&#…

Threejs——五、点线模型对象、三角形概念、几何体顶点位置,顶点索引、法线以及对几何体进行旋转缩放和平移

文章&#xff1a; Three——一、初识Three以及基础的前端场景搭建(结尾含源码)Three——二、加强对三维空间的认识Three——三、动画执行、画布大小、渲染帧率和相机适配体验Three——四、几何体、高光网络材质、锯齿模糊以及GUI库的使用Three——五、点线模型对象、三角形概念…

基于主从博弈的综合能源服务商动态定价策略研究(Matlab代码实现)

&#x1f4a5;&#x1f4a5;&#x1f49e;&#x1f49e;欢迎来到本博客❤️❤️&#x1f4a5;&#x1f4a5; &#x1f3c6;博主优势&#xff1a;&#x1f31e;&#x1f31e;&#x1f31e;博客内容尽量做到思维缜密&#xff0c;逻辑清晰&#xff0c;为了方便读者。 ⛳️座右铭&a…

使用 Sa-Token 完成踢人下线功能

一、需求 在企业级项目中&#xff0c;踢人下线是一个很常见的需求&#xff0c;如果要设计比较完善的话&#xff0c;至少需要以下功能点&#xff1a; 可以根据用户 userId 踢出指定会话&#xff0c;对方再次访问系统会被提示&#xff1a;您已被踢下线&#xff0c;请重新登录。…

05/09报告

1. 使用10w条数据 评分分布情况&#xff1a; 2. 训练集、测试集、验证集为7:2:1 1&#xff09;2分类&#xff08;3分及以下标签为0&#xff0c;3分以上标签为1&#xff09; 模型评估&#xff1a; 测试评论&#xff1a; 预测结果&#xff1a; 2&#xff09;5分类&#xff08;标签…

Kyligence Zen 产品体验 ——AI数据指标洞察专家

大势所趋&#xff1a;从报表模式到指标模式 Kyligence Zen----一个立志于打造一个人人可用的敏捷指标工具 一、基本信息 体验时间 2023年5月 体验博主 风尚云网 目标产品 Kyligence Zen 开发团队 跬智信息&#xff08;Kyligence&#xff09;由 Apache Kylin 创始团队于…