面试官:怎样设计一个分布式任务调度平台?

news2024/12/26 11:32:40

大家好,我是君哥。

在工作中,批量任务调度的需求经常会遇到,比如下面的几个场景:

  1. 数据迁移:从数据库 A 批量读取数据,加工后把数据写入数据库 B;

  2. 消息通知:运营商批量给客户发送短信;

  3. 批量扣款:在还款日,银行批量扣除贷款客户的当期还款金额;

  4. 账务加工:系统通过日终跑批的方式加工当天的账务数据。

从开源框架来看,优秀的分布式任务调度框架并不少,比如 Quartz、Spring Batch、xxl-job、PowerJob 等。如果公司不使用开源框架,要自研一套,该如何设计呢?

今天就来聊一聊怎样设计一套分布式任务调度平台。

1.触发器

既然是任务调度,那触发器肯定是必不可少的。触发器就是控制任务什么时间开始执行,使用者可以定义好 Cron 表达式,到时间保证任务被触发。

除了定时触发外,也要设计通用的触发接口,方便地给外部系统提供触发入口。

在一些对账类的场景,可能多个系统联合对账,上游系统加工好后把账务文件送过来,触发本系统的批量任务进行对账。本系统对账完成后,要把对账结果异步通知给调用方。

2.调度器

调度器的主要作用是给待执行任务找到一台合适的机器,然后把它调度到这台集群上的待执行队列。

2.1 调度策略

调度器的调度策略可以有几种:

  • 调度到固定一台机器;

  • 以轮询方式调度到下一台机器;

  • 根据集群中各机器的资源状况调度到一台空闲的机器,这个比较难一些;

  • 随机选择一台机器;

  • 所有机器都执行。

在集群环境下,调度器对定时任务的作用是非常重要的,调度不好,很容易导致任务在不同机器上重复执行。

同时,调度器可以根据机器的资源情况进行任务调度,提高任务执行效率。

当然,也可能会有广播的场景,这时调度器需要把任务调度到所有的机器上执行。

还需要考虑的一个点就是任务优先级,优先级高的任务需要优先调度。

3 执行器

调度器把任务调度到某一个机器上后,就把任务交给了执行器。执行器可以定义一个线程池,接到任务后把任务丢到线程池中,等待被线程池调度。

执行器可以提供一个基类,任务类通过继承这个基类被调度平台识别。

4.任务链

任务链也是非常重要的概念,在任务调度平台上要支持任务链的定义,比如 task1->task2->task3 这样一条任务链,task1 执行完成后触发 task2,task2 执行完成后触发 task3。

任务链使用的业务场景很多。比如一个复杂度高、耗时很长的任务,可以拆分成多个子任务,这样如果有一个任务失败了,把异常问题解决后,从失败任务节点重新调起就可以。

实现任务链的方法有多种,这里提供两个思路供参考,一个是不定义任务链,给每个任务定义一个子任务,触发时只触发第一个任务,任务执行完成后执行子任务;第二个方法是定义一个任务链,任务链明确任务依赖关系。

5.熔断

批量任务一般用于处理数据量大的任务,比如给 10 万个客户发送短信通知。这会对本系统资源消耗较大,也可能会对下游系统造成压力。

如果没有任何防控手段,很可能会因为下游系统接口响应慢造成系统连锁反应。有了熔断能力,系统就可以及时发现问题并做出反应,对本系统和下游系统进行保护。

6.异常处理

异常处理的手段也是必要的。异常处理可以包含下面功能:

  • 用户可以方便地查看异常;

  • 解决异常后,可以方便地重新发起任务;

  • 遇到一些任务因为异常原因耗时太长,可以中断任务;

  • 遇到任务执行时间长,长时间占用系统资源,可以把任务挂起,给其他任务执行时间,其他任务执行完后可以再恢复这个任务。

7.阻塞控制

对于单机执行的任务,遇到任务排队的情况很正常。可以设置阻塞策略,比如按照 FIFO 方式进行排队执行,或者不做排队,有正在执行的任务时直接丢弃。

8.服务注册/发现

前面说到调度器会把任务调度到其中一台机器执行,那为了方便地管理集群中的机器,服务注册和发现功能也是很必要的。

9.任务监控

好多跑批任务是在日终执行,比如凌晨。把任务加入公司的监控体系,如果任务失败,触发监控告警,可以让运维人员和研发人员第一时间感知到。

10.控制台

有了上面的讨论,控制台的作用就很重要的。可以包括:

  • 触发器配置;

  • 触发类型配置;

  • 调度器配置;

  • 执行器配置;

  • 任务和子任务配置;

  • 异常处理;

  • 阻塞控制策略配置;

  • 任务执行状态查询;

  • 集群管理。

11.总结

通过本文的讨论,我们设计一个任务调度平台,需要下面的功能,希望对你设计和理解任务调度平台有所帮助。

图片

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1995646.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

宠物空气净化器什么牌子好?希喂、美的测评推荐

家里养了两只猫,每天晚上和我入眠,早上睡醒过来就看到猫睡在我身边,这一刻幸福感爆棚。幸福感爆棚的同时,无力感也袭来。主要是因为虽然每天玩得都很开心,但是家里的变化让我不禁感慨这是真实存在的吗。一回到家就会发…

【Material-UI】Checkbox组件:受控模式详解

文章目录 一、什么是受控组件?二、受控模式的基本用法1. 核心概念2. 代码分析 三、受控组件的优势与应用场景1. 确保数据的一致性2. 简化复杂的表单逻辑3. 轻松实现状态回显 四、受控模式的最佳实践1. 状态管理2. 优化性能3. 处理异步数据 五、结论 在Web开发中&…

【数据结构-前缀哈希】力扣3026. 最大好子数组和

给你一个长度为 n 的数组 nums 和一个 正 整数 k 。 如果 nums 的一个 子数组 中,第一个元素和最后一个元素 差的绝对值恰好 为 k ,我们称这个子数组为 好 的。换句话说,如果子数组 nums[i…j] 满足 |nums[i] - nums[j]| k ,那么…

如何通过AquilaInsight快速查看每天有哪些异常/慢查询?

友情链接: AquilaInsight核心功能及角色概览Aquila的核心功能介绍DBA Service的核心功能介绍刚部署好Aquila Insight,第一次如何使用如何通过Aquila Insight快速定位一个查询为什么慢?Aquila 添加自定义监控信息和告警的示例当Quark/Incepto…

[器械财讯]威高血液净化:中国血液透析市场的领军企业冲刺IPO

一、IPO冲刺:威高血净迎来新进展 山东威高血液净化制品股份有限公司(以下简称“威高血净”)在2023年12月30日正式启动IPO后,于2024年8月2日迎来新进展,其审核状态在上海证券交易所更新为“已问询”。尽管2024年医药行…

没有获取淘宝API的资质怎么获取淘宝数据

淘宝是头部电商平台之一,每个自研商家或电商软件服务商想要开发电商管理功能模板就少不了要对接淘宝API。淘宝API是在淘宝开放平台提供的,自研商家和软件服务商接入淘宝开放平台需要经过一系列审核和申请流程,要求资质和相关资料符合对应的要…

Windows下,C# 通过FastDDS高效通信

目录 1、安装FastDDS 库2、使用IDL定义自己的数据格式3、生成DLL3.1 托管 (Managed)模式3.2 非托管 (Unmanaged)模式 -- 可用于Unity 代码示例 eprosima Fast DDS is a C implementation of the DDS (Data Distribution Service) …

【面试八股文】软件测试面试题汇总

🍅 点击文末小卡片 ,免费获取软件测试全套资料,资料在手,涨薪更快 1、你的测试职业发展是什么? 测试经验越多,测试能力越高。所以我的职业发展是需要时间积累的,一步步向着高级测试工程师奔去。而且我也有…

bug: 配置flyway.locations多个脚本位置不生效

文章目录 业务场景场景一场景二 业务场景 随着项目版本迭代,数据库结构也会变动。如果一个项目引用其他项目的jar包,并且需要执行对应jar包的flyway脚本,就需要配置flyway.locations 场景一 正常情况下,在一个项目中可以在yml文件…

【亲测有效!】ubuntu20.04和Centos7离线安装docker及nvidia-container-toolkit

【亲测有效!】ubuntu20.04和Centos7离线安装docker及nvidia-container-toolkit 一、Ubuntu20.04安装docker(1)查看当前系统版本号和名称(2)在镜像源进行源文件下载(3)命令行进行安装&#xff08…

Mindspore框架利用扩散模型DDPM生成高分辨率图像|(三)模型训练与推理实践

利用扩散模型DDPM生成高分辨率图像(生成高保真图像项目实践) Mindspore框架利用扩散模型DDPM生成高分辨率图像|(一)关于denoising diffusion probabilistic model (DDPM)模型 Mindspore框架利用扩散模型DD…

告别杂音,从 AI 音频降噪开始

生活中,音频无处不在。无论是聆听动人的音乐,还是参与重要的电话会议,又或是沉浸于精彩的网课学习,清晰、纯净的音频质量都至关重要。然而,音频中的噪声却像不速之客,扰乱着这份美好。 音频中的噪声形式多样…

封装一个给 .NET Framework 用的内存缓存帮助类

前言 .NET Core 中已经内置了内存缓存相关的类和操作方法,直接就能使用,非常方便。但在 .NET Framework 中,如果想要使用内存缓存,需要自己进行封装。本文分享一个我自己项目中封装的内存缓存帮助类,有需要的童鞋可以…

前端已经学会vue,做粒子效果

目录 1. Canvas API 2. WebGL 3. 粒子系统 4. 动画与性能优化 5. 现有库和框架 6. Vue 组件和状态管理 实践项目建议 案例1 案例2雪花 已经熟悉了 Vue、TypeScript 和 JavaScript,下面是一些你可以学习的内容,以帮助你实现粒子效果的界面&#…

深度学习基础 - 梯度垂直于等高线的切线

深度学习基础 - 梯度垂直于等高线的切线 flyfish 梯度 给定一个标量函数 f ( x , y ) f(x, y) f(x,y),它的梯度(gradient)是一个向量,表示为 ∇ f ( x , y ) \nabla f(x, y) ∇f(x,y),定义为: ∇ f ( x…

单片机GPIO模式和应用

Push pull 推挽输出 定义:推挽输出是一种输出模式,其中引脚可以输出高电平或低电平,且两种电平状态下都具有较强的驱动能力。 特点: 无论输出高电平还是低电平,都有较强的电流驱动能力。 适用于驱动外部数字电路…

宝塔面板启用 QUIC 与 Brotli 的完整教程

环境 系统:Ubuntu 22.04.4 LTS x86_64 宝塔版本:7.7.0 (可使用本博客提供的一键安装优化脚本) nginx版本:1.26.1 开放UDP端口 注意:在你的服务器商家那里也要开放443 udp端口 sudo ufw allow 443/udp然后重新加载 UFW 以使新…

【漏洞复现】maxView Storage Manager 远程代码执行漏洞

maxView Storage Manager使查看、监控和配置系统中基于Microsemi RAID适配器构建的所有存储变得简单。⽅便的图形⽤户界⾯(GUI)在Microsemi产品线和⽀持的操作系统(包括 Windows、Linux、VMWare和Solaris)中的外观和操作都相同。使…

多线程编译

多线程与多进程一样,为了能同时执行多个任务 区别 多进程 创建子进程,子进程会拷贝父进程的数据段的所有内存 进程是资源的获取单位 每个进程完全独立运行 更加关注两个进程之间的通信问题 多线程 线程是进程的最小组成单位,每个进程…

代码随想录算法训练营Day32 | 56. 合并区间 | 738.单调递增的数字 | 968.监控二叉树

今日任务 56. 合并区间 题目链接&#xff1a; https://leetcode.cn/problems/merge-intervals/题目描述&#xff1a; Code class Solution { public:vector<vector<int>> merge(vector<vector<int>>& intervals) {ranges::sort(intervals, [&…