PowerJob 分布式任务调度简介

news2024/11/27 2:22:05

目录

适用场景

设计目标

 PowerJob 功能全景

任务调度

工作流

分布式计算

动态容器

什么是动态容器?

使用场景

可维护性和灵活性的完美结合

实时日志&在线运维

PowerJob 系统组件

PowerJob 应用场景

PowerJob 的优势


PowerJob(原OhMyScheduler)是全新一代分布式任务调度与计算框架,其主要功能特性如下

  • 使用简单:提供前端Web界面,允许开发者可视化地完成调度任务的管理(增、删、改、查)、任务运行状态监控和运行日志查看等功能。
  • 定时策略完善:支持 CRON 表达式、固定频率、固定延迟和API四种定时调度策略。
  • 执行模式丰富:支持单机、广播、Map、MapReduce 四种执行模式,其中 Map/MapReduce 处理器能使开发者寥寥数行代码便获得集群分布式计算的能力
  • 工作流支持:支持在线配置任务依赖关系(DAG),以可视化的方式对任务进行编排,同时还支持上下游任务间的数据传递,以及多种节点类型(判断节点 & 嵌套工作流节点)。
  • 执行器支持广泛:支持 Spring Bean、内置/外置 Java 类,另外可以通过引入官方提供的依赖包,一键集成 Shell、Python、HTTP、SQL 等处理器,应用范围广。
  • 运维便捷:支持在线日志功能,执行器产生的日志可以在前端控制台页面实时显示,降低 debug 成本,极大地提高开发效率。
  • 依赖精简:最小仅依赖关系型数据库(MySQL/PostgreSQL/Oracle/MS SQLServer...)
  • 高可用 & 高性能:调度服务器经过精心设计,一改其他调度框架基于数据库锁的策略,实现了无锁化调度。部署多个调度服务器可以同时实现高可用和性能的提升(支持无限的水平扩展)。
  • 故障转移与恢复:任务执行失败后,可根据配置的重试策略完成重试,只要执行器集群有足够的计算节点,任务就能顺利完成。

在线试用:在线试用 · 语雀

适用场景

  • 有定时执行需求的业务场景:如每天凌晨全量同步数据、生成业务报表、未支付订单超时取消等。
  • 有需要全部机器一同执行的业务场景:如使用广播执行模式清理集群日志。
  • 有需要分布式处理的业务场景:比如需要更新一大批数据,单机执行耗时非常长,可以使用Map/MapReduce 处理器完成任务的分发,调动整个集群加速计算。
  • 有需要延迟执行某些任务的业务场景:比如订单过期处理等。

设计目标

PowerJob 的设计目标为企业级的分布式任务调度平台,即成为公司内部的任务调度中间件。整个公司统一部署调度中心 powerjob-server,旗下所有业务线应用只需要依赖 powerjob-worker 即可接入调度中心获取任务调度与分布式计算能力。

 PowerJob 功能全景

任务调度

 丰富的调度策略和强大的调度能力。

  • 原生提供 CRON、固定频率、固定延迟三种最常见的调度策略。
  • 额外提供 OpenApi 作为扩展调度策略,允许接入方完成调度层的自定义需求。
  • 整个调度层采用无锁化设计,基于时间轮进行调度,低延迟,高性能。

工作流

为什么要支持工作流?它解决了什么业务问题?

工作流描述了任务与任务之间的依赖关系,比如我现在有 A、B、C、D 四个任务,我希望 A 任务运行完毕后才开始运行 B、C 任务,最后再运行 D 任务。这就形成了一个依赖关系,可以通过有向无环图(DAG)来描述这个关系,如下图所示。

 DAG 定义:在图论中,如果一个有向图无法从某个顶点出发,经过若干条边回到该顶点,则这个图是一个有向无环图。

利用 DAG 轻松解决任务间复杂依赖问题。

  • 支持上游任务结果传递。
  • 提供前端界面可视化绘图&结果展示。
  • 每个节点本身都是 PowerJob 的任务,因此可以享受任务的所有基础能力(故障转移、MR、在线运维、实时日志等)。

分布式计算

  • 调度框架为什么需要分布式计算?

实际业务场景中,我们会有比较复杂的离线任务,说白了还是数据处理任务,那么涉及到数据,就会有大数据量级的数据处理,所以我们需要用到分布式计算。

  • 即便需要,市面上已有众多现成的分布式计算框架,PowerJob 是在重复造轮子吗?

答案是不是,因为市面上基本都是基于数据的处理,缺乏基于业务的处理。所以 PowerJob 是处理业务方面的数据问题。

PowerJob 是基于 MapReduce 模型的创新实现。

分而治之,Map :拆分;Reduce 装。

比如:一个根任务拆分成多个子任务,派发给不同的机器,最后再把结果汇总。 

  • 海量业务数据处理的好帮手。
  • 寥寥数行代码实现分布式计算。
  • 支持任意层级子任务拆分(无限Map)。

动态容器

什么是动态容器?

PowerJob 的容器技术允许开发者开发独立于 worker 项目之外的 Java 处理器,简单来说,就是以Maven 工程项目的维度去组织一堆 Java 文件(众多任务处理器),进而兼具开发效率和可维护性。

使用场景

比如有某个数据库数据订正任务,与主业务无关,写进原本的项目工程中不太优雅。这时候就可以单独创建一个用于数据操作的容器,在里面完成处理器的开发,通过 PowerJob 动态容器技术在 worker 集群上被加载执行。

可维护性和灵活性的完美结合
  • 使用简单,提供一键模版生成功能(类似于 spring initializr ),真正的开箱即用。
  • 部署便捷,除了普通的上传 FatJar 部署方式外,额外支持 Git 源码部署,一站式完成编译、打包、部署和加载。
  • 开发高效,动态容器支持完整 Spring 特性,开发容器和开发普通 Spring 项目没有任何区别。

实时日志&在线运维

PowerJob 系统组件

所有组件均支持水平扩展。

  • powerjob-server:调度中心,整个公司内部统一部署,负责任务管理和调度。
  • powerjob-worker:执行器,提供单机执行、广播执行和分布式计算等功能。
  • powerjob-client:可选组件,OpenAPI客户端 。

PowerJob 应用场景

普通定时任务:比如生成业务报表等。

有需要全部机器执行同一任务的业务场景:比如清理日志。

有需要分布式处理的业务场景:比如需要更新一大批数据,单机执行耗时非常长,可以使用Map/MapReduce处理器完成任务的分发,调动整个集群加速计算。

有需要延迟执行某些任务的业务场景:比如订单过期处理。

PowerJob 的优势

功能强大,使用简单,文档齐全。

丰富的调度策略(CRON、固定频率、固定延迟、OpenAPI)。

支持工作流(workflow),可视化编排复杂任务依赖关系。

支持分布式计算,寥寥数行代码完成分布式计算。

依赖精简:最小依赖仅为关系型数据库,扩展依赖 MongoDB。

执行器支持广泛:Java、Shell、Python……

高可用& 高性能:所有组件均支持集群部署,水平扩展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1582337.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

中国500米分辨率年最大EVI数据集

增强型植被指数(EVI)是在归一化植被指数(NDVI)改善出来的,根据大气校正所包含的影像因子大气分子、气溶胶、薄云、水汽和臭氧等因素进行全面的大气校正,EVI大气校正分三步,第一步是去云处理。第…

基于SpringBoot+Vue网上医院预约挂号系统+jsp(源码+部署说明+演示视频+源码介绍+lw)

您好,我是码农飞哥(wei158556),感谢您阅读本文,欢迎一键三连哦。💪🏻 1. Python基础专栏,基础知识一网打尽,9.9元买不了吃亏,买不了上当。 Python从入门到精通…

python使用uiautomator2操作雷电模拟器9

之前写过一篇文章 python使用uiautomator2操作雷电模拟器_uiautomator2 雷电模拟器-CSDN博客 上面这篇文章用的是雷电模拟器4,雷电模拟器4.0.78,android版本7.1.2。 今天有空,再使用雷电模拟器9,android版本9来测试一下 uiauto…

绝地求生29.1版本更新后进不去 绝地求生更新后进不去游戏怎么办

绝地求生游戏共有两种主要模式:第一人称模式和第三人称模式。在这两种模式下玩家可以分别进行单排,双排,四人组队或单人匹配四人团队模式。在进入游戏的时候,玩家可以在面板选择第一人称以及第三人称。在双排或四排等组队多人游戏…

【学习】软件测试需求分析要从哪些方面入手

软件测试需求分析是软件测试过程中非常重要的一个环节,它是为了明确软件测试的目标、范围、资源和时间等要素,以确保软件测试的有效性和全面性。本文将从以下几个方面对软件测试需求分析进行详细的阐述: 一、软件测试目标 软件测试目标是指…

CSS文本单行溢出和多行溢出样式

一、单行溢出 1.代码 <!DOCTYPE html> <html><head><meta charset"UTF-8" /><title>demo</title><style>#div2{overflow: hidden;white-space: nowrap;/*强制不换行*/text-overflow:ellipsis;/*超出的部分用省略号代替*…

gitee和idea集成

1 集成插件 2 配置账号密码 3 直接将项目传到仓库 4直接从gitee下载项目

【Linux】有关时间的命令(date、timedatectl)

专栏文章索引&#xff1a;Linux 有问题可私聊&#xff1a;QQ&#xff1a;3375119339 目录 一、data命令 1.介绍 2.常用参数 3.常用选项 二、timedatectl命令 1.介绍 2.常用子命令 一、data命令 1.介绍 date命令用于显示或设置系统的时间与日期&#xff0c;语法格式为&a…

axios取消请求,解决接口返回顺序错乱问题

下面的方案适用于系统中的某个请求的取消&#xff0c;项目的请求使用 axios 封装 使用场景&#xff1a;当页面有多个 tab&#xff0c;例如年、月、日的列表数据&#xff0c;当点击切换的时候要获取对应的数据&#xff0c;此时如果快速点击在tab直接反复横跳会出现下面的问题&am…

java对象是怎么在jvm中new出来的,在内存中查看java对象成员变量字段属性值

java对象是怎么在jvm中new出来的 查看java对象字段属性在内存中的值 java 对象 创建 流程 附上java源码 public class MiDept {private int innerFiled999;public MiDept() {System.out.println("new MiDept--------------");}public String show(int data) {Sy…

40.Python从入门到精通—Python3 JSON 数据解析 Python3 日期和时间 什么是时间元组? 获取当前时间 获取格式化的时间

40.Python从入门到精通—Python3 JSON 数据解析 Python3 日期和时间 什么是时间元组&#xff1f; 获取当前时间 获取格式化的时间 Python3 JSON 数据解析Python3 日期和时间什么是时间元组&#xff1f;获取当前时间获取格式化的时间 Python3 JSON 数据解析 Python3 中可以使用…

大数据基本名词

目录[-] 1.1. 1. Hadoop1.2. 2. Hive1.3. 3. Impala1.4. 4. Hbase1.5. 5.hadoop hive impala hbase关系1.6. 6. Spark1.7. 7. Flink1.8. 8. Spark 和 Flink 的应用场景 1. Hadoop 开源官网&#xff1a;https://hadoop.apache.org/ Hadoop是一个由Apache基金会所开发的分…

宝宝眼睛轻揉小心,健康成长路上的关怀指南

引言&#xff1a; 宝宝的眼睛是他们认知世界的窗户&#xff0c;眼睛的健康对于他们的成长至关重要。然而&#xff0c;有时我们会发现宝宝揉眼睛的情况&#xff0c;这可能会引起家长的担忧。本文旨在探讨新生儿揉眼睛的注意事项&#xff0c;以及如何正确处理这种情况&#xff0c…

谷歌推出适用于安卓设备的“Find My Device”网络,功能类似苹果Find My

谷歌今日推出了适用于安卓设备的“Find My Device”网络&#xff0c;其功能类似于苹果的“Find My”网络&#xff0c;旨在帮助用户定位丢失、被盗的安卓产品。 安卓的“Find My Device”网络可以利用数以亿计运行 Android 9 或更高版本的安卓设备&#xff0c;通过蓝牙信号追踪丢…

mysql 查询实战-变量方式-解答

对mysql 查询实战-变量方式-题目&#xff0c;进行一个解答。&#xff08;先看题&#xff0c;先做&#xff0c;再看解答&#xff09; 1、查询表中⾄少连续三次的数字 1&#xff0c;处理思路 要计算连续出现的数字&#xff0c;加个前置变量&#xff0c;记录上一个的值&#xff0c…

FHE全同态加密简介

1. 何为FHE&#xff1f; FHE (Fully homomorphic encryption)&#xff1a; 是一种隐私技术&#xff0c;支持直接对密文进行计算&#xff0c;而无需对密文先解密再计算。即&#xff0c;任何第三方或云厂商&#xff0c;都可对敏感信息的密文进行处理&#xff0c;而无需访问密文内…

Spring 之 IoC概述

目录 1. IoC概述 1.1 控制反转 1.2 依赖注入 2. IoC容器在Spring中的实现 2.1 BeanFactory 2.2 ApplicationContext 2.2.1 ApplicationContext的主要实现类 1. IoC概述 全称&#xff1a;Inversion of Control&#xff0c;译为 “控制反转” Spring通过IoC容器来管理所有…

【DM8】物化视图

物化视图 (MATERIALIZED VIEW) 是目标表在特定时间点上的一个副本&#xff0c;占用存储空间&#xff0c;即将查询出来的数据存储在数据库中。 当所依赖的一个或多个基表的数据发生更新&#xff0c;必须启用刷新机制才能保证数据是最新的。 物化视图可以用于数据复制&#xff08…

Unity 遮罩

编辑器版本 2017.2.3f1 学习Unity的三张遮罩方式 1. Mask 遮罩方式 首先&#xff0c;在界面上创建2个Image&#xff0c;一个命名Img_Mask,大小设置 400* 400&#xff0c; 一个命名Img_Show,大小设置500*500。 然后&#xff0c;给 Img_Mask添加Mask,选择Img_Mask,点击Add Com…

宁波宠物展|2024中国(宁波)国际宠物用品博览会

中国(宁波)国际宠物用品博览会 地点&#xff1a;宁波国际会展中心 时间&#xff1a;2024年11月14-16日 主办单位:凤麟展览(宁波)有限公司 协办单位:浙江省宠物产业协会 宁波市跨境电子商务协会 宁波欧德国际商务咨询服务有限公司 宁波扬扬会议展览有限公司 20000方展览…