奇富科技引领大数据调度革命:高效、稳定、实时诊断

news2025/1/12 8:42:18

日前,在世界最大的开源基金会 Apache旗下最为活跃的项目之一DolphinScheduler组织的分享活动上,奇富科技的数据平台专家刘坤元应邀为国内外技术工作者献上一场题为《Apache DolphinScheduler在奇富科技的优化实践》的精彩分享,为大数据任务调度系统的未来探索出一条新的道路。

7301dcfe7d3e4cc4b2e44b03a99db6fb.png 

刘坤元以一个数仓(数据仓库的简称,指用于存储、分析、报告的数据系统)同学熟知的起夜率指标开启了本次分享。

在建设大数据平台时,企业通常会面临数据生产的稳定性问题,数仓同学在值班期间需要处理各种告警和任务。工作通常从凌晨0:30开始,收到首条告警后起床,不断接到更多电话告警,不得不跑到客厅办公。由于对上下游任务逻辑不太清楚,2:00左右召集其他同学一起处理问题。凌晨3:00时,惊动老板起夜,电话沟通处理方案。5:00,所有任务处理完成后,等待计算数据。7:00睡眼朦胧地起床上班。9:00刚到公司楼下,就被业务人员在工作群里“+1”“+1”“+10086”地催问数据产出时间,手忙脚乱中开始一天的工作。

“可以说,天下数仓同学苦起夜值班久矣!好消息是,在奇富科技内部,由于引入了Apache DolphinScheduler,起夜率这个核心指标有了83%的下降。”刘坤元说。

谈到Apache DolphinScheduler的引入,刘坤元回顾了奇富科技数据平台工作原本面临的挑战。

由于奇富科技是一家金融科技公司,业务需要保证高可用,所以,奇富科技的调度平台是异地双机房架构,核心工作流会异地双机房运行。这会带来三点困难。

首先,调度任务量大。目前每天调度的工作流实例在3万多,任务实例在14万多。每天调度的任务量非常庞大。每天保障这么多任务实例稳定、无延迟运行,是一个非常大的挑战。

其次,运维复杂。因为每天调度的任务实例非常多,经历了几次调度机器扩容阶段。目前2个调度集群有6台Master、34台Worker机器。而且调度机器处于异地2个城市,增加了很多管理运维复杂性。

第三,SLA要求高。因为要支持的业务带有金融属性,如果调度服务稳定性出问题,导致任务重复调度、漏调度或者异常,损失会非常大。

针对以上三个问题,奇富科技在2022年中着手引入了Apache DolphinScheduler,围绕调度服务稳定,做了两个方向的优化。第一,调度服务稳定性优化。第二、调度服务监控。细节请见《Apache DolphinScheduler 在奇富科技的首个调度异地部署实践》https://mp.weixin.qq.com/s/hAp7IQPWbhaaVuRsW7LtGg

改造之后的效果,刘坤元也给出了几个具体表现:

以前1周到半个月才能完成的数据需求任务,现在3个小时就可以交付;

每天把不同数据源新增200-300T的数据,转化为10000张以上的各类报表,三五个同学就游刃有余;

新增诊断功能后,无需人工干预,系统自动生成诊断报告;

……

在分享活动中,奇富科技性能更稳定、规模更大、功能也更加丰富的数据系统,也引起了金融机构的关注与兴趣。DolphinScheduler提出建议,可以将这一系统产品化并推向市场。

一方面,产品化令金融机构能直接受益于奇富科技的经验,提高数据生产的稳定性,实现更高效的数据处理。金融机构通常面临的如调度任务量大、运维复杂等问题将迎刃而解。

另一方面,奇富科技的经验也将为其他行业提供有价值的启示。数据调度是许多行业都需要面对的问题,因此奇富科技的解决方案不仅局限于金融领域。这有望在各个行业中推动更多创新和效率提升。

活动最后,DolphinScheduler对奇富科技的创新精神和分享精神给予了极高的赞赏:奇富科技的经验分享不仅促进了技术进步,还鼓励了更多公司积极参与开源社区,从中获益,推动了整个金融科技领域向前发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1151799.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[推荐]SpringBoot,邮件发送附件含Excel文件(含源码)。

在阅读本文前,可以先阅读我的上一篇文章: SpringBoot,使用JavaMailSender发送邮件(含源码)。 ,本文使用的代码案例涉及到的 jar包、application.properties配置与它相同。 先看一下效果。 图一 图二 在下方代码案例中,…

智安网络|保护您的应用程序免受攻击:重要的安全强化措施

在今天的数字化时代,应用程序安全成为了企业和个人必须重视的重要领域。应用程序普遍存在的安全漏洞成为黑客们进行攻击的一个突破口。为了保护敏感数据和个人隐私,我们必须了解并实施一系列的关键措施来加固应用程序的安全性。 首先,一个关…

3D max软件有哪些技巧可快速选择区域?

使用3D max软件时,有新手朋友反馈说,为什么3dmax选择区域怎么改不了? 还有就是3dmax选择区域不显示该怎么办? 或者是3dmax选择区域变成圆形了。 针对以上这几类问题,只要掌握这几种方法就可以。小编整理了几种3D max…

一天收入500元的货拉拉运费差项目靠谱吗?

最近的货拉拉运费差项目有点火呀!收费也不低,1680-16980的比比皆是。 这个项目去年我就在某些平台看到过,今天就跟大家详细聊聊这个项目,想入坑的不妨先看看这篇文章。 一:项目原理 有人叫它货拉拉搬砖项目&#xf…

2023应届生能力考试含解析(Java后端开发)——(1)

1.以下代码的循环次数是 ( ) public class Test {public static void main(String[] args) {int i 7;do {System.out.println(--i);--i;} while (i ! 0);System.out.println(i);} } A 0 B 1 C 7 D 无限次 这段代码会导致无限循环的原因是在 do-while 循环中&#…

毕业设计基于SpringMVC+Mybatis+Bootstrap的电影院管理系统源码+数据库

<<电影院管理系统>> 电影院管理系统&#xff1a;SpringMVCJSPTomcatMybatisBootstrapJqueryAnimateCSSLayerJS 项目部署&#xff1a;该项目是IDEA版本&#xff0c;Maven项目 前端依赖&#xff1a; Bootstrap-3.4.1Animate.css- 4.1.1Jquery-3.6.0Layer-v3.5.1B…

83.每日一练:搜索插入位置(力扣第35题)

问题描述 代码解决以及思想 class Solution { public:int searchInsert(vector<int>& nums, int target) {int left 0; // 定义左边界int right nums.size() - 1; // 定义右边界while (left < right) { // 当左边界小于…

基于【逻辑回归】的评分卡模型金融借贷风控项目实战

背景知识&#xff1a; 在银行借贷过程中&#xff0c;评分卡是一种以分数形式来衡量一个客户的信用风险大小的手段。今天我们来复现一个评分A卡的模型。完整的模型开发所需流程包括&#xff1a;获取数据&#xff0c;数据清洗和特征工程&#xff0c;模型开发&#xff0c…

python读取列数不规则文件/python数据框分割

问题 将探空数据读取&#xff0c;并按每日单纯储存&#xff0c;数据如下&#xff1a; 为一年数据&#xff0c;存在部分列的数据缺失问题。 数据读取 使用read_csv文件读取文件&#xff0c;由于列数存在不一致问题&#xff0c;需要固定最大列数&#xff1a; names["da…

function函数指针和lamada的[]和[=]注意事项

在工作的过程中&#xff0c;lamda表达式的 重点&#xff1a; 1.function对象存储函数指针。 2.lamada表达式&和捕捉的方式 lamda传入引用&&#xff0c;导致作用域消失&#xff0c;最终报错 std::function<void()> pFun; void GetNum1(const std::function<…

python随手小练14

题目&#xff1a; 文件操作 &#xff1a; 根据文件要求&#xff08;测试&#xff09;筛选出数据并且放入一个新的文件 具体操作&#xff1a; f1 open("1.txt","r",encoding"UTF-8") f2 open("2.txt","w",encoding"U…

【Linux】:Linux开发工具之Linux编译器——gcc/g++的使用

&#x1f4bb;1.背景知识 &#x1f372;1. 预处理&#xff08;进行宏替换) 预处理阶段我们要分为1.头文件展开2.宏替换3.条件编译4.去掉注释 这一步会帮助我们生成.i文件 &#x1f372;2. 编译&#xff08;生成汇编) 编译阶段我们要分为1.检查语法2.生成汇编代码 最后生成.s文…

物联网二维码核销盒对接文档

核销盒是干嘛的&#xff1f; 1.在某些场景下快速核销订单或打卡签到等&#xff0c;通过核销盒能快速将订单信息发送到后端进行处理。 一&#xff0c;首先你需要有一台核销设备&#xff0c;也就是核销盒。 二&#xff0c;通过接口激活或更新核销盒 ​​​​​​​ 简要描述 激…

如何通过API接口对接淘宝平台商品订单/买家订单/卖家订单接口数据【附代码实例】

通过API获取订单号&#xff1a; 如果需要通过API获取订单号&#xff0c;首先需要在淘宝联盟开通API权限&#xff0c;并获取到自己的appKey和appSecret。 具体步骤如下&#xff1a; &#xff08;1&#xff09;构建API请求&#xff0c;包括API接口、请求参数、签名等信息&…

UTC时间戳与北京时间转换

文章目录 前言一、几个时间相关的概念二、场景三、验证方法四、源码五、运行结果六、资源自取 前言 在应用中用到了 UTC 时间戳与北京时间进行转换的需求&#xff0c;这里做一个记录&#xff0c;方便后面有需求时直接拿来用。 一、几个时间相关的概念 GMT 时间&#xff1a;Gr…

【分布式·大数据】大模型赛道如何实现华丽的弯道超车 —— AI/ML训练赋能解决方案

文章目录 大模型赛道如何实现华丽的弯道超车 —— AI/ML训练赋能解决方案01 具备对海量小文件的频繁数据访问的 I/O 效率02 提高 GPU 利用率&#xff0c;降低成本并提高投资回报率03 支持各种存储系统的原生接口04 支持单云、混合云和多云部署01 通过数据抽象化统一数据孤岛02 …

数据库扩展语句,约束方式

扩展语句 create table if not exists ky32 &#xff08;&#xff09;&#xff1a;如果表存在就不创建了 zerofill 自动补齐&#xff08;在命令行可以查看&#xff09; primary key 设置成主键 auto_increment 表示这一列可以自增&#xff0c;默认从1开始&#xff0c;每条记录…

springboot和flask整合nacos,使用openfeign实现服务调用,使用gateway实现网关的搭建(附带jwt续约的实现)

环境准备&#xff1a; 插件版本jdk21springboot 3.0.11 springcloud 2022.0.4 springcloudalibaba 2022.0.0.0 nacos2.2.3&#xff08;稳定版&#xff09;python3.8 nacos部署&#xff08;docker&#xff09; 先创建目录&#xff0c;分别创建config&#xff0c;logs&#xf…

轻松理解 Transformers(2):Attention部分

编者按&#xff1a;随着人工智能技术的不断发展&#xff0c;Transformers 模型架构已成为自然语言处理领域的重要基石。然而&#xff0c;许多人对其内部工作机制仍然感到困惑。本文通过浅显易懂的语言和生活中的例子&#xff0c;帮助读者逐步理解 Transformers 中最核心的 Atte…

加速度中标云尖信息「电子元器件商城」开发项目——加速度jsudo

深圳市加速度软件开发有限公司在电子元器件和工业品行业有着多年得商城开发经验&#xff0c;服务过半导体、元器件、工业品行业的多家上市公司或实力工厂。选择加速度合作的60%的客户&#xff0c;或多或少都有踩坑的经历&#xff0c;这一次他们在选择商城开发商的时候格外谨慎&…