【第八期】Apache DolphinScheduler 每周 FAQ 集锦

news2024/10/6 14:25:21

点击蓝字 关注我们

c10ce9206c90d1944ab9172fd8c48f2a.png

摘要

为了让 Apache DolphinScheduler 的广大用户和爱好者对于此项目的疑问得到及时快速的解答,社区特发起此次【每周 FAQ】栏目,希望可以解决大家的实际问题。

关于本栏目的要点:

  1. 本栏目每周将通过腾讯文档(每周更新)从社区微信群收集 10-30 个问答,并在每周五整理具有典型代表意义的问答后发布,供大家参考。

  2. 所有人均可登录文档并提出问题,每人限 2 个提问,提问范围包括:

    1. 关于 Apache DolphinScheduler 的使用问题和技术性问题;

    2. 在实际应用中遇到的瓶颈问题;

    3. 参与社区贡献遇到的困难;

    4. 关于社区发展的疑问。

  3. 资源有限,请勿提问项目无关问题。

  4. 【每周FAQ】是一个社区互助的项目,发起宗旨是鼓励社区成员相互帮助,因此,欢迎大家积极踊跃志愿回答提出的疑问,在腾讯文档中写下答案即可。(高手们都别“潜水”了,出来露一手😜😎)

  5. 在社群里已经提问的问题,请勿在文档中重复提问,节约资源。

  6. 本栏目招募志愿者,有兴趣参与的小伙伴请加微信小助手 Leonard ds 报名。

5月20日-5月26日

有没有源码编译打包(选择zk版本)的操作文档呢?    

https://github.com/apache/dolphinscheduler/

blob/dev/CONTRIBUTING.md#build-with-different-zookeeper-versions     

目前部署的是3.1.5的版本, 使用的是 zookeeper3.8的版本,都是部署在k8s的环境里面 , 但DS如果配置了zk的集群地址, 就连不上,但可以确认这个zk的集群地址是没问题, 但DS的apiserver启动的时候,就是一直报连接zk超时,是不是3的版本对zk的配置有什么特别的地方呢?    

没有,请确定网络是否有问题,可以新建一个单节点同版本的 zk 连接测试下,应该没有问题的。    

单节点的海豚的工作流放到集群的海豚中,condition没有反应,但是前面的节点都显示加工完成了,这个是什么问题呢?   

看看日志,如果是3.1.x 版本的请提 issue 具体跟进。    

DS 3.1.0 ,单机版,worker 节点经常假死,进程还在,但是监控中心看不到,这个是 zk 丢失了worker节点心跳导致的吗?    

可能是,这个时候看看worker 日志,有心跳写入状态的日志的,以及 worker 服务器的负载。   

一个网卡,绑定多个IP时,增加work节点,识别出来的IP,不是我要用的IP,如何调整呢?    

所在节点上更改此配置文件

worker-server/conf/common.properties里面的# network interface preferred like eth0, default: empty#dolphin.scheduler.network.interface.preferred=。   

3.1.3 接口文档 访问地址是什么?http://xxxx/dolphinscheduler/doc.html 这个好像访问不了。    

http://{API server ip}:12345/dolphinscheduler/swagger-ui/index.html 请查看官方文档 https://dolphinscheduler.apache.org/en

-us/docs/3.1.7/guide/api/open-api    

DS 的定时调度无法执行,已经定时过的任务无法上线下线,但是可以手动点击执行,请问这种问题应该如何解决呢?    

看看不能执行的时候 master 的日志是什么问题,如果是 3.1.x 版本的请提 issue 具体跟进。    

资源中心能用mysql吗?    

不行,仅本地、hdfs、s3, oss。    

3.1.1版本上传300M以上的文件报错java.lang.OutOfMemoryError: Java heap space`,修改了dolphinscheduler-daemon.sh的api-server项内存大小参数。但是没有变化,还是报错,内存参数也没有改过来。    

修改下 api-server/start.sh 里面的内存大小看看。    

通过Docker部署的DolphinScheduler,怎么添加宿主服务器上DataX的环境变量呢?    

挂盘,能访问宿主目录就行,需要docker映射访问。    

目前使用海豚3.1.3版本,点击测试hive连接在hiveservice2里面产生了5个长链接没有关闭,生产环境跑sqltask也是这样连接被打满了,怎么解决?    

拉这个分支试一下,这个是去掉线程

池的pr:https://github.com/apache/dolphinscheduler/pull/14183    

DS 3.1.0 工作流定义好上线后执行,  工作流的实例里总没有生成,要重启DS后才能看到实例,是bug还是哪里的问题?    

看看 master 的日志是否有异常。    

Dolphinscheduler支持CAS单点登陆吗?    

目前开源版本没有,但是商业版本有,有商业版需要可以联系运营(微信17743592110)。    

DS怎么试运行?    

需要在 Ubuntu 或 Mac 系统下调试。    

怎么通过DS token实现前台免密登录?   

DS界面化上,有个授权界面,可以生成token的。在这个token的有效期内,是可以直接请求对应的接口的。系统A 要免密登到DS,流程:第一步:系统A通过某种途径获取到DS的token,并保存到系统A。第二步,系统A携带该token,跳转到ds界面 。问题:1.确认下在ds前端界面传的token与通过界面获取的token有无区别,2.如何获取到DS的token。3.理论上只要系统A与DS,都认可某个token,就可以实现免密登录的。或者给予DS与系统A,在开发出一个认证与授权服务,专门来做认证与授权(当然也包括免密登录),我个人更倾向这种方式。ds做调度,dlinky做在线开发,在搞个数据治理,SeaTunnel做数据集成,基本上就是数据中台的模型。    

3.1.5版本中,使用datax组件同步数据时,显示中文乱码,可能考虑原因有哪些?乱码格式:������������������     

在worker本地用命令行之行下 datax, 如果同样有问题就是你服务器编码缺少中文的问题。   

DS 3.1.2版本中,当一个任务流作为一个子任务并发执行的时候,后执行的任务流接收不到全局变量,什么原因?    

如果是说subprocess 参数传给父工作流的话,目前 3.1.x 还不支持,我们有一个开源之夏的课题会做这个事情,可查看详情报名:https://summer-ospp.ac.cn/org/orgdetail/22999f09-2be2-4dd8-b10f-bc4d6610cc25?lang=zh。    

数据质量模块可以配置问题数据入库的方式吗?如果要修改源码的话工作量大吗?大概在哪里子模块类中去修改?后续会不会在页面中增加配置问题数据的处理方式?    

数据质量只是做数据的校验,不清楚你问题数据是什么意思,如果是指数据质量写入result 表的逻辑的话,是在 dolphinscheduler-data-quality  这个module 中的。    

DS 3.1.6版本中zk注册失败是什么原因?    

可能是 zk 版本不兼容,3.1.6 推荐使用的版本是 3.8.0, 但是有用户发现低版本也可以

使用,另外想要用低版本可以用 

https://github.com/apache/dolphinscheduler/

blob/dev/CONTRIBUTING.md#build-with-different-zookeeper-versions 这个方式自行打包。    

jetty在什么情况下会跑着跑着自己就停了?有人用python程序作为业务进程,python进程去启动c++程序,c++程序可能会崩溃。他们自己本地执行这个py程序没问题,用worker调这个py程序,在c++程序崩溃后就会卡死。    

可以看看机器是否是否有运行一些别的命令,按道理不应该存在这种情况,除非本地和生产的资源不一样,而生产上的资源有瓶颈了。     

3.1.0版本中,使用海豚时出现Hive数据源连接池获取不到连接的情况,有什么建议避免?    

直接使用shell,升级或者二开。    

如果不想在worker 本地执行datax 任务,可以通过k8sTask类型节点 或者 ssh数据源解决吗?    

可以和hadoop nodemanager混部,算是弹性伸缩,晚上22点,nodemanager开启维护模式。ds关闭维护模式,开始抓取ds任务。早上8点,ds开启维护模式,nodemanager关闭维护模式,开始抓取yarn任务。    

参与贡献

随着国内开源的迅猛崛起,Apache DolphinScheduler 社区迎来蓬勃发展,为了做更好用、易用的调度,真诚欢迎热爱开源的伙伴加入到开源社区中来,为中国开源崛起献上一份自己的力量,让本土开源走向全球。

688046f58ee7c51f2ec9bcdd0309d041.png

参与 DolphinScheduler 社区有非常多的参与贡献的方式,包括:

b9ec95d6dd9eb76f8880b4d2df669994.png

贡献第一个PR(文档、代码) 我们也希望是简单的,第一个PR用于熟悉提交的流程和社区协作以及感受社区的友好度。

社区汇总了以下适合新手的问题列表:https://github.com/apache/dolphinscheduler/issues/5689

非新手问题列表:https://github.com/apache/dolphinscheduler/issues?q=is%3Aopen+is%3Aissue+label%3A%22volunteer+wanted%22

如何参与贡献链接:https://dolphinscheduler.apache.org/zh-cn/community/development/contribute.html

来吧,DolphinScheduler开源社区需要您的参与,为中国开源崛起添砖加瓦吧,哪怕只是小小的一块瓦,汇聚起来的力量也是巨大的。

参与开源可以近距离与各路高手切磋,迅速提升自己的技能,如果您想参与贡献,我们有个贡献者种子孵化群,可以添加社区小助手微信(Leonard-ds) ,手把手教会您( 贡献者不分水平高低,有问必答,关键是有一颗愿意贡献的心 )。

09385c83b5fcc139de0c7d13a482b6ab.jpeg

添加社区小助手微信(Leonard-ds) 

添加小助手微信时请说明想参与贡献。

来吧,开源社区非常期待您的参与。

< 🐬🐬 >

更多精彩推荐

☞Apache DolphinScheduler 深圳 Meetup,走进OPPO不容错过的大数据盛宴!

☞优秀用户案例有奖征集 | 活动火热开启,快来投稿!

☞Apache DolphinScheduler 发布 3.1.6 版本,支持 SeaTunnel Zeta 引擎

☞Apache DolphinScheduler 荣获 2022 年中国开源创新大赛二等奖!

☞去年办了这么多场Meetup都没有你,2023年赶紧安排起来!

☞企业级应用如何用 Apache DolphinScheduler 有针对性地进行告警插件开发?

☞CommunityOverCode Asia 2023 强势来袭!15 大专题议题征集 6 月 6 日截止

我知道你在看6284059f15233f3434a4086167c88678.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/575195.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

初识Monorepo

引言 在如今快节奏的前端开发中&#xff0c;管理多个项目和组件的复杂性成为了开发团队的挑战&#xff0c;Monorepo&#xff08;单一代码仓库&#xff09;作为一种新兴的解决方案&#xff0c;正在成为开发团队的新宠。 Monorepo简介 是什么 Monorepo 是一种软件开发的策略模式…

21 VueComponent 事件的处理

前言 这是最近的碰到的那个 和响应式相关的问题 特定的操作之后响应式对象不“响应“了 引起的一系列的文章 主要记录的是 vue 的相关实现机制 呵呵 理解本文需要 vue 的使用基础, js 的使用基础 测试用例 测试用例如下, 一个简单的 按钮事件的触发 问题的调试 调用…

理解 Linux 文件权限

章节目录&#xff1a; 一、Linux 的安全性1.1 /etc/passwd 文件1.2 /etc/shadow 文件1.3 添加新用户1.4 删除用户1.5 修改用户 二、使用 Linux 组2.1 /etc/group 文件2.2 创建新组2.3 修改组 三、理解文件权限3.1 使用文件权限符号3.2 默认文件权限 四、更改安全设置4.1 修改权…

chatgpt赋能python:Python如何捕捉窗口?——一位有10年Python编程经验的工程师谈Windows操作系统编程

Python 如何捕捉窗口&#xff1f;——一位有10年Python编程经验的工程师谈Windows操作系统编程 自从计算机出现以来&#xff0c;人们就开始与操作系统打交道。而对于Windows系统而言&#xff0c;捕捉窗口通常需要在应用程序级别完成。但是&#xff0c;使用Python与Windows编程…

新手须知的pr入门知识,小红书媒介话术分享

我们都知道&#xff0c;这是一个内容为王的时代。在众多的平台上&#xff0c;都存着无数优秀的内容产出者&#xff0c;也就是达人。今天对新手须知的pr入门知识&#xff0c;小红书媒介话术分享。 一、什么是pr PR即Public Relations的简称&#xff0c;翻译过来就是公关的意思 。…

惠普HP4294A(110M) 安捷伦agilent 4294a精密阻抗分析仪

HP/Agilent 4294A 精密阻抗分析仪是一种集成解决方案&#xff0c;可对元件和电路进行有效的阻抗测量和分析。HP/Agilent 4294A 覆盖更宽的测试频率范围&#xff08;40 Hz 至 110 MHz&#xff09;&#xff0c;基本阻抗精度为 /-0.08%。出色的高 Q/低 D 精度可实现低损耗组件的分…

恭喜,拿到华为OD offer了,并分享刷题经验

目录 一、先介绍一下华为OD是个什么鬼&#xff1f;1、华为OD背景2、华为OD现状3、华为OD趋势4、华为OD介绍&#xff08;1&#xff09;人力外包&#xff08;2&#xff09;员工关系&#xff08;3&#xff09;工作关系&#xff08;4&#xff09;薪酬福利&#xff08;5&#xff09;…

Window MinGW 编译 OpenCV 人快疯了看这里!

目录 一、使用官方编译好的 二、使用MinGW编译器自行进行编译 三、编译好的OpenCV库 OpenCV3.4.5 OpenCV 4.5.4 一、使用官方编译好的 【Qt】opencv源码&官方编译好的opencv在windows下使用的区别_外来务工人员徐某的博客-CSDN博客 官方替我们编译好了&#xff0c;可以直…

一篇文章带你了解Netty

Netty 传统的IO模型的web容器&#xff0c;比如老版本的Tomcat&#xff0c;为了增加系统的吞吐量&#xff0c;需要不断增加系统核心线程数量&#xff0c;或者通过水平扩展服务器数量&#xff0c;来增加系统处理请求的能力。有了NIO之后&#xff0c;一个线程即可处理多个连接事件…

DNSPod十问崔久强:证书有效期缩短,CA机构要凉透?

本期嘉宾 崔久强 上海CA中心总经理 崔久强&#xff0c;上海市数字证书认证中心有限公司总经理、上海市静安区政协委员、第一届上海市智慧城市建设领军先锋、一带一路信息产业发展联盟数字签名专委会主任委员、中国电子认证产业联盟专委会委员、中国密码学会电子认证专委会理事…

【P35】JMeter 包含控制器(Include Controller)

文章目录 一、包含控制器&#xff08;Include Controller&#xff09;参数说明二、准备工作三、测试计划设计3.1、保存测试片段3.2、使用测试片段 一、包含控制器&#xff08;Include Controller&#xff09;参数说明 可以将测试计划的某一部分提取为公用逻辑&#xff0c;这样…

Goby 漏洞更新 |中保無限Modem Configuration Interface 默认口令漏洞

漏洞名称&#xff1a;中保無限Modem Configuration Interface 默认口令漏洞 English Name&#xff1a;Gemtek Modem Configuration Interface Default password vulnerability CVSS core: 5.0 影响资产数&#xff1a;4521 漏洞描述&#xff1a; Modem Configuration Inter…

chatgpt赋能python:Python操作网页的SEO

Python操作网页的SEO 在当今的数字时代&#xff0c;许多企业专注于提高其网站的排名。在这种竞争激烈的环境中&#xff0c;搜索引擎优化&#xff08;SEO&#xff09;是必不可少的。虽然有许多方法可以提高网站的排名&#xff0c;但其中一个最重要的是使用Python来操作网页。 …

Git进阶·GitFlow·壹

文章目录 1 Git进阶——GitFlow工作流程1.1 master与develop分支1.1.1 master1.1.2 develop 1.2 feature分支1.3 Release分支1.4 hotfix分支1.5 GitFlow示例1.5.1 在master上新建dev分支1.5.2 基于dev创建feature分支1.5.3 feature分支上开发业务代码1.5.4 将feature合并到dev1…

Linux的进程信号(上)

文章目录 1. 信号入门2. 技术应用角度的信号3. 信号概念4. 信号处理常见方式5. 产生信号5.1 通过终端按键产生信号5.2 调用系统函数向进程发信号5.3 由软件条件产生信号5.4 硬件异常产生信号 6. Core Dump 1. 信号入门 在生活中&#xff0c;比如红绿灯&#xff0c;铃声这些&am…

chatgpt赋能python:Python指定行:如何快速定位和修改代码?

Python指定行&#xff1a;如何快速定位和修改代码&#xff1f; 在日常Python编程中&#xff0c;我们经常需要在众多行的代码中找到一个特定行&#xff0c;进行修改或者执行操作。如果依靠肉眼逐行检查&#xff0c;不仅费时费力&#xff0c;而且容易漏看或者出错。那么有没有一…

chatgpt赋能Python-python_或与非

介绍 随着互联网的不断发展&#xff0c;搜索引擎优化&#xff08;SEO&#xff09;已经成为了数百万网站主必不可少的一项工作。而Python作为一门高效&#xff0c;灵活和易于阅读的编程语言&#xff0c;不仅可以加快SEO的工作进程&#xff0c;同时也可以提高工作效率。本文将重…

Linux读写锁逻辑解析

一、Linux为何会引入读写锁&#xff1f; 除了mutex&#xff0c;在linux内核中&#xff0c;还有一个经常用到的睡眠锁就是rw semaphore&#xff08;后文简称为rwsem&#xff09;&#xff0c;它到底和mutex有什么不同呢&#xff1f;为何会有rw semaphore&#xff1f;无他&#xf…

在Flask中构建API接口

重定向行为 斜杠 以下两个路由的不同之处在于是否使用尾部的斜杠。 第一个路由的URL尾部有一个斜杠&#xff0c;看起来就像一个文件夹&#xff0c;访问一个没有斜杠结尾的URL时&#xff0c;Flask会自动进行重定向&#xff0c;在结尾加上一个斜杠。 第二个路由的URL没有尾部…

CVPR 2023 | 风格迁移论文3篇简读,视觉AIGC系列

CAP-VSTNet: Content Affinity Preserved Versatile Style Transfer 内容相似度损失&#xff08;包括特征和像素相似度&#xff09;是逼真和视频风格迁移中出现伪影的主要问题。本文提出了一个名为CAP-VSTNet的新框架&#xff0c;包括一个新的可逆残差网络&#xff08;reversib…