海豚调度器DolphinScheduler--单机版DolphinScheduler 入门到实践:从部署到使用

news2024/9/20 10:44:51

        Apache DolphinScheduler 是一个强大的分布式工作流任务调度系统,它以易用性和强大的功能在数据处理领域脱颖而出。本文将从部署到使用,详细介绍 DolphinScheduler 的各个方面,帮助您快速上手并有效利用这一工具。

一、DolphinScheduler 概述

        DolphinScheduler,由易观公司于2019年开源,是一个分布式、易扩展的可视化DAG工作流任务调度平台。它通过有向无环图(DAG)来描述任务之间的依赖关系,支持任务调度、任务编排以及定时任务,非常适合用于数据仓库、数据集成等场景。

二、DolphinScheduler 架构

组件:

海豚调度器DolphinScheduler 核心组件及其功能解析

架构图:

三、部署模式

DolphinScheduler 支持多种部署模式,包括:

  1. 单机模式:所有服务运行在同一个进程中,内置ZooKeeper和H2数据库,适合快速体验。
  2. 伪集群模式:在单台机器上部署所有服务,但ZooKeeper和数据库需单独安装。
  3. 集群模式:在多台机器上部署服务,支持多个Master和Worker,适合生产环境。

 这里我们主要介绍单机模式。

四、安装部署

海豚调度器DolphinScheduler--搭建单机版DolphinScheduler实战指南

单机模式部署

  1. 环境准备:确保JDK环境已配置。
  2. 下载并解压:从官网下载DolphinScheduler,解压到指定目录。
  3. 启动服务:执行启动脚本,一键启动所有服务。

五、使用 DolphinScheduler

安全中心

队列:

了解一下

租户管理:管理执行任务的用户。

出现以下错误

需要启动Hadoop集群的hdfs

start-dfs.sh  启动hadoop集群

用户管理:管理操作DolphinScheduler的用户。

可以使用普通用户登录ds

 Worker分组:管理Worker节点的分组。

 告警组:设置任务执行情况的通知组。

添加组内成员:

 

上传资源提示“存储未启用”如何开启HDFS

1.修改配置文件

这个软件下面有很多的服务,将每一个服务下的common.properties中的内容全部修改一遍

其中bigdata01是你虚拟机的名称

修改standalone-server下的common.properties

resource.storage.type=HDFS
resource.storage.upload.base.path=/dolphinscheduler
resource.hdfs.fs.defaultFS=hdfs://bigdata01:9820

2.修改HDFS权限

确保DolphinScheduler用户对HDFS路径有读写权限。

修改hdfs的权限:
hdfs dfs -chmod -R 777 /

 3.重启服务

配置完成后,需要重启DolphinScheduler的所有服务以应用更改。

重启服务
# 启动 Standalone Server 服务
./dolphinscheduler-daemon.sh start standalone-server
# 停止 Standalone Server 服务
./dolphinscheduler-daemon.sh stop standalone-server

执行任务

创建项目:在DolphinScheduler中创建项目。

创建任务:定义具体的任务脚本。

定义工作流:通过拖拽的方式,将任务组合成工作流。

下图为工作流配置页面,共包含三个模快,分别为工作流定义、工作流实例和任务实例。
工作流定义:用于定义工作流,包括工作流各节点任务详情及各节点依赖关系等。
工作流实例:工作流每执行一次就会生成一个工作流示例。此处可查看正在运行的工作流以及已经完成的工作流。
任务实例:工作流中的一个节点任务,每执行一次就会生成一个任务实例。此处可用于查看正在执行的节点任务以及已经完成的节点任务。

image.png

创建A任务

image.png


依次创建B任务,和C任务

image.png


将这三个任务,进行任务编排:

image.png


点击保存按钮,出现保存界面:

image.png


定义任务结束:

image.png

执行工作流:启动并监控工作流的执行。

任务必须先上线才能执行,只有下线才能编辑

点击上线,并没有运行,需要点击--执行

此时任务实例就会出现:

假如你的任务运行了,但是没有工作流实例,只提示成功,可以查看一下是否为内存不够了。

worker 192.168.233.128:1234 current cpu load average 0.43 is too high or available memory 0.17G is too low

提升一下内存即可。

定时任务

创建定时任务:设置任务的执行计划。

上线定时任务:激活定时任务,使其按计划执行。

 

 

查看定时任务是否运行了:

 当Linux的系统时间,不对的时候,定时任务,普通任务都会受到影响

在Linux黑窗口运行

同步时间的两个命令:
systemctl restart chronyd

ntpdate time1.aliyun.com

 

六、结语

        DolphinScheduler 是一个功能丰富、易于使用的分布式工作流调度系统。通过本文的介绍,您应该能够对 DolphinScheduler 有一个全面的了解,并在实际工作中有效利用它来管理和调度任务。无论是单机模式的快速体验,还是集群模式的大规模部署,DolphinScheduler 都能满足您的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2139855.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

mac中git操作账号的删除

命令行玩的很溜的可以跳过 找到钥匙串访问 搜github、gitee就行了

k8s的NodeIP、PodIP、ClusterIP、ExternalIP

1.NodeIP K8s集群由Master Node与Worker Node组成。 Node:组成k8s集群的机器,可以是物理机或虚拟机。 Master Node :管理节点也叫控制平面主要负责管理控制方面。 Worker Node::工作节点用于部署处理业务的工作负载或p…

【计算机网络】IP, 以太网, ARP, DNS

IP, 以太网, ARP, DNS IP协议回顾IP地址报文格式功能介绍地址管理IP地址数量问题初识 NAT 机制通信机制IP数量的解决方案网段划分特殊IP地址 路由选择 以太网协议报文格式源MAC/目的MACMAC地址是什么MAC地址格式MAC的作用 ARPDNS初识DNSDNS主要功能DNS的查询过程 IP协议 回顾I…

协同过滤算法商品推荐系统设计与实现

协同过滤算法商品推荐系统设计与实现 摘 要 传统办法管理信息首先需要花费的时间比较多,其次数据出错率比较高,而且对错误的数据进行更改也比较困难,最后,检索数据费事费力。因此,在计算机上安装协同过滤算法商品推荐…

USB数据格式

文章目录 一、域、包、事务的概念1. **域(Domain)**2. **包(Packet)****包的类型**: 3. **事务(Transaction)****总结** 二、USB数据包格式1. **SOP(Start of Packet)**2…

46.面向对象综合训练-文字版格斗游戏

1.首先创建标准的Javabean类 import java.util.Random;public class 格斗游戏 {private String name;private int blood;public 格斗游戏() {}public 格斗游戏(String name, int blood) {this.name name;this.blood blood;}public String getName() {return name;}public vo…

【C++】vector容器的基本使用

一、vector是什么 vector是STL第一个正式的容器,它的底层其实就是动态数组,插入数据时当容量满了会自动扩容,它和string差不多,不同的之处之一在于vector本身是一个模板,它这个容器中可以存放各种各样的类型的数据&am…

【每日刷题】Day123

【每日刷题】Day123 🥕个人主页:开敲🍉 🔥所属专栏:每日刷题🍍 🌼文章目录🌼 1. 673. 最长递增子序列的个数 - 力扣(LeetCode) 2. LCR 083. 全排列 - 力扣&…

C语言 | Leetcode C语言题解之题409题最长回文串

题目&#xff1a; 题解&#xff1a; int longestPalindrome(char * s) {int c[128]{0},ret0;for(int i0;i<strlen(s);i){c[s[i]];}for(int i0;i<128;i){retc[i]-c[i]%2;}return ret(ret!strlen(s)); }

【Qt】控件样式案例

例子&#xff1a;设置按钮样式 &#xff08;1&#xff09;设置一个按钮 &#xff08;2&#xff09;右键按钮&#xff0c;选择样式表 &#xff08;3&#xff09;编写全局样式 font-size 设置字体大小&#xff1b; border-radius 设置圆角矩形&#xff1b; background-color 设置…

数据结构-树(基础,分类,遍历)

数据结构-树 1.什么是树&#xff1f; 在计算机科学中&#xff0c;树是一种常用的非线性数据结构&#xff0c;用于表示具有层次关系的数据。与线性数据结构&#xff08;如数组和链表&#xff09;不同&#xff0c;树结构以节点&#xff08;Nodes&#xff09;和边&#xff08;Ed…

日元走强引领外汇市场新动向,全球经济指标波动加剧

日元看涨情绪升温 近期&#xff0c;外汇市场上日元成为焦点&#xff0c;对冲基金纷纷增加对日元上涨的期权投注&#xff0c;预计其将延续本季度强劲表现。上周五&#xff0c;美元兑日元收跌0.65%&#xff0c;盘中触及年内低点&#xff0c;显示出市场对日元未来走势的乐观预期。…

一文了解什么是TTP — 技术、战术与程序

导语&#xff1a;TTP的概念最早来自于军事领域及反恐活动&#xff0c;后面逐渐被应用到网络安全领域&#xff0c;在网络安全中&#xff0c;TTP&#xff08;技术、战术与程序&#xff09;是一个核心概念&#xff0c;它涵盖了攻击者使用的工具、技术和方法&#xff0c;以及他们执…

HTML+CSS - 网页布局之多列布局定位

1. 多列布局 CSS中多列布局处理文本内容&#xff0c;特别适合对于长段落或者大量文本进行自动分栏显示 类似于grid分布&#xff0c;但相较之下更加简洁明了 基本语法 <div class"container"><p>这是一些示例文本&#xff0c;当我们使用 column-count…

SpringBoot Kafka发送消息与接收消息实例

前言 Kafka的基本工作原理 我们将消息的发布&#xff08;publish&#xff09;称作 producer(生产者)&#xff0c;将消息的订阅&#xff08;subscribe&#xff09;表述为 consumer&#xff08;消费者&#xff09;&#xff0c;将中间的存储阵列称作 broker(代理)&#xff0c;这…

酷炫的航模直升机技术详解

1. 分类与级别&#xff08;400级至90级&#xff09; 航模直升机以其独特的飞行魅力和高难度的操作技巧&#xff0c;吸引了众多飞行爱好者。根据模型的尺寸、重量、动力系统及飞行性能&#xff0c;航模直升机大致可分为多个级别&#xff0c;从入门级的400级到专业级的90级及以上…

简单接口自动化框架实现(Python+requests+pytest)

1、接口自动化流程 1.需求分析2.挑选需要做自动化测试的功能3.设计测试用例4.搭建自动化测试环境[可选]5.设计自动化测试项目的架构[可选]6.编写代码7.执行测试用例8.生成测试报告并分析结果 2、框架结构 --api -->封装请求 --scripts -->编写测试脚本…

15. Springboot集成Redis

目录 1、前言 2、为什么选择Spring Boot集成Redis&#xff1f; 3、快速上手 3.1、引入依赖 3.2、 配置连接信息 3.3、自定义配置类 4、RedisTemplate的使用 4.1、String类型操作 4.2、 Hash类型操作 4.3、List类型操作 4.4、Set类型操作 4.5、SortedSet类型操作 4…

有了数据中台,是否需要升级到数据飞轮?怎么做才能升级到数据飞轮?

在数字化转型的时代&#xff0c;企业纷纷建设了“数据中台”&#xff0c;把各种业务数据整合在一起&#xff0c;仿佛是将所有材料都整理进了厨房的储物柜。 但是问题是&#xff1a;光有储物柜&#xff0c;能做出好吃的菜吗&#xff1f;答案显然是否定的。想要真正利用这些数据…

华为HarmonyOS地图服务 -- 如何实现地图呈现?-- HarmonyOS自学8

如何使用地图组件MapComponent和MapComponentController呈现地图&#xff0c;效果如下图所示。 MapComponent是地图组件&#xff0c;用于在您的页面中放置地图。MapComponentController是地图组件的主要功能入口类&#xff0c;用来操作地图&#xff0c;与地图有关的所有方法从此…