说明
该文档适用于dolphinscheduler 3.1.3-release版本。
一 环境准备
需要使用的环境包括JDK1.8,以及Maven 3.6以上的版本,这里使用低于3.6版本的Maven也可以调试运行,不过在打包的时候会有报错,最好使用高版本的maven。
二 导入源码并修改配置
2.1 导入项目
项目地址:
DolphinScheduler: 🔥🔥🔥 Apache DolphinScheduler是一个新一代分布式大数据工作流任务调度平台,致力于“解决大数据任务之间错综复杂的依赖关系,整个数据处理开箱即用”。它以 DAG(有向无环图) 的方式将任务连接起来,可实时监控任务的运行状态,同时支持重试、从指定节点恢复失败、暂停及 Kill 任务等操作。已经有IBM、阿里、腾讯、360 等 1000 多家公司生产上使用,下载安装包请去官网
将项目导入到自己的编译器中。
2.2 处理报错
项目的pom.xml文件第588行会有报错,如图所示。这里我的处理方法为注释掉587-589行
2.3 修改配置文件
2.3.1 修改数据库
项目的启动文件分别在dolphinscheduler-master,dolphinscheduler-worker和dolphinscheduler-api中,其中master和api中需要进行数据库配置,配置文件在src-main-resources下的application.yaml文件中,我这里已经修改成了所需的mysql的数据库,并写好了配置,如图所示。各位在实际使用中配置成自己的数据库即可。
2.3.2 修改zookeeper
ZooKeeper是一个分布式的,开放源码的分布式应用程序协调服务,在dolphinscheduler中也有相应的配置,如果需要使用的话,可以配置成一个有效的地址;如果仅仅为了快速启动dolphinscheduler,那么使用原来的localhost就可以(master,worker和api均有配置文件;在启动前,需要保证对应的zookeeper已经启动)。配置文件如图所示。
2.3.3 配置HDFS(可选)
如果不配置HDFS,则默认文件存储为本地。
如果需要配置HDFS,则需要进入到dolphinscheduler-common中,修改src-main-resource下的common.properties文件。如图所示。
其中27行为设置存储类型,29行为上传文件的文件夹,是HDFS中真实存在的目录,70行为HDFS用户,72行为地址。
三 启动前准备
3.1 导入数据表
dolphinscheduler-dao的src-main-resource-sql文件夹下,有对应的数据表的sql文件,在上述配置的数据库中导入数据库即可。(也可以先建库导入表,再进行数据库配置)。
3.2 安装并运行zookeeper
Zookeeper下载地址:Apache ZooKeeper
这里下载箭头所指的包(编译过的)。然后解压下载的文件,将conf文件夹下的zoo_sample.cfg文件改名为zoo.cfg。
因为当前为单机模式,所以只需修改dataDir和logDir即可,如图所示。我这里是在zookeeper的目录下新建了两个文件夹,
修改完成后,执行bin目录下的zkServer.cmd文件,即可启动zookeeper。
3.3 安装Node16.13+和Pnpm
Node下载地址:Download | Node.js
Pnpm下载安装,需要在powershell下使用命令 iwr https://get.pnpm.io/install.ps1 -useb | iex
四 启动服务
4.1启动
在项目的.idea/workspace.xml文件中在<component name=”PropertiesComponent”>标签中可以添加<property name="dynamic.classpath" value="true" />,可以防止启动时报错:命令太长。
在MasterServer的启动项中的VMOptions配置(这里以使用Mysql数据库为例):
-Dlogging.config=classpath:logback-spring.xml -Ddruid.mysql.usePingMethod=false -Dspring.profiles.active=mysql
在WorkerServer的启动项中的VMOptions配置(这里以使用Mysql数据库为例):
-Dlogging.config=classpath:logback-spring.xml -Ddruid.mysql.usePingMethod=false -Dspring.profiles.active=mysql
在ApiServer的启动项中的VMOptions配置(这里以使用Mysql数据库为例):
-Dlogging.config=classpath:logback-spring.xml -Dspring.profiles.active=api,mysql
4.2 验证
启动完成可以浏览 Open API 文档,地址为
http://localhost:12345/dolphinscheduler/swagger-ui/index.html
4.3 启动前端
使用命令行进入到dolphinscheduler-ui目录中,使用命令pnpm install编译,使用pnpm run dev命令启动。
浏览器访问 http://localhost:5173,使用用户名密码admin/dolphinscheduler123 即可完成登录。