目录
- 📚第一章 基本流程梳理
- 📗页面基本操作
- 📗对应后台服务流程
- 📚第二章 二开思路
- 📗前端
- 📗后端
🔼上一集:基于Kettle开发的web版数据集成开源工具(data-integration)-介绍篇
*️⃣主目录:ETL&ELT专栏
📚第一章 基本流程梳理
📗页面基本操作
从登录开始->新建项目->保存项目->运行项目
开始(问题还是挺多的,不过主要还是借鉴任务编排这一块,无伤大雅)
select role_name,`describe` from dp_portal_role
📗对应后台服务流程
参照页面基本操作,梳理后台对应的服务及表等
- 项目主要对应两种表
- 项目信息表
dp_portal_project
:项目编号、名称、描述、类型、状态,分组编号、名称 - 项目附件信息表
dp_portal_project_file
:项目编号、项目文件内容project_file
、项目版本号;其中project_file
字段通过JSON
串存放项目内容
- 项目信息表
- 运行项目
- 调用更新项目信息接口
ProjectServiceApiController.updateSelective
- 前端通过调用
websocket
服务,调用运行接口ProjectExecutorController.executeById
@MessageMapping
和@SendToUser
注解是用来处理WebSocket
消息并实现广播或点对点消息推送的:WebSocket
客户端向服务器发送一条指向/executeById
路径的消息。- 服务器端通过
@MessageMapping
找到并执行executeById
方法。 - 方法内部完成业务逻辑处理后,返回的结果会被自动通过
WebSocket
协议推送给对应用户,即在每个已认证用户的特定通道上发布结果。
projectExecutorService.asyncExecuteByFile
executeByFile.execute.start()
- 构建
TransMeta
对象,buildTransMeta
(json
转xml
) - 设置本地引擎执行
- 创建执行器
- 启动
- 构建
- 调用
Kettle
本地引擎
- 调用更新项目信息接口
📚第二章 二开思路
通过上面的流程梳理,发现任务编排工作流主要在前端,各种字段属性和kettle
对应都是前端传给后台的,后台直接保存的JSON
串,我这里只需要任务编排这块功能,springcloud
也用不到,后面如果借鉴该项目,大概要做哪些事?
📗前端
应该可以直接复用,我们用的也是vue2+element
架构
📗后端
该项目涉及的技术组件比较多,用到了springcloud
,相对来说有点麻烦,到了具体开发阶段,涉及的就比较多了,下一步可以先简单点,就导出一个作业文件,提取相关代码,能够成功执行作业之后,在开始大刀阔斧的开展工作,一步一步推进:
- kettle本地引擎执行代码
- 作业文件组装、转换代码