HuggingFists系统功能介绍(3)--流程管理

news2024/10/5 18:26:10

流程管理

    下面我们进入流程管理。流程管理用于定义及管理我们采用低代码方式开发的各种ETL以及数据分析流程。

流程列表

        界面的左侧部分为流程的分组树,当定义的流程逐渐变多或者多人协同使用系统时,可以通过分组对流程进行更有序的管理。点中分组,可以在界面的右侧以列表形式看到分组下的所有流程。点中单个流程,可以修改、导出、复制、移动流程,还可以查看流程的作业执行历史以及流程的所有历史版本。

        HuggingFists中的流程支持草稿与发布版两种状态,草稿状态的流程可以随时编辑调整,一旦被发布则不再允许改变。草稿状态的流程只允许进行调试运行,但流程发布后,则允许在任务管理模块创建各类作业来运行流程了。

流程定义

        下面我们点击“新增流程”按钮,创建一个流程。流程类型为“执行图流程”;业务类型根据需要选择“数据处理”或“数据分析”;计算框架选择“单机引擎”。HuggingFists社区版只支持“单机引擎”,即一个流程运行时只能使用一台机器的CPU及内存资源的引擎。而其企业版则还可以选择Spark批计算引擎以及Flink流计算引擎,可以使用集群的算力,用于处理更大规模的数据。最后,填写流程名称,选填描述信息点击“确定”按钮,创建流程,进入流程的定义界面。

流程定义界面

        流程定义界面从左至右分成三个部分,最左侧是算子树区、中间是流程定义面板区、最右侧是算子属性+帮助区。

        使用者根据流程编写的目的,从左侧的算子树中选取合适的算子,并将其拖拽到中间的面板区域;选中算子,在右侧的算子属性+帮助区设置算子运行所需的相关参数。并根据算子在流程执行中的先后顺序,在前置算子的输出端口与后置算子的输入端口间建立数据流连接,表示前置算子执行结束后,数据流流向后置算子。

        流程定义时,点击算子的输出端口,可以看到算子输出数据集的结构;点击算子的输入端口可以看到算子可接受的数据集的结构。当前置算子的输出结构与后置算子的输入结构不兼容时,无法建立起二者的数据流转关系。另外,点中算子的任何端口时,都可以看到界面右侧的帮助区会同步定位信息到端口的相关说明,使用者可快速了解端口的相关信息。与此同时,我们可以看到对应的端口附近会浮出一个小的窗口,通过该窗口的按钮,我们可以为端口设置断点,也可启用/停用、删除断点。HuggingFists提供的断点与C、Java等编程语言提供的调试断点含义相同,使用者在进行流程定义时,可以使用断点来调试发现流程定义中的问题,这一功能对于有编程经验的数据科学从业者来说非常有帮助。另外,HuggingFists提供的可以查看端口数据集结构的功能,其本质上与调用函数时,知道函数的调用参数与返回值相同,在同类型的工具中,HuggingFists是目前为数不多在B/S技术框架下能够提供此功能的工具。

        为了能够快速查看流程的执行结果,流程定义面板的右侧边界的上半区,有一个数据执行结果的快速浏览接口。当将算子的输出端口与该结果端口连接后,输出端口输出的前1000条数据将可在查看流程执行结果时,直接查看到,可通过查看执行结果进一步确认流程定义的逻辑正确性。除此外,我们还可以看到,在流程定义面板的左边界,以及面板的右侧边界下半部分也有端口。这两侧的端口分别用于完成接受外界输入的数据流,以及写出流程执行的结果。HuggingFists支持使用者通过连接面板两侧的端口,将一个流程定义为一个函数,以便在其它流程中被调用、复用。关于如何定义子流程、如何使用变量、算子端口多连接注意事项等高级用法,我们将在后续的介绍中给出,在这里就不进行深入探讨了。

流程调试

        流程定义结束,保存流程,调试运行流程。在流程定义面板区的上侧,我们能看到一排按钮。左侧四个按钮用于实现流程的运行及调试运行。其中带有“虫子”图案的功能按钮代表以调试方式运行流程,当使用者为算子端口设定了断点的话,当有数据流运行到该端口时会触发断点,使用者可进一步操纵“跳过”断点或者直接跳出到后续的断点。HuggingFists支持设置条件断点,当断点被触发时,可以查看触发断点的数据集。关于如何断点调试,具体可以参看视频《技术控,看这里,一款支持断点调试的低代码科学计算工具》。不带虫子图案的按钮则表示直接运行流程。

        这四个按钮中,左侧的两个按钮分别表示运行及调试运行整个流程;右侧的两个按钮则表示运行及调试部分流程。使用者选中某个算子,点击右侧两个按钮中的任意一个,表示本次以选中算子作为运行的终点,该算子后的算子以及与该分支流程不相关的分支流程都不会被触发运行。这个功能对于较为复杂的流程而言非常有用,可以针对性的调试运行一个有问题的流程片段,即可以节省流程运行时占用的资源,又可提高流程运行的效率。

流程运行控制台

流程运行状态

        点击“运行”按钮,运行流程。通过流程运行“设计”页的“控制台”可以看到流程运行输出的日志;通过“运行状态”可以看到每个算子的运行时长,端口读入或写出的数据集合数、记录数等信息。

   

算子结果数据列表

   

算子结果数据统计

   

算子结果图表

        切换到“结果”页的“数据”页,使用者可以看到在结果端口输出的数据,允许存在多个结果端口,支持同时查看流程中多个不同算子的输出结果,方便查看、对比。HuggingFists支持对结果数据按照列表、数据特征统计以及图表等多种不同方式进行展示。

        再切换到“输入/输出”页,该页展示了流程输入/输出所涉及的文件、表格等信息,并记录了输入/输出的字节大小及记录条数。

        在这里,我们还能看到有一个”模型”页,HuggingFists的社区版并不包含此页。它是Sengee框架的一个组成部分。当流程用于做数据挖掘且进行分类、聚类等模型训练时,会将训练好的模型输出到此页面,这里我们不做详述了,有类似需要的朋友可以联系我们详细了解。

        重复我们之前介绍的步骤。当使用者认为数据处理或分析流程已经满足功能需求,可以切入生产环境了。使用者可以点击流程定义面板上侧按钮最右侧的“纸飞机”按钮,发布流程。流程发布后,使用者就可以在作业管理中调度流程完成业务的生产需要了。

小结

        流程管理是HuggingFists提供的最核心的功能,它允许使用者可视化的编写数据处理与分析的流程。对于使用人员而言,其降低了学习和使用的门槛;对工程实施而言,其能够非常便捷的随需而变,大幅降低实施成本;对客户而言,其能够快速满足客户不断发展的业务需求,为客户带去价值;对于管理者而言,工程师的工作成果有了可视化表达,方便测试、验证,不在是代码方式的黑盒表达,人员流动交接时工作内容清晰可辨。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1469624.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C#与VisionPro联合开发——TCP/IP通信

TCP/IP(传输控制协议/互联网协议)是一组用于在网络上进行通信的通信协议。它是互联网和许多局域网的基础,为计算机之间的数据传输提供了可靠性、有序性和错误检测。在软件开发中,TCP/IP 通信通常用于实现网络应用程序之间的数据交…

预训练-微调范式在人工智能领域的深远影响

预训练-微调范式的出现是人工智能领域的一大里程碑,它深刻改变了深度学习模型的训练方式和应用模式,并对整个行业产生了多方面的深远影响: 数据效率提升: 通过在大规模无标注数据上进行预训练,模型能够学习到丰富的语言…

Python算法题集_实现 Trie [前缀树]

Python算法题集_实现 Trie [前缀树] 题208:实现 Trie (前缀树)1. 示例说明2. 题目解析- 题意分解- 优化思路- 测量工具 3. 代码展开1) 标准求解【定义数据类默认字典】2) 改进版一【初始化字典无额外类】3) 改进版二【字典保存结尾信息无额外类】 4. 最优算法5. 相关…

实战一个 Jenkins 构建 CI/CD流水线 的简单配置过程哈

引言:上一期我们讲述了gitlabCI/CD工具的介绍,工具之争,本期我们介绍Jenkins CI/CD 目录 一、Jenkins介绍 1、Jenkins概念 2、Jenkins目的 3、特性 4、产品发布流程 二、安装Jenkins 1、安装JDK 2、安装Jenkins 1、上传压缩包 2、…

Python入门必学:单引号、双引号与三引号的差异与应用

Python入门必学:单引号、双引号与三引号的差异与应用 🌈 个人主页:高斯小哥 🔥 高质量专栏:Matplotlib之旅:零基础精通数据可视化、Python基础【高质量合集】、PyTorch零基础入门教程 👈 希望得…

神经网络系列---激活函数

文章目录 激活函数Sigmoid 激活函数Tanh激活函数ReLU激活函数Leaky ReLU激活函数Parametric ReLU激活函数 (自适应Leaky ReLU激活函数)ELU激活函数SeLU激活函数Softmax 激活函数Swish 激活函数Maxout激活函数Softplus激活函数 激活函数 一般来说&#xf…

Tomcat线程池原理(上篇:初始化原理)

文章目录 前言正文一、从启动脚本开始分析二、ProtocolHandler 的启动原理三、AbstractEndPoint 的启动原理四、创建默认线程池五、参数配置原理5.1 常规的参数配置5.2 自定义线程池5.3 测试自定义线程 前言 在Java Web的开发过程中,Tomcat常用的web容器。SpringBo…

SpringBoot -【BeanPostProcessor】基础使用及应用场景

BeanPostProcessor应用与优化 1. 引言 在现代软件开发中,企业开发面临着越来越复杂的系统架构和业务需求。随着项目规模的扩大和技术栈的增多,需要更高效的工具来应对这些挑战,并确保代码的可维护性和扩展性。 在这样的背景下,Be…

Linux之项目部署与发布

目录 一、Nginx配置安装(自启动) 1.一键安装4个依赖 2. 下载并解压安装包 3. 安装Nginx 4. 启动 nginx 服务 5. 对外开放端口 6. 配置开机自启动 7.修改/etc/rc.d/rc.local的权限 二、后端部署tomcat负载均衡 1. 准备2个tomcat 2. 修改端口 3…

随机分布模型

目录 前言 一、离散型随机变量 1.1 0-1分布 1.2 二项分布 1.3 帕斯卡分布 1.4 几何分布 1.5 超几何分布 1.6 泊松分布 二、连续型随机变量 2.1 均匀分布 2.2 指数分布 2.3 高斯分布/正态分布 2.4 分布(抽样分布) 2.5 t分布(抽样…

Vue局部注册组件实现组件化登录注册

Vue局部注册组件实现组件化登录注册 一、效果二、代码1、index.js2、App.vue3、首页4、登录(注册同理) 一、效果 注意我这里使用了element组件 二、代码 1、index.js import Vue from vue import VueRouter from vue-router import Login from ../vie…

迷你世界之建筑生成球体

local x0,y0,z00,30,0--起点坐标 local dx,dy,dz60,60,60--外切长方体横纵竖长度 local count,all0,dx*dy*dz--计数,总数 local m,k10000,0--单次生成方块数,无用循环值 local x,y,z0,0,0--当前坐标 local demath.random(2,19)/2 local id600--方块…

【监督学习之逻辑回归】

曾梦想执剑走天涯,我是程序猿【AK】 目录 简述概要知识图谱1.什么是逻辑回归?2.逻辑回归有哪些应用?3.回归分析如何工作?4.逻辑回归模型如何工作?5.逻辑回归分析有哪些类型?6.逻辑回归与其他机器学习技术相…

APP攻防-实战拿下某seseAPPSpringboot未授权HeapDump提取OSS利用

知识点 1、APK-抓包 2、资产信息收集 3、SpringBoot-漏洞利用 4、自动化工具 5、HeapDump-分析提取 6、AccessKEY-利用后续 演示案例: 1、APK-抓包 2、资产信息收集 3、SpringBoot-漏洞利用 SpringBoot漏洞利用: https://github.com/LandGrey/Spring…

K8S—集群调度

目录 前言 一 List-Watch 1.1 list-watch概述 1.2 list-watch工作机制 二 集群调度 2.1 调度过程 2.2 Predicate 和 Priorities 的常见算法和优先级选项 2.3 调度方式 三 亲和性 3.1 节点亲和性 3.2 Pod 亲和性 3.3 键值运算关系 3.4 Pod亲和性与反亲和性 3.5 示例…

【小记】简历 Tips

基本信息 真实诚信 教育经历(院校信息)、成绩、在校经历; 公司、项目经历 注意事项 逻辑清晰、重点突出、岗位JD完全吻合; 简洁(一页纸简历、顺序从上到下) 做了什么(时间顺序) 成果…

Escalate_Linux-环境变量劫持提权(5)

环境变量劫持提权 在Shll输入命令时,Shel会按PAH环境变量中的路径依次搜索命令,若是存在同名的命令,则执行最先找到的,若是PATH中加入了当前目录,也就是“”这个符号,则可能会被黑客利用,例如在…

冯诺依曼体系结构 计算机组成的金字塔

01 冯诺依曼体系结构:计算机组成的金字塔 学习计算机组成原理,到底是在学些什么呢?这个事儿,一两句话还真说不清楚。不过没关系,我们先从“装电脑”这个看起来没有什么技术含量的事情说起,来弄清楚计算机到…

Zookeeper客户端命令、JAVA API、监听原理、写数据原理以及案例

1. Zookeeper节点信息 指定服务端,启动客户端命令: bin/zkCli.sh -server 服务端主机名:端口号 1)ls / 查看根节点下面的子节点 ls -s / 查看根节点下面的子节点以及根节点详细信息 其中,cZxid是创建节点的事务id&#xff0c…

QWidget: Must construct a QApplication before a QWidget 13:25:48: 程序异常结束。

QWidget: Must construct a QApplication before a QWidget 13:25:48: 程序异常结束。 你的插件是release,而你用了debug模式、