2.1 HuggingFists系统架构(一)

news2025/1/15 20:54:52

系统架构

        HuggingFists的前端主体开发语言为Html+Javascript,后端的主体开发语言为Java。在算子部分有一定份额的Python代码,用于整合Python在数据处理方面强大能力。

功能架构

        HuggingFists的功能架构如上,由下向上各层为:

  • 数据存储层

        数据存储层并不属于HuggingFists系统,其主要描述了HuggingFists系统可以对接和管理的各类数据源。HuggingFists系统被定义为面向全结构数据的AI应用开发及运营平台,为此其需要对接各类能够存储数据的数据源。在HuggingFists的技术理念中,任何需要被处理的源数据或结果数据都在该层提供的数据源中完成读写访问。因此,使用HuggingFists的第一步需要先配置好数据源。

        HuggingFists支持的数据源类型包括:文件系统、数据库、流服务以及应用系统的四大类。

Ø 文件系统用于对接各类文件系统型数据源,通过该类数据源可以读写以文件形式存储的各类数据。该数据源类型的引入,可极大丰富原始数据以及非结构化数据的访问能力。支持远程文件系统、分布式文件系统及云文件系统等。

Ø 数据库用于对接各类数据库型数据源。支持的数据库种类包括:关系数据库、列式数据库、键值数据库、文档数据库、时序数据库、数据仓库以及图数据库等。

Ø 流服务用于对接时效能力较高的数据源,比如:消息队列等,用于数据处理时效性较高的场景。支持消息队列、分布式消息队列及云消息队列等

Ø 应用系统用于对接各类应用数据源,比如:SAAS类应用、ERP类应用等。该类数据源主要提供数据的读取能力,比如读取某个金融网站的证券数据、交易数据;读取某个ERP应用的客户数据、运营数据等。该类数据源拥有较强的行业属性。

  • 数据计算层

        数据计算层支持部署多计算节点,用于完成数据科学流程的解释及执行。HuggingFists支持的计算节点为单节点计算引擎,主要用来完成复杂的流程控制及小规模数据的处理及分析工作。所有任务只能在单节点引擎内执行,不支持类似Spark及Flink的分布式海量结构化数据计算能力。该能力在 HuggingFists所依赖的Sengee计算框架中予以了支持,有此需求的用户可以查阅Sengee的相关资料。数据计算层支持多节点主要是用来应对同时可能并发多个任务时,可以通过多计算节点水平扩展HuggingFists系统的计算能力。

        HuggingFists的计算节点根据需要支持的业务场景被定义为不同类型。在上图中,计算节点分为两类,一类是通用计算节点,能够支持一般流程的解释执行;一类是增强型节点,即图中带有Dyputer组件的节点,集成了Notebook。允许通过Notebook交互式进行Python编程,从而扩展HuggingFists支持能力不足的部分,比如:各类AI模型的应用,深度学习的集成等。

  • 平台核心层

        平台核心层用于提供整个平台的核心管理功能。包括数据源管理、流程管理、数据服务管理、作业管理、模型管理、计算节点管理、资源管理及用户管理等模块。

Ø 数据源管理用于对数据科学计算所需的各类数据源进行管理,支持的数据源类型包括:数据库、文件系统、事件流以及应用系统。

Ø 流程管理用于管理HuggingFists系统中的各类流程。包括图流程、程序流程、作业流程以及API流程等。

Ø 数据服务管理用于接入外部的Web API接口,供HuggingFists在流程定义中使用;以及将通过HuggingFists定义的流程供外部系统访问。

Ø 作业管理用于为流程定义各种不同触发类型的作业,并完成作业的调度运行及监控。支持的作业触发方式包括:即时、定时、事件触发以及交互式触发等多种。

Ø 模型管理用于管理系统中所有的训练模型,包括流程训练输出的模型以及通过外部导入的模型。可将这些模型部署为服务、也可在流程中使用这些模型完成数据的处理。

Ø 计算节点管理用于管理各类计算节点。

Ø 资源管理用于管理HuggingFists中的各类资源,包括连接器、算子、提示模板、应用模板等。其中,连接器及算子为HuggingFists的插件资源;提示模板与应用模板为大模型等相关算子应用所需的配置资源。

Ø 用户管理用于创建管理平台中的用户及用户的权限

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2166151.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【程序大侠传】应用内存缓步攀升,告警如影随形

前序 在武侠编码的江湖中,内存泄漏犹如隐秘杀手,潜伏于应用程序的各个角落,悄无声息地吞噬着系统资源。若不及时发现和解决,必将导致内存枯竭,应用崩溃。 背景:内存泄漏的由来 内存泄漏,乃程序…

TensorRT-LLM保姆级教程(三)-使用Triton推理服务框架部署模型

随着大模型的爆火,投入到生产环境的模型参数量规模也变得越来越大(从数十亿参数到千亿参数规模),从而导致大模型的推理成本急剧增加。因此,市面上也出现了很多的推理框架,用于降低模型推理延迟以及提升模型…

redis哨兵启动出现 +sdown master mymaster 192.168.x.x

场景: 搭建好哨兵之后,哨兵一启动,过了30秒就会判断master sdown,但是检查配置是没有问题。 日志: Redis-master启动日志:没看到任何异常,所以master无异常 Redis-哨兵启动日志: …

深度学习技术概览

一、深度学习技术概览 深度学习,作为机器学习的一个分支,其核心在于通过构建多层神经网络模型来模拟人脑的学习过程。与传统的机器学习算法相比,深度学习能够自动从原始数据中提取高级抽象特征,而无需人工进行复杂的特征工程。这…

Java项目实战II基于Java+Spring Boot+MySQL的网上摄影工作室(源码+数据库+文档)

目录 一、前言 二、技术介绍 三、系统实现 四、文档参考 五、核心代码 六、源码获取 全栈码农以及毕业设计实战开发,CSDN平台Java领域新星创作者 一、前言 在数字化时代,摄影艺术已不再局限于传统媒介,而是借助互联网平台绽放新的光彩…

基于遗传优化算法的多AGV栅格地图路径规划matlab仿真

目录 1.程序功能描述 2.测试软件版本以及运行结果展示 3.核心程序 4.本算法原理 4.1 栅格地图表示 4.2 路径编码 4.3 目标函数 5.完整程序 1.程序功能描述 基于遗传优化算法的多AGV栅格地图路径规划matlab仿真,分别测试单个AGC的路径规划和多个AGV的路径规划…

虹科技术分享 | CAN XL总线测试与译码

CAN XL是第三代控制器局域网协议,建立在经典CAN和CAN FD网络的基础上,并支持向后兼容。它面向车载网络,使用单个差模总线连接多个控制器和传感器。由于高度的耐用性和对布线需求最小的总线拓扑结构,控制器局域网协议越来越多地进入…

虚拟社交的新时代:探索Facebook的元宇宙愿景

随着技术的不断进步,社交媒体的形态也在悄然变化。Facebook(现名Meta)正站在这一变革的前沿,积极探索元宇宙的愿景。元宇宙不仅是虚拟现实(VR)和增强现实(AR)的结合,更是…

Spring Boot房屋租赁系统:技术架构解析

2 关键技术简介 2.1 JAVA技术 Java是一种多用途并且强大的编程语言,可用于开发运行在移动设备、台式计算机以及服务器端的软件。Java已及其流行。Java只要编写一次,无论什么地方都可以运行启动[1]。 Java语言是应用很广泛的语言,用它编写出的…

【JVM原理】运行时数据区(内存结构)

JVM (Java Virtual Machine)原理 文章目录 四、运行时数据区(内存结构)4-1 线程私有区域程序计数器(program counter Register)本地方法栈(Native Method Stacks)Java 虚拟机栈&…

Python办公自动化教程(004):PDF添加水印

1.4 PDF文档水印添加 【1】安装库 pip install reportlab pip install PyPDF2【2】代码 import iofrom PyPDF2 import PdfWriter, PdfReader from reportlab.lib import pagesizes # 页面样式 from reportlab.lib.units import cm from reportlab.pdfbase import pdfmetric…

【Verilog学习日常】—牛客网刷题—Verilog企业真题—VL68

同步FIFO 描述 请设计带有空满信号的同步FIFO,FIFO的深度和宽度可配置。双口RAM的参考代码和接口信号已给出,请在答案中添加并例化此部分代码。 电路的接口如下图所示。端口说明如下表。 接口电路图如下: 双口RAM端口说明: 端口…

828华为云征文|使用Flexus X实例集成ES搜索引擎

目录 一、应用场景 1.1 Flexus X实例概述 1.2 ES搜索引擎 二、安装相关服务 2.1 安装Elasticsearch7.17.0 2.2 安装kibana7.17.0 三、开通安全组规则 四、整体感受 4.1 Flexus X实例 4.2 使用感觉 一、应用场景 1.1 Flexus X实例概述 Flexus X实例是华为云推出的一款…

Windows内核编程基础(2)

上下文环境 应用层应用程序工作在用户模式,内核驱动程序工作在内核模式。这里的用户模式和内核模式是基于CPU的特权环来定义的,CPU提供了0环~3环(ring 0 ~ ring 3)共四个特权环,Windows操作系统使用了其中的0环和3环,0环为内核模…

【深度学习】(7)--保存最优模型

文章目录 保存最优模型一、两种保存方法1. 保存模型参数2. 保存完整模型 二、迭代模型 总结 保存最优模型 我们在迭代模型训练时,随着次数初始的增多,模型的准确率会逐渐的上升,但是同时也随着迭代次数越来越多,由于模型会开始学…

大数据-148 Apache Kudu 从 Flink 下沉数据到 Kudu

点一下关注吧!!!非常感谢!!持续更新!!! 目前已经更新到了: Hadoop(已更完)HDFS(已更完)MapReduce(已更完&am…

Spring Boot房屋租赁平台:现代化解决方案

1 绪论 1.1 研究背景 中国的科技的不断进步,计算机发展也慢慢的越来越成熟,人们对计算机也是越来越更加的依赖,科研、教育慢慢用于计算机进行管理。从第一台计算机的产生,到现在计算机已经发展到我们无法想象。给我们的生活改变很…

Recaptcha2 图像识别 API 对接说明

Recaptcha2 图像识别 API 对接说明 本文将介绍一种 Recaptcha2 图像识别2 API 对接说明,它可以通过用户输入识别的内容和 Recaptcha2验证码图像,最后返回需要点击的小图像的坐标,完成验证。 接下来介绍下 Recaptcha2 图像识别 API 的对接说…

8.12DoG (Difference of Gaussians)

基本概念 不同尺度的高斯模糊图像之间的差异(DoG),用于边缘检测。函数: cv::GaussianBlur() 结合 cv::Laplacian() 或者自定义DoG实现。 在OpenCV中并没有直接提供一个名为“DoG”(Difference of Gaussians)的函数&a…

【学术会议征稿】第四届人工智能、机器人和通信国际会议(ICAIRC 2024)

第四届人工智能、机器人和通信国际会议(ICAIRC 2024) 2024 4th International Conference on Artificial Intelligence, Robotics, and Communication 第四届人工智能、机器人和通信国际会议(ICAIRC 2024)定于2024年12月27-29日…