从0到1介绍一下开源大数据服务平台dataService

news2024/11/18 15:30:18

1.背景&现状

在大数据领域也已经工作了多年,无论所待过的大公司还是小公司,统计出来的数据经常需要查询展示,比如说:用做大屏或者报表或者给一些线上服务提供数据源,经常会要用代码写一套接口服务,需要进行开发-测试-上线等一套流程,开发效率非常低下,导致开发一个服务需要接近0.5天或者1天的时间。

不少大厂其实对于这个平台也有建设,甚至拿出来单独售卖((比如阿里datawork里面的数据服务、网易猛犸EasyDS)),但是收费确实不低,因此想着根据自己的工作经验,开发出这样一套产品,由于之前开源的数据对比平台命名为dataCompare,因此这个平台命名为dataService,即:数据服务

主要解决如下几个问题:

(1)开发一个api接口服务需要进行开发-测试-上线等一套流程,通常至少需要0.5天到1天

(2)为了满足不同的数据量要求,选择不同的数据存储,因此导致数据存储多样性(比如:Mysql、Oracle、Hbase、Doris等等),所以针对不同的存储开发代码不一致

(3)接口服务不规范,不同的开发人员,对于接口开发不一致

(4)数据和接口没办法复用,不同的业务选择相同的数据表,建立各自的接口服务,但是存在接口和数据冗余问题

(5)不清楚哪些数据被哪些应用访问,导致停掉数据加工任务并不清楚会影响哪些业务

2.目标

为了解决上述问题因此开发了开源大数据服务平台——dataService


(1)采用写sql低代码或者界面交互、勾选的方式即可api服务的开发、测试和上线,同时避免了针对不同的数据存储进行代码适配开发,开发效率至少提升50%

(2)接口规范化:通过数据服务平台实现接口规范化,避免不同的开发人员开发习惯不一致导致标准不一致

(3)构建api集市实现接口的可复用,避免数据和接口冗余问题

(4)通过数据血缘和接口血缘,打通数据加工和服务的全链路

3.系统核心功能介绍

目前dataService已经完成如下功能:

(1)通过简单配置或者写sql等低代码的方式即可实现api服务的开发和测试

(2)目前已经支持Mysql、Doris、Hive 等数据源

整体流程如下:

(1)流程一:新建数据源——新建API服务

流程一

(2)流程二:根据数据源类型创建数据源连接

流程二

(3)流程三:新建API服务——配置sql——测试API服务——上线

SELECT 
  name, 
  addr as address, 
  sum(num) as total_num 
FROM 
  table_name 
WHERE 
  user_id = ${uid}; 
(1) SELECT查询的字段即为API返回参数 
(2) 如果定义了字段别名,则返回参数名称为字段别名 
(3) 支持SQL函数 
(4) WHERE条件中的参数为API请求参数,参数格式为${参数名}

 (4)流程四:发布API服务到API集市供业务方调用

4.系统架构设计

数据服务平台能够解决数据服务统一化,便于数据服务的治理、指标口径的统一。能够提升业务的开发效率,更快的面对业务的变化。数据服务平台主要分如下三层:

(1)数据应用接入层:主要是针对外部应用接入,包含:HTTP服务、RPC服务、Client 服务

(2)数据服务解析层:主要通过SQL方式访问各种数据存储,然后生成对应数据服务。核心功能:SQL解析、SQL校验、SQL路由、数据查询

(3)数据存储层:主要包含数据的存储管理,MySQL、Redis、Doris、Hive等等。都能很好的支持,提供API服务

5.系统功能演示

主页

 添加数据源

 数据源管理

新建api服务

 api服务测试

6.后续规划

(1)上线api服务 pull方式的数据自动推送获取

(2)api服务限流和监控

(3)服务血缘探测、服务编排

7.核心代码开源

https://github.com/zhugezifang/dataService

https://gitee.com/ZhuGeZiFang/dataService

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/183946.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python中的os模块

整理文件和目录最最最常用的os模块os模块是Python标准库中整理文件和目录最为常用的模块,该模块提供了非常丰富的方法用来处理文件和目录。os.getcwd()作用:获取当前的工作路径;>>> os.getcwd() D:\\ResearchWay\\Code\\PythonCode\…

2023年浏览器哪个好,如何选择浏览器?

浏览器作为电脑必备的软件之一,相信绝大多数人都用过。选择一款好用的浏览器,可以帮助我们提升工作效率。那么,浏览器哪个比较好,我们如何选择合适的浏览器?为了找到集速度、易用性、安全于一身的浏览器,我…

第四十七章 动态规划——状态压缩模型

第四十七章 动态规划——状态压缩模型一、什么是状态压缩二、例题讲解1、AcWing 1064. 小国王(1)问题(2)思路(3)代码2、AcWing 327. 玉米田(1)问题(2)思路&am…

晴天科技冲刺上市:实控人丁一波系本科肄业,粤民投为其股东

近日,浙江晴天太阳能科技股份有限公司(下称“晴天科技”)预披露更新招股书,准备在深圳证券交易所主板上市。据贝多财经了解,晴天科技曾于2022年7月1日递交招股书,此次更新了截至2022年6月30日的财务数据等信…

AcWing 1072. 树的最长路径(DFS)

[TOC](AcWing 1072. 树的最长路径(树形DP)) 一、题目: 二、思路: 为了方便,我们利用下面这个图做讲解: 这颗树的最长路径必定经过的是图中的点,因此,**我们可以去枚举经过图中每个点的最长路…

微星武士gf66电脑系统中途安装失败怎么办?

微星武士gf66电脑系统中途安装失败怎么办?有用户购买的微星武士gf66电脑想要进行电脑系统的重新安装,但是在新系统的安装过程中出现了错误,导致系统无法启动了。这个情况可以使用U盘来重装一个系统,恢复电脑的正常使用&#xff0c…

将springboot项目部署到linux上运行的步骤

前言: 博主看了许多的博客,总结出了最有用的部分,将springboot项目完整的运行在了linux虚拟机上。而不是仅仅只在网页打印一句话,就当做运行成功。运行成功页面如下: 运行成果展示: 接下来废话不多说&…

Python 读取大文件

读取大文件 python读取文件一般情况是利用open()函数以及read()函数来完成: f open(filename,r) f.read() 这种方法读取小文件,即读取大小远远小于内存的文件显然没有什么问题。但是如果是将一个10G大小的日志文件读取,即文件大小大于内存…

“深度学习”学习日记。与学习有关的技巧--正则化

2023.1.29 在机器学习的过程中,过拟合是一个常见的问题。过拟合指的是只能够拟合训练数据,但不能很好的拟合测试数据;机器学习的目的就是提高泛化能力,即便是没有包括在训练数据里的测试数据,也希望神经网络模型可以正…

javafx中gif 内存优化

1.背景 桌面程序对内存消耗要求很高,基本的要求是整个程序控制在500M以内。 这就要求每个功能点的内存消耗尽可能地少,大于50M的内存消耗就要想办法优化。 2.现状 gif的显示会导致程序的内存激增。以数字大脑用的雷达图动画为例进行说明,下…

TypeScript 学习笔记总结(一)

ts学习笔记总结。 文章目录一、什么是TypeScript?二、TypeScript 环境搭建三、TS 类型声明四、TS 类型详解五、TS 类型总结六、TS 编译选项1. tsconfig.json的 作用2. tsconfig.json的 配置选项013. tsconfig.json的 配置选项02七、Webpack 打包ts代码一、什么是Typ…

Bayanay:一款基于Python开发的无线网络安全研究工具

关于Bayanay Bayanay是一款基于纯Python开发的无线网络安全研究工具,在该工具的帮助下,无论你身处何地,都可以轻松地对周围地区的无线网络安全状况进行研究与分析。 该工具可以通过使用HTML5的地理位置定位功能并结合Scapy获取到的SSID信息…

LeetCode刷题系列 -- 25. K 个一组翻转链表

给你链表的头节点 head ,每 k 个节点一组进行翻转,请你返回修改后的链表。k 是一个正整数,它的值小于或等于链表的长度。如果节点总数不是 k 的整数倍,那么请将最后剩余的节点保持原有顺序。你不能只是单纯的改变节点内部的值&…

zabbix6,0创建监控项与触发器

zabbix_server IP : 172.31.0.5:10051 zabbix_client IP : 172.31.0.9:10050 zabbix_client已经运行了zabbix-agent,这里我用的是版本2 一、 创建监控项 1、 在客户端创建监控脚本 /etc/zabbix/zabbix_agent2.d #默认配置文件路径 2、 创建配置文件,编写监控脚本…

绿光GOQDs-SA氧化石墨烯量子点CdTe-FA-CS修饰CdTe-PEG-CS的制备

绿光GOQDs-SA氧化石墨烯量子点CdTe-FA-CS修饰CdTe-PEG-CS的制备今天小编分享制备GOQDs改性SA复合杂化膜,一起看看吧:GOQDs改性SA复合杂化膜的制备过程:将一系列不同分子量的CS及接枝壳聚糖用少量乙酸-乙酸钠溶液溶解后,加水稀释到一定浓度,用…

经典文献阅读之--FlowFormer(Transformer结构光流估计)

0. 简介 对于视觉SLAM而言,除了使用特征点法来完成VIO以外,还可以使用光流法来完成VIO的估计。而传统的光流法受环境,光照变化严重,所以有时候会出现光流偏差等问题。所以现在有越来越多的工作朝着深度学习的方向扩展&#xff0c…

卷积神经网络中的Conv层和BN层融合细节

BN层 批归一化层(Batch Normallization)是一种在卷积神经网络模型中大量使用,为了加速模型收敛的技术。为什么CNN 中引入 BN 层可以加速网络的收敛呢?因为将输入的样本数据或特征图,归一化后,改善了输入数…

智云通CRM:如何在初次见面识别客户机会?

有一次,我给一家公司做CRM系统培训之后,他们公司的老总请我吃饭。那是我们第一次见面,在饭桌上,我和他聊天,说:“洛老师,你们的CRM系统功能真的很不错,帮我我解决了很多销售管理上的…

设计模式面试题 一

第一题:阐述设计模式的责任链? 责任链模式定义: 使多个对象都有机会处理请求,从而避免请求的发送 者和接收者之间的耦合关系。将这些对象连成一条链,并沿着这条链传递该请求,直到有一 个对象处理它为止。 …

Ruoyi-Cloud框架学习-【03 后端启动 + 前端启动】

打开运行基础模块(启动没有先后顺序) 记得在后台先启动Redis,不然会报错 RuoYiGatewayApplication (网关模块 必须) : 即前端所有访问需要通过网关而不是直接访问具体接口、网关会对后台的微服务进行转发 RuoYiAuth…