大数据架构技术选型

news2024/11/25 11:40:21

OLAP数据库选型对比:
AnalyticDB(阿里)、Hologres(阿里)、Doris、StarRocks、ClickHouse、Hbase

AnalyticDB MySQL 技术架构

Adb是融合数据库、大数据技术于一体的云原生企业级数据仓库服务、支持高吞吐的数据实时增删改查低延时的实时分析和复杂ETL、兼容上下游生态工具、可用于构建企业级报表系统、数据仓库和数据服务引擎等,java 开发的,兼容MySQL协议

接入层:负责和用户侧进行交互,接受查询请求解析SQL查询语句,生成并优化查询计划及任务调度
计算层:负责具体的任务计算逻辑执行
存储层:负责数据存储及扫描数据

产品形态:
弹性模式:存储计算分离,支持分别扩展、计算时弹性功能、计算资源组隔离功能

资源组
在弹性模式中
支持资源组隔离,资源池功能可以对计算资源进行弹性划分,不同资源池之间的计算资源在物理上完全隔离,通过ADB mysql数据库账号绑定到不同的资源池,sql查询根据绑定关系路由至对应的资源池进行执行,从而满足实例内部多租户、混合负载的需求

默认资源池
默认资源池 user_default 是实例创建时存在的,不可删除
自定义资源池
用户自定义创建的资源池,可以针对资源的计算、查询执行模式、ADB mysql账号与资源池的绑定关系修改

查询流程
1、用户下发sql
2、前端节点负责解析SQL、生成分布式执行计划、下发到计算节点和存储节点执行
3、执行完成后、将结果返回费前端节点

常见概念
1、Stage:代表了整个SQL分布式执行计划树中的一颗树,每一stage会对应多个tast并发
2、Tast:是stage在某一个worer或者excutor上的实例负责具体的计算执行
3、Oprator:具有计算能力的运算单位,表示一个计算逻辑
在这里插入图片描述
参考官网:https://help.aliyun.com/zh/analyticdb-for-mysql/product-overview/overall-architecture

hologres(实时数仓)技术架构
在这里插入图片描述
官网参考:https://help.aliyun.com/zh/hologres/product-overview/architecture

Doris技术架构
Doris整体架构如下图所示,Doris 架构非常简单,只有两类进程

Frontend(FE),主要负责用户请求的接入、查询解析规划、元数据的管理、节点管理相关工作。

Backend(BE),主要负责数据存储、查询计划的执行。
在这里插入图片描述
参考官网:https://doris.apache.org/zh-CN/docs/get-starting/what-is-apache-doris/

StarRocks技术架构
在这里插入图片描述
参考官网:https://docs.mirrorship.cn/zh/docs/3.0/introduction/Architecture/

ClickHouse技术架构
Shard:集群内划分为多个分片或分组(Shard 0 … Shard N),通过 Shard 的线性扩展能力,支持海量数据的分布式存储计算。
Node: 每个 Shard 内包含一定数量的节点(Node,即进程),同一 Shard 内的节点互为副本,保障数据可靠。ClickHouse 中副本数可按需建设,且逻辑上不同 Shard 内的副本数可不同。
ZooKeeper Service: 集群所有节点对等,节点间通过 ZooKeeper 服务进行分布式协调。
在这里插入图片描述

参考:
https://developer.aliyun.com/article/1212409
https://developer.aliyun.com/article/1316795
https://developer.aliyun.com/live/43846

官网:
ClickHouse官网地址,请参见https://clickhouse.yandex/。

ClickHouse中文文档链接,请参见https://clickhouse.yandex/docs/zh/。

Hbase 技术架构
在这里插入图片描述

参考文档:
https://developer.aliyun.com/article/1172165
https://developer.aliyun.com/article/891048

特点及适用场景:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1531328.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

企业合规视角下的恒大地产财务造假案深度剖析

当幕布被拉开,真相暴露在聚光灯下,近日中国房地产市场的巨头恒大地产因财务造假被中国证监会严厉处罚,引起了公众和市场的强烈震动。这份重量级的罚单,不仅以41.75亿元的天价罚款单给恒大地产记下了沉重的一笔,更是将包…

数据仓库相关概述

数据仓库概述 数据仓库概念 数据仓库是一个为数据分析而设计的企业级数据管理系统。数据仓库可集中、整合多个信息源的大量数据,借助数据仓库的分析能力,企业可从数据中获得宝贵的信息进而改进决策。同时,随着时间的推移,数据仓…

IDEA Git恢复DropCommit删除的提交

刚刚Dorp commit了,本地代码也被删除了,如何恢复呢, 从项目中登录git,找到刚刚的commit代码,如下所示:输入命令git reflog 复制代码,到idea中,打开GIt,找到RESET HEAD, …

【数据可视化】使用Python + Gephi,构建中医方剂关系网络图!

代码和示例数据下载 前言 在这篇文章中,我们将会可视化 《七版方剂学》 的药材的关系,我们将使用Python制作节点和边的数据,然后在Gephi中绘制出方剂的网络图。 Gephi是一个专门用于构建网络图的工具,只要你能提供节点和边的数…

Android StateLayout状态页

文章目录 Android StateLayout状态页概述源码使用源码下载 Android StateLayout状态页 概述 StateLayout(状态页)包含:加载中页面,错误页面,空页面,内含状态默认页面,支持自定义页面。 源码 …

如何在SpringCloud2023中快速集成注册中心

你好,这里是codetrend专栏“SpringCloud2023实战”。欢迎点击关注查看往期文章。 注册中心在前文提到有很多选型,在这里以Spring Cloud Zookeeper为例说明注册中心的集成和使用。 选择Spring Cloud Zookeeper作为注册中心原因如下: 依赖更少…

水电能源智能化监控系统

水电能源智能化监控系统是利用现代信息技术,对水电站的运行状态、设备性能、环境参数等进行实时监测和管理的一种智能化系统。随着我国水电能源事业的快速发展,水电能源智能化监控系统在水电能源行业中的应用越来越广泛,为我国水电能源事业的…

用Python的turtle库绘制皮卡丘

turtle库的简介 turtle(海龟)库是turtle绘图体系的python实现,turtle库是一种标准库,是python自带的。 turtle(海龟)是一种真实的存在,有一个海龟在窗口的正中心,在画布上游走,走过的轨迹形成了绘制的图形&#xff0…

如何快速搭建一个完整的vue2+element-ui的项目-二

技术细节-继续配置 提示:你以为这样就完了吗,其实还有很多东西需要我们自己手写的 例如: element-ui的配置样式重置配置src使用的配置elinst配置axios异步请求的二次封转配置语言国际化配置(这个看需求,我这里就不用配置了)vuex的配置mixins的配置开发环…

改进YOLOv8注意力系列六:结合SEAttention轻量通道注意力、ShuffleAttention重排特征注意力模块、SimAM无参数化注意力

改进YOLOv8注意力系列五:结合ParNetAttention注意力、高效的金字塔切分注意力模块PSA、跨领域基于多层感知器(MLP)S2Attention注意力 代码SEAttention轻量通道注意力ShuffleAttention重排特征注意力模块SimAM无参数化注意力加入方法各种yaml加入结构本文提供了改进 YOLOv8注…

vulnhub-----SickOS靶机

文章目录 1.信息收集2.curl命令反弹shell提权利用POC 1.信息收集 ┌──(root㉿kali)-[~/kali/vulnhub/sockos] └─# arp-scan -l Interface: eth0, type: EN10MB, MAC: 00:0c:29:10:3c:9b, IPv4: 10.10.10.10 Starting arp-scan 1.9.8 with 256…

【数据库基础增删改查】修改与删除

系列文章目录 🌈座右铭🌈:人的一生这么长、你凭什么用短短的几年去衡量自己的一生! 💕个人主页:清灵白羽 漾情天殇_计算机底层原理,深度解析C,自顶向下看Java-CSDN博客 ❤️相关文章❤️:清灵白羽 漾情天…

cocos 3.8开发 微信小游戏分包技巧压缩主包

Creator 版本: 3.8.2 目标平台:小游戏开发 压缩后 我不知道别人压缩几百kb是怎么做到的。不过哪个要钱。 我这个技巧不用花钱。 论坛有教程但是没有教详细怎么做。 开整! 做一个空白的场景。然后写一个load脚本。load主场景。 从代码可…

初代编译器实验

此文章用于记录第一次编译器实验的实践心得以及一些知识记录。 次实验主要目的是将C语言代码转换成对应的汇编代码,这就涉及到对与表达式的处理。 我们一般使用的表达式是中缀表达式,这对于我们人来说是比较好识别并且计算的。但对于机器,内部…

ES 8.x的全程编译实践与问题解决

摘要 本文整理和记录ES 8.x的编译过程问题与解决方案,主要解决gradle下载问题以及国内源、Hadoop环境设置与hadoop附件缺失、编译时jdk版本指定、esql的compute超时报错、编译时警告导致编译失败等问题! 本地目录结构 . ├── build.sh ├── hadoo…

交叉注意力融合时域、频域特征的FFT + CNN -BiLSTM-CrossAttention电能质量扰动识别模型

往期精彩内容: 电能质量扰动信号数据介绍与分类-Python实现-CSDN博客 Python电能质量扰动信号分类(一)基于LSTM模型的一维信号分类-CSDN博客 Python电能质量扰动信号分类(二)基于CNN模型的一维信号分类-CSDN博客 Python电能质量扰动信号分类(三)基于Transformer…

大模型第一讲笔记

目录 1、人工智能基础概念全景介绍... 2 1.1 人工智能全景图... 2 1.2 人工智能历史... 2 1.3 人工智能——机器学习... 3 监督学习、非监督学习、强化学习、机器学习之间的关系... 3 监督学习... 4 无监督学习... 5 强化学习... 5 深度学习... 6 2、语言模型的发展及…

MySQL 多表查询强化练习

环境准备 create table dept(id int PRIMARY KEY,dname VARCHAR(50),loc VARCHAR(50) ); insert into dept values (10,研发部,北京), (20,学工部, 上海), (30,销售部,广州 ), (40,财务部,深圳);create table job(id int PRIMARY KEY,jname VARCHAR(20),descripition VARCHAR(…

小米汽车定价较预期下调3万至5万,发布之前仍有可能微调

跨界造车的新势力小米汽车正逐渐揭开其神秘面纱。最新爆料显示,小米汽车内部对车辆的定价进行了讨论,较之前的预期下调了3万至5万的幅度。然而,在正式发布之前,这一价格仍有可能进行微调。 历经三年的精心筹备,小米汽车…

5G网络架构与组网部署03--5G网络组网部署

1. SA组网与NSA组网 (1)NSA 非独立组网:终端同时接入4G基站和5G基站,只能实现5G部分功能 (2)SA组网【最终目标】:5G基站可以单独提供服务,接入的是5G核心网 区别:同一时间…