StarRocks详解

StarRocks详解

news2026/2/15 14:06:27

什么是StarRocks？

StarRocks是新一代极速全场景MPP数据库（高并发数据库）。

StarRocks充分吸收关系型OLAP数据库和分布式存储系统在大数据时代的优秀研究成果。

1.可以在Spark和Flink里面处理数据，然后将处理完的数据写到StarRocks里面。

2.可以实现将数据从Hadoop倒入到StarRocks里面去，也可以将StarRocks的数据倒入到Hadoop里面，都是可以实现的。

3.可以对接ES数据库（ElasticSearch）。

4.StarRocks兼容MySQL的协议，可以通过 MySQL的客户端和常用BI工具对接StarRocks来进行数据分析。

5.StarRocks采用分布式架构，对数据表进行水平划分并且以多副本存储，集群规模可以灵活伸缩，能够支持10PB级别的数据分析，支持MPP框架，并行加速计算，支持多副本，具有弹性容错能力。

StarRocks适合什么场景？

1.OLAP多维分析：用户行为分析，用户画像，财务报表，系统监控分析。

2.实时数据分析：电商数据分析，直播质量分析，物流运单分析，广告投放分析。

3.高并发查询：广告主表分析，Dashboard多页面分析。

4.统一分析：通过使用一套系统解决上述场景，降低系统复杂度和多技术栈开发成本。

StarRocks基本概念：

1.FE：FrondEnd是StarRocks的前端节点，负责管理元数据，负责与客户端连接，进行查询规划，查询调度等工作。

2.BE：BackEnd时StarRocks的后端节点，负责数据存储，计算执行，以及Compaction，副本管理等工作。

3.Broker：Broker并不是必须出现的，当StarRocks和HDFS进行交互的时候（也就是数据从HDFS到StarRocks中和数据从StarRocks中到HDFS里面），那么StaRocks负责这个过程的中转服务，辅助提供导入导出功能。

4.StarRocksManager：StarRocks的可视化工具，提供StarRocks的集群管理，在线查询，故障查询，监控报警的可视化工具。

5.Tablet：StarRocks中表的逻辑分片，也是StarRocks中副本管理的基本单位，每个表根据分区和分桶机制被划分成多个Tablet存储在不同BE节点上。

StarRocks系统架构：

FE：

1.接受MySQL客户端的连接，解析并且执行SQL语句。

2.管理元数据，执行SQL DDL命令，用CataLog记录库，表，分区，tablet副本等信息。

3.FE高可用部署，使用复制协议选主和主从同步元数据，所有的元数据修改操作，都有FE的leader节点完成，FE的follower节点可执行读操作。元数据的读写满足顺序一致性，FE的节点数目采用2n+1，可以容忍n个节点故障，当FE leader故障的时候，可以从现有的follower节点中重新选主，完成故障切换。

4.FE中的SQL Layer对用户提交的SQL进行解析，分析，改写，语义分析和关系代数优化，生产逻辑执行计划。

5.FE中的Planner负责把逻辑计划转化为可分布式执行的物理计划，分发给一组BE。

6.FE监督BE，管理BE的上下线，根据BE的存活和健康状态，维持tablet副本的数量。

7.FE协调数据导入，保证数据导入的一致性。

BE：

1.BE管理tablet副本，tablet时table经过分区分桶形成的子表，采用列式存储。

2.BE受FE指导，创建或删除子表。

3.BE接收FE分发的物理执行计划并指定BE coordinator节点，在BE coordinator的调度下，与其他BE worker共同协作完成执行。

4.BE读本地的列存储引擎获取数据，并通过索引和谓词下沉快速过滤数据。

5.BE后台执行compact任务，减少查询时的读放大。

6.数据导入的时候，由FE指定BE coordinator，将数据以fanout的形式写入到tablet多副本所在的BE上。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1819075.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

连接·共享·成长：15大顶尖峰会热议AI，逾万商家聚焦实在Agent

连接·共享·成长：15大顶尖峰会热议AI，逾万商家聚焦实在Agent

在数字化浪潮的推动下，人工智能（AI）和机器人流程自动化（RPA）正成为行业创新和效率提升的强大引擎。作为自动化领域的领航者，实在智能不仅在AI技术革新上保持领先地位，更通过一系列行业活动&…

阅读更多...

计算机SCI期刊，中科院3区，IF=5.6，审稿速度非常快

计算机SCI期刊，中科院3区，IF=5.6，审稿速度非常快

一、期刊名称 International Journal of Machine Learning and Cybernetics 二、期刊简介概况期刊类型：SCI 学科领域：计算机科学影响因子：5.6 中科院分区：3区三、期刊征稿范围控制论关注的是描述我们日常生活中无处不在…

阅读更多...

2.6-5V/2.5A升9V12V18V方案升压恒压IC 低功耗小家电芯片-H6391惠海

2.6-5V/2.5A升9V12V18V方案升压恒压IC 低功耗小家电芯片-H6391惠海

H6391升压恒压IC是一款适用于多种小家电和电子设备的电源管理升压恒压芯片。其设计特点有低功耗、高效率以及灵活配置等方面，以下是针对其特性的详细分析： 宽输入电压范围：H6391支持2.6-5V的输入电压范围，这使得它适合于由单节锂电…

阅读更多...

App UI 风格，引领设计风向

App UI 风格，引领设计风向

App UI 风格，引领设计风向

阅读更多...

PCE自动装机

PCE自动装机

服务端和客户端 pxe：c/s模式，允许客户端通过远程服务器(服务端)下载引导镜像，加载安装吻技安，实现自动化安装操作系统。无人值守：安装选项不需要认为干预，可以自动化实现。 pxe优点： 1.规模…

阅读更多...

Linux C语言：变量的作用域和生命周期（auto、register、static和extern）

Linux C语言：变量的作用域和生命周期（auto、register、static和extern）

一、变量存储类型-auto 1、auto变量的说明变量在程序中使用时,必须预先说明它们的存储类型和数据类型。变量说明的一般形式是： <存储类型> <数据类型 > <变量名> ； <存储类型>是关键词auto、register、static和extern<…

阅读更多...

光储充一体化充电站：能源革新的绿色引擎

光储充一体化充电站：能源革新的绿色引擎

在这个科技日新月异的时代，一场绿色能源的革命正悄然兴起。光储充一体化充电站，作为这场革命中的璀璨明星，正以其独特的魅力，引领我们走向更加环保、高效的未来。光储充一体化充电站，顾名思义，将光伏发电…

阅读更多...

Java爬虫——正则表达式应用

Java爬虫——正则表达式应用

Pattern Matcher均属于regex下步骤：pattern获取正则，matcher获取文本对象，find截取字符串（返回true、false），group获得字符例题：爬取指定文字分析： 二次调用时： 循环…

阅读更多...

【云服务器介绍】选择指南腾讯云阿里云全配置对比搭建web 个人开发 app 游戏服务器

省流目录：适用于博客建站（2-4G）、个人开发/小型游戏[传奇/我的世界/饥荒]（4-8G）、数据分析/大型游戏[幻兽帕鲁/雾锁王国]服务器（16-64G） 1.京东云-618专属活动官方采购季专属活动地址&#x…

阅读更多...

循环 -控制语句

循环 -控制语句

循环循环是什么重复执行一段代码的结构。只要满足循环的条件，会一直执行这个代码。循环条件：在一定范围之内，按照指定的次数来执行循环。循环体：在指定的次数内执行的命令序列。只要条件满足循环体会被一直执行。循环和…

阅读更多...

抖店被扣保证金，做起来太难导致心态崩了，怎么办？

抖店被扣保证金，做起来太难导致心态崩了，怎么办？

我是王路飞。技术、黑科技这些东西，决定不了你做店的结果。能够决定最终结果的，一定是心态，是乐观还是悲观？是自负还是自卑？是焦躁还是踏实？这很关键。店铺被扣保证金了，感觉没希望了&…

阅读更多...

Arduino 项目：太阳能跟踪器

Arduino 项目：太阳能跟踪器

在本文中，您将逐步学习如何使用光敏电阻和舵机制作双轴太阳能跟踪器 Arduino 项目。在这个项目中，我们将使用一些光敏传感器来跟踪阳光，并将利用舵机将太阳能电池板引导到可提高其效率的区域。此项目所需的组件序号部件名称描述数量备注…

阅读更多...

加码多肤色影像技术这是传音找到的“出海利器“？

加码多肤色影像技术这是传音找到的“出海利器“？

全球化时代，市场竞争愈演愈烈，产品差异化已然成为了企业脱颖而出的关键。在黄、白肤色长期占据人像摄影主赛道的背景下，传音就凭借独一无二的多肤色影像技术走出非洲，走向了更广阔的新兴市场。聚焦深肤色人群拍照痛点&#xff0c…

阅读更多...

2024酒店IPTV云桌面系统建设方案

2024酒店IPTV云桌面系统建设方案

Hello大家好，我是点量小芹，这一年多的时间一直在分享实时云渲染像素流相关的内容，今天和大家聊聊酒店IPTV云桌面电视系统解决方案，或者有的朋友也会称之为IPTV服务器。熟悉小芹的朋友知道，IPTV软件系统是我们一直在推的…

阅读更多...

C++迈向精通：当我尝试修改虚函数表

C++迈向精通：当我尝试修改虚函数表

尝试修改虚函数表本期纯整活儿好吧！！！！ 初衷有一天我突然开始好奇虚函数表是否真的存在，于是我开始想是否能够从C中查看或者调用虚函数表中的内容。，于是有了下面的操作。操作过程起初我并没有思路…

阅读更多...

gridview的模板按钮如何判断用户点击的是哪一行

gridview的模板按钮如何判断用户点击的是哪一行

在asp.net的 GridView 控件中，判断用户点击的是哪一行通常可以通过处理 GridView 的 RowCommand 事件来实现。RowCommand 事件会在 GridView 的每个按钮（除非另有指定的CommandName）被点击时触发，并且事件参数中包含了足够的信息来…

阅读更多...

基于redis的分布式锁

基于redis的分布式锁

一、redis分布式锁基本信息 1.详细讲解： Redis 分布式锁是一种用于控制分布式系统中多个进程对共享资源的并发访问的机制。通过 Redis 的原子操作和过期时间功能，可以实现一个简单而有效的分布式锁。接下来，我们将详细介绍其工作原理、基本…

阅读更多...

杨氏矩阵和杨辉三角的空间复杂度较小的解题思路

杨氏矩阵和杨辉三角的空间复杂度较小的解题思路

文章目录题目1 杨氏矩阵题目2 杨辉三角题目1 杨氏矩阵有一个数字矩阵，矩阵的每行从左到右是递增的，矩阵从上到下是递增的，请编写程序在这样的矩阵中查找某个数字是否存在。要求：时间复杂度小于O(N); 思路: 我们可以通过题目…

阅读更多...

springboot SSM 宠物医院管理系统(源码+论文)

springboot SSM 宠物医院管理系统(源码+论文)

绪论 1.1 计算机管理信息系统的发展情况 1958 年美国首先提出了 “管理信息系统 ”（即 MIS：Management Information Systems），从而也引出了另外一个概念 ——“管理信息系统 ”。综合其多种定义以及根据在实际中的应用&#xff…

阅读更多...

C语言| 数组

C语言| 数组

直接定义一个数组，并给所有元素赋值。数组的下标从0开始，下标又表示数组的长度。【程序代码】 #include <stdio.h> int main(void) { int a[5] {1, 2, 3, 4, 5}; int i; for(i0; i<5; i) { printf("a[%d] %d\…

阅读更多...

推荐文章

最新文章