StarRocks--被 Databricks CEO 提及的数据库

news2024/11/15 12:28:13

Databricks 介绍

Databricks是一家美国的大数据独角兽公司,由 Apache Spark 的创建者所创立。Databricks 开源了 Delta Lake--基于 Apache Spark 的下一代数据湖存储引擎。Delta Lake 是目前市面上主流的数据湖存储引擎之一,与 Apache Hudi 和 Apache Iceberg 并称为数据湖三剑客。

在最近结束的 Databricks Data + AI Summit 上,Databricks CEO Ali Ghodsi 发布了 Delta Lake 3.0。这个新版本引入了一种名为通用格式(UniForm)的开放表格式,可读写三种流行的数据表格式,包括 Delta Lake、Apache Iceberg 和 Apache Hudi。这体现了 Databricks 拥抱开放数据生态的决心。

开放表格式通过提供一个标准和统一的方式来访问大数据集,而表格式的一统可以帮助用户降低多种格式共存的技术成本。可以说,这个理念与 StarRocks 期望构建的基于开放生态的,极速统一的湖仓分析新范式不谋而合!

​Ali Ghodsi 在主题演讲中提及了 StarRocks


StarRocks--极速统一的湖仓新范式

01 StarRocks 的极致查询性能

  • MPP 分布式执行

  • Pipeline 并行执行框架

  • 向量化执行引擎

  • CBO 优化器

  • Global Runtime Filter

  • Metadata Cache

  • Local Data Cache

  • Materialized View

关于 StarRocks 的极致性能已经有很多资料介绍了,这里就不多加展开。大家可以通过文末文章链接了解更多细节。

02 利用StarRocks的 "House" 能力进一步提升性能

StarRocks 不仅仅是一个查询引擎,同时也拥有一个强大的存储引擎,如果你希望进一步提升查询性能或者查询并发能力,你可以将数据导入到 StarRocks 中,StarRocks 的本地存储拥有丰富的索引能力、实时更新能力和多表 colocate join 能力。

数据导入 StarRocks 中有两种方式:手动导入数据和 MV 自动导入数据。

StarRocks 支持对数据湖上的表创建物化视图,并且支持自动数据同步和自动查询改写。

03 StarRocks 支持冷热分离+自动查询改写

大多数情况下,我们希望最近一周或者一个月的热数据拥有更好的查询性能,在 StarRocks 中,MV (物化视图)可以方便且高效地实现这一目标:

如上图所示,StarRocks 的 MV 可以只保存最近一个月的数据,当你查询 Data Lake 上的数据时,StarRocks 会帮你自动改写,最新的数据从 StarRocks 查询,而历史数据则从 Data Lake 查询,然后自动进行 Union 操作,将两部分数据合并返回给你。

04 StarRocks 支持实时更新

​因为 StarRocks 同时支持实时高效更新和写出到 Iceberg,所以我们可以基于 StarRocks 构建实时更新的 Lakehouse。当你同时需要实时更新、极致查询性能和开放的 Table Format,StarRocks 便是你的唯一选择。

05 简单易用的 Catalog 元数据管理

StarRocks 提供了一键同步外部数据库中的所有表元数据的功能,并且可以快速同步各种 Data Lake 数据源。

06 可弹性伸缩

StarRocks 用于数据湖分析的计算节点是无状态的,可以结合 K8s 进行快速弹性伸缩。

​在前面的内容中,我们总结了 StarRocks 数据湖的卓越能力。而在未来,我们的承诺依然是让数据处理变得更简单(统一)、更快速有效(极速)。我们期待进一步利用 Delta UniForm 的能力,使用户能够更轻松地在各种开放数据格式上进行亚秒级分析。这种生态上的融合能够将亚秒级分析的功能范围扩展到更广泛的用户群体,使数据分析比以往任何时候都更加容易!

想要再深入了解更多关于 StarRocks 湖仓分析的特性吗?欢迎利用以下资源:

当打造一款极速湖分析产品时,我们在想些什么

StarRocks 3.0 极速统一的湖仓新范式

技术内幕 | StarRocks 支持 Apache Hudi 原理解析

StarRocks 湖仓融合的四种范式

💬 加入 StarRocks 的 Lakehouse 用户小组,开启你与 StarRocks 的极速湖仓分析之旅! 点击链接填写完问卷后即可获得入群方式:https://tl-tx.dustess.com/0kGIuI4VTZ

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/729193.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

十、less语法2

目录: 1.详解 1.详解 1.less 里面是可以直接进行数值运算 .box1{// 在less,所有数值都可以进行运算 ,- * /width: 100px 100px;height:100px/2;background-color: #bfa;}2.在less中引入模块xx.less // import用来将其他的less引入到当前的less,相当于…

EasyCVR长时间运行后,级联到上级平台的通道无法播放是什么原因?

EasyCVR视频融合平台基于云边端一体化架构,具有强大的数据接入、处理及分发能力,平台支持多协议、多类型的设备接入,可实现的功能包括:视频直播、录像、回放、检索、云存储、告警上报、语音对讲、电子地图、集群以及平台级联等&am…

使echarts图例legend只选中一个(selectedMode)

例如:两个块选中第一个,第二个自动取消,选第二个,第一个取消 selectedMode: single,

有了PMP证书还有必要学习CSPM吗?CSPM含金量咋样?

建议学习,CSPM 相当于是 PMP 的本土化,是中国的项目管理,在中国自然还是本土的更适合国情,有CSPM还是更好找工作些。 CSPM认证6月1号才正式开启,现在是福利期,PMP持证者不用参加考试可以直接走换证流程&am…

Java【代码 16】Milvus向量库工具类和SeetaSDK获取人像向量和属性的工具类分享

Milvus向量库和SeetaSDK工具类分享 1.Milvus向量库工具类2.SeetaSDK工具类 1.Milvus向量库工具类 Milvus的Maven依赖&#xff1a; <dependency><groupId>io.milvus</groupId><artifactId>milvus-sdk-java</artifactId><version>2.1.0<…

利用Ettercap进行钓鱼攻击

原理:利用ARP协议特性,使用ettercap在内网不断的发送和抢答MAC地址,让受害者访问网关及DNS服务器实际均为攻击者的服务器。 前言&#xff1a;Ettercap是一款流行的网络安全工具&#xff0c;可用于网络嗅探、欺骗和分析攻击。它可以截获网络流量&#xff0c;使用户可以查看到传输…

Sql Injection — 注入攻击原理-2(实战)

还是实战&#xff0c;如果没什么事的话几乎每天日更 目录 前言一、总结 前言 sql实战-2 提示&#xff1a;以下是本篇文章正文内容&#xff0c;下面案例可供参考 一、 公司的新闻网 我们进入一篇文章&#xff0c;我们发现这个网页应该是ASP动态网页文件 还记得第一篇文章的sq…

了解O2OA(翱途)开发平台中的VIP应用

使用O2OA(翱途)开发平台可以非常方便地进行项目的业务需求开发与实施&#xff0c;O2OA(翱途)开发平台并不限制实现的系统类型&#xff0c;所以能实现的系统很多&#xff0c;最终呈现的项目成果也是多样性的&#xff0c;可能是OA系统&#xff0c;可能是人力资源管理系统&#xf…

JVM进阶学习(类加载器、垃圾回收、JVM调优、内存泄漏的排查思路)

文章目录 1、JVM组成1.1、JVM组成及运行流程1.2、程序计数器什么是程序计数器&#xff1f; 1.3、Java堆你能给我详细的介绍Java堆吗? 1.4、虚拟机栈什么是虚拟机栈垃圾回收是否涉及栈内存&#xff1f;栈内存分配越大越好吗&#xff1f;方法内的局部变量是否线程安全&#xff1…

蓝桥杯专题-真题版含答案-【啤酒和饮料】【六角填数】【兰顿蚂蚁】【猜字母】

点击跳转专栏>Unity3D特效百例点击跳转专栏>案例项目实战源码点击跳转专栏>游戏脚本-辅助自动化点击跳转专栏>Android控件全解手册点击跳转专栏>Scratch编程案例点击跳转>软考全系列点击跳转>蓝桥系列 &#x1f449;关于作者 专注于Android/Unity和各种游…

功能测评-InsCode Stable Diffusion 美图活动一期

一、 Stable Diffusion 模型在线使用地址&#xff1a; https://inscode.csdn.net/inscode/Stable-Diffusion 进入之后点击运行并使用&#xff0c;会弹出一个购买算力资源的窗口。由于是试用&#xff0c;不涉及到连续生成多张图片等场合&#xff0c;因此算力足够用了&#xff…

如何将idea里面的项目上传到gitee仓库里面?

目录 第一步&#xff0c;在Gitee这边新建一个仓库 第二步&#xff0c;添加ssh公钥 第三步&#xff0c;将idea上面的项目上传到仓库。 第四步&#xff0c;刷新gitee这边的网页就可以看到我们上传的项目了哦。 总结 本篇文章是用来记录我是如何将idea上面的项目上传到gitee仓库…

如何使用ChatGPT的API(三)处理违规输入

当我们要构建一个对话机器人的时候&#xff0c;常常需要检测用户的输入是否有违规。用户是否输入了一些暴力&#xff0c;色情的内容&#xff0c;这对维护系统正规使用至关重要。下面将介绍一些方法来检测用户的输入是否违规。 OpenAI Moderation API OpenAI 提供了免费的Mode…

亚马逊摊上事了,欧盟委员会对其收购iRobot展开反垄断调查

KlipC报道&#xff1a;周四亚马逊16.5亿美元收购扫地机器人制造商iRobot的交易引发欧盟深入调查&#xff0c;消息公布后&#xff0c;iRobot股价没有太大变动&#xff0c;然而截至当日收盘&#xff0c;亚马逊跌1.55%&#xff0c;报128.36美元。 对此欧盟表示&#xff1a;“亚马逊…

Dijkstra求最短路 — 朴素/堆优化 + 模拟邻接表 及 遍历

Dijkstra求最短路 给定一个 n个点 m 条边的有向图&#xff0c;图中可能存在重边和自环&#xff0c;所有边权均为正值。请你求出 1号点到 n 号点的最短距离&#xff0c;如果无法从 1 号点走到 n 号点&#xff0c;则输出 −1。 朴素dijkstra #include<iostream> #include&…

PTA——L1-027 出租分数 20

下面是新浪微博上曾经很火的一张图&#xff1a; 一时间网上一片求救声&#xff0c;急问这个怎么破。其实这段代码很简单&#xff0c;index数组就是arr数组的下标&#xff0c;index[0]2 对应 arr[2]1&#xff0c;index[1]0 对应 arr[0]8&#xff0c;index[2]3 对应 arr[3]0&…

路径规划算法:基于寄生捕食优化的路径规划算法- 附代码

路径规划算法&#xff1a;基于寄生捕食优化的路径规划算法- 附代码 文章目录 路径规划算法&#xff1a;基于寄生捕食优化的路径规划算法- 附代码1.算法原理1.1 环境设定1.2 约束条件1.3 适应度函数 2.算法结果3.MATLAB代码4.参考文献 摘要&#xff1a;本文主要介绍利用智能优化…

【Java基础教程】(五)程序概念篇 · 下:夯实基础!全面解析Java程序的逻辑控制体:顺序、选择与循环结构~

Java基础教程之程序概念 下 本节学习目标1️⃣ 程序逻辑控制1.1 顺序结构1.2 分支结构1.2.1 if 选择结构1.2.2 switch 选择结构 1.3 循环结构1.3.1 while 循环1.3.2 for 循环1.3.3 循环控制 &#x1f33e; 总结 本节学习目标 掌握Java中分支结构、循环结构、循环控制语法的使…

前端js代码一句话模拟Ctrl+A全选网页内容效果document.execCommand(‘selectAll‘);

document.execCommand(selectAll);//命令不区分大小写 document.execCommand(aCommandName, aShowDefaultUI, aValueArgument) aCommandName&#xff1a;命令名称 aShowDefaultUI&#xff1a;交互方式&#xff0c; Boolean值&#xff0c;true的话将显示对话框&#xff0c;如…

Oracle11g 64位下载

下载地址 http://download.oracle.com/otn/linux/oracle11g/R2/linux.x64_11gR2_database_1of2.ziphttp://download.oracle.com/otn/linux/oracle11g/R2/linux.x64_11gR2_database_2of2.zip如果下载出现如下错误页面 这时候可以登录oracle官网&#xff0c;随意点击一个下载&am…