3分钟带你重温 SelectDB 产品发布会亮点!

news2024/11/18 21:25:46

12月8日的 SelectDB 产品发布会圆满举办,一时间吸引了无数业内关注,大家都对这款在正式发布前就拿下 ClickBench 全球第一的云数仓产品充满期待与好奇。万众瞩目下,SelectDB Cloud 终于正式与大家见面了~~

以下是这场发布会的详细解读,错过发布会的小伙伴们可以点赞收藏这篇干货满满的发布会笔记哦~

在大数据时代的今天,数据分析技术已然成为数字经济时代最核心生产力!

回顾往昔,可以归结为三个典型阶段:

第一阶段:传统数据仓库时代

使用场景:企业内部 BI

技术实现:基于传统数据库共享存储架构和专门面向分析型的无共享 MPP 架构

第二阶段:湖仓并行时代

使用场景:企业内部报表与分析,更大规模的 ETL 数据工程、行为分析和画像等新型数据应用分析,百万级外部客户高并发需求

技术实现:离线数据湖,在线实时数仓

第三阶段:“云数仓为中心”的现代数据栈时代

需求场景:一个系统复杂度低、性价比高、简单易用且可以应对更多元、广泛的场景和产业的数据分析平台方案

技术实现:云原生化、实时统一的新一代云数仓产品

作为现代数据栈时代的主心骨,数仓在企业数字化转型的这场战役中无疑背负着极为重要的使命。如今的时代又对数仓提出了怎样的要求?云计算的浪潮下,数仓的三个技术发展趋势愈发清晰:

  • 实时化:千或万级高并发、毫秒级低延迟、高吞吐、走向分钟级的数据产出效率成为了数据分析技术的关键词。

  • 统一化:湖仓一体、在离线一体、流批一体等智能湖仓的理念加速了平台和接口的统一;计算模型的融合、多模数据类型支持进一步提高存储计算的效能,降低运维门槛。

  • 云原生化:数据仓库结合云的软硬件创新、资源弹性、安全可靠、随需而用等云原生特色,从根本上带给用户极致性价比和极简使用体验。

将数字化转型新时代中的需求作为产品的标准,SelectDB 顺势而为,应运而生。基于存算分离的云原生架构研发,SelectDB Cloud  构建于多云之上,并针对复杂、多样的企业级数据分析需求打造五大核心特色优势:极致性价比 / 融合统一 / 简单易用 / 企业级特性 / 开源开放

SelectDB Cloud 产品优势解读

>>> 极致性价比

左右滑动读懂 SelectDB Cloud 的极致性价比

   极致性价比背后的“黑科技”

  • 查询引擎的优化:基于 MPP 查询引擎进行优化,支持节点间和节点内并行执行;支持多张大表的分布式 shuffle join;;同时还支持类似 runtime filter 等动态执行技术,通过动态调整执行达到最优的执行效率。通过 colocate join 和 bucket shuffle join 优化能够减少数据传输,提升 join 性能。

  • 高效的数据处理:采用了列式内存布局,向量化计算框架。大幅减少了虚函数调用,提高了 cache 命中率,高效利用了 simd 指令,从而使得算子的性能提升数十倍。

  • 多种存储模式:采用了列式存储,使得编码、压缩、处理都非常高效;支持多种索引结构来做数据剪枝,加速数据扫描。支持物化视图,有效加速查询时的效率;支持多种存储模型。

  • 智能优化策略:采用了 RBO 和 CBO 结合的智能优化器。即将发布的短路径优化,还能够支持数万QPS 的并发点查。

  • 云原生架构:SelectDB Cloud 云原生架构实现了本地磁盘缓存和对象存储的分层分级存储引擎 ——这样不同层级的存储成本带来综合成本大幅下降;同时在云原生架构实现了计算节点的分离和弹性,得以令计算资源的随需弹性扩缩容。

>>> 融合统一

左右滑动读懂 SelectDB Cloud 的融合统一

   融合统一背后的“黑科技”

  • 混合负载SelectDB Cloud 支持传统 OLAP 场景 (实时报表和 Adhoc 分析等),也支持批量数据处理(ETL/ELT)。开发者在将大批量的离线 ETL 变成实时、小批量和增量的 ETL后,SelectDB Cloud 能够利用全内存的框架和向量化的引擎来更加高效的处理数据,可以达到几十倍的性能提升。开发者通过简单、标准的 SQL 语句就可以完成数据加工,SelectDB Cloud 也支持 Java UDF 来完成更加个性化的数据处理逻辑。同时,在云上 SelectDB Cloud 也很便捷的使用单独的 ETL 集群来做隔离。

  • 结构化/半结构化支持:SelectDB Cloud 高效原生支持半结构化数据的高效存储和检索分析,在降低了系统复杂性的同时明显提升了成本和性能的收益。SelectDB Cloud 具有灵活高效存储的能力,支持 Array, JSONB, Map 等复合数据类型和动态 schema 表。同时,SelectDB Cloud 具有丰富索引结构加速检索分析,也能够实现高效分析和处理。

  • 湖仓一体:SelectDB Cloud 还能对已经建设的离线数仓和数据湖进行联邦查询,在实现高性能的同时,不需要迁移历史数据。SelectDB Cloud 支持便捷的元数据打通,免去了手动创建外表的繁琐,同时能够对热元数据自动 cache,并且能够支持手动和自动刷新;同时,SelectDB Cloud 也支持多种外表的联邦查询 (Hive, Iceberg, Hudi 关系型数据库,ES,以及各种支持 HMS 协议的云数仓)。

>>> 简单易用

SelectDB Cloud 具有简单易用的特性,它能够大幅度降低企业技术团队的学习、使用门槛和开发周期,更加高效的释放数据生产力,助力业务发展和更迭。目前,SelectDB Cloud 是领域中少有支持 MySQL 连接协议的数仓。在如今的事务处理领域,MySQL 已经被各大公司广泛采用,基于此,用户可以使用 MySQL Client、JDBC 和 DBeaver 来连接使用 SelectDB Cloud,这对于用户来说节省了很多学习成本,更易于上手,兼容性也更好;另外,SelecDB Cloud 还通过可视化控制台为开发者和管理者提供了许多常规、高频的功能来支持不同角色对大量的日常管理任务;除此之外,SelectDB Cloud还可以提供丰富易用的数据导入方式:包括 HTTP Load、Stage Load 和帮助周边大数据生态工具进行连接导入的 Connector 插件,这些功能为企业在数据分析全链路过程带来简单易用的体验。

>>> 开源开放

在开源开放方面,基于 Apache Doris 开发的 SelectDB Cloud 实现了多方面的迭代和优化,但也同样传承了开源技术的开放、中立基因。SelectDB 与 Doris 高度兼容,用户可以在 SelectDB Cloud 和 Doris 之间自由、灵活迁移;同时,作为国内首家实现多云中立的云数仓产品,用户可以在国内外主流云上获得一致性的 SelectDB Cloud 使用体验。 在成功牵手阿里云、华为云、腾讯云和 AWS 后,SelectDB 仍在积极的扩大自己的合作生态,不久的将来,用户也将能够通过 Google 和微软的云端享受到 SelectDB 的极致数据分析服务。

>>> 企业特性

SelectDB Cloud 是一款面向企业研发,开箱即用的生产级数据仓库,在企业生产中,对于数据安全的保障十分重要,针对此,SelectDB Cloud 提供一系列相应的企业特性支持, 从而帮助企业安全、稳定地进行复杂的企业数据管理。

SelectDB Cloud 四大解决方案

通过落地赋能企业数字化转型,SelectDB 立足于实际的业务场景视角,将自身产品优势与多种数据分析方向和场景进行融合,正式推出了经过实践验证的四大解决方案,如图所示。

>>> 面向企业内部的现代化数据平台

   现状分析:当前企业普遍使用典型的湖仓并行架构方案,既有面向批量的多个组件、也有面向交互分析的多个组件,甚至不止一个湖一个仓。这样的数据平台解决方案存在的问题主要集中在复杂性高、性价比低、实时性差。

   技术优化:采用了 SelectDB Cloud 的现代化数据平台方案将统一数据仓库和数据湖到单一平台,提供面向企业内部的 BI 报表和 Adhoc 分析,以及批量和增量 ETL 数据处理。它的特点就是以 SelectDB 云数仓为中心:提供三种数据集成方式(ETL、轻量 ELT、联邦查询)将数据接入到 SelectDB;存算分离架构降低资源成本、多计算集群设计实现计算隔离、多云一致保证开放性;单一数仓提供多种分析负载的支持。

   方案收益:

  • 复杂性降低,成本和门槛下降:管理成本下降,数据平台收敛为了一个以云数仓为中心的架构。并且云数仓是一个云服务,不需要客户自己运行和维护;使用者使用的门槛降低了,不需要学习多套系统。

  • 平台的经济性提升,提供了极高的性价比:综合资源成本降低,数据只存一份,存算分离、冷热分层、弹性扩缩容发挥优势;数据链路大大缩短,采用新型 ELT 数据集成和SelectDB 世界领先的性能为平台实时性带来质的提升。

  • 多云可用,与开源系统的数据自由迁移,成为一个开放的系统,客户不用担心自己被锁定。

>>> 面向外部客户的报表与分析

   现状分析:面向客户的报表和分析场景很多,比如面向站长的站点统计报表和分析、面向广告主的广告投放报表和分析平台等,这类场景的应用特点是高并发,低延时;数据流延时低;数据不丢不重;支持数据更新。

   技术优化:高并发方面,采取分区、分桶裁剪,sort key 裁剪,和点查的短路径优化;在查询速度上,采用物化视图,预聚合模型,和向量化的 MPP 查询引擎;另外,支持了 Flink CDC 和高频次小批量导入;支持事务性两阶段导入;基于云的对象存储做数据持久化;同时,使用 repalce if not null,能够以小批量的形式便捷更新数据。

   方案收益:

  • 全面提升:SelectDB Cloud 针对报表场景能够达到上万并发;能够做到毫秒级别响应;针对数据流延时低的诉求,数据可见性最快可以做到秒级别;数据可靠,不丢不重。

  • 基于 SelectDB Cloud 的方案,某用户的广告业务场景,实现了上万 QPS 的高并发,查询延时99分位200ms以内,每天新增数十亿条记录。

>>> 用户画像与行为分析

   现状分析:行为分析场景有三个特点,分别是表结构持续快速变更、分析复杂、查询延迟要求低。而用户画像的场景有两个特点,标签实时更新和快速人群圈选。

   技术优化:针对上游数据源,将数据同步到 SelectDB Cloud 做实时行为分析,冷数据同步到数据湖中做低成本数据存储及挖掘;在存储层,行为数据抽取出标签数据分层存储;在查询层则提供了丰富的分析函数,创建正交位图高性能物化视图,实现精确去重和留存分析等;在数据管理层则实现了维护高性能表结构变更及宽表部分列更新操作的支持。

   方案收益:

  • 可以做到行为分析在3000亿活跃数据的场景下,平均延迟小于10s,P95延迟在20s左右。

  • 用户画像在千亿数据下实现10个标签秒级人群预估和圈选,100个标签10秒级。

>>> 日志存储与分析

   现状分析:日志存储与分析场景特点就是数据写入吞吐量大,还要实时可见;数据量大,还要成本低;交互式查询速度快,且支持半结构化、非结构化文本检索、按时间排序。 

   技术优化:

在写入优化方面,采用了客户端实时小批量写入,服务端内存攒批写入和时序 compaction 机制;从存储成本入手,设计了列式存储、倒排索引、高压缩比算法以及存算分离、冷热分层;同时,检索优化则采用了倒排索引快速精准定位到匹配的行,时间排序的时序存储模型和动态剪枝的 TopN 算法。

   方案收益:

  • 相比传统的方案,SelectDB Cloud 能够达到4.2倍写入性能提升,仅占用1/5的磁盘空间,便达到2.3倍的查询性能提升

携手共赴星辰大海

“SelectDB Partners” 合作计划发布

在云原生时代势不可挡的今天,SelectDB 希望能够像“星星之火”一样,通过和生态内的伙伴携手并进,落地覆盖至更多企业、行业的业务场景,为企业的数字化转型之路提供“可以燎原”的势能。基于此,SelectDB 在发布会上正式发布了 “SelectDB Partners" 合作伙伴计划,对解决方案合作伙伴、服务合作伙伴和销售合作伙伴这三大类伙伴进行招募,以此共谋创新成长之路。

秉持着“开放共赢”的合作理念,SelectDB 也为合作伙伴制定了一系列针对技术合作、市场合作、销售合作的相关权益,希望通过专业的培训与支持、技术方案共创、品牌活动与产品推广支持、商机共享等覆盖市场开拓多链路的助力,帮助每一位 SelectDB Partner 更好地发展。

虽然仅成立一年,但 SelectDB 在迅速发展之下,已经得到领域内各行各业优秀伙伴的认可,并且与他们开启了战略合作,目前,SelectDB 已陆续开始与合作伙伴们共建数据中台、BI应用等平台级解决方案,并开展了互联网、金融、政府、制造等行业级的解决方案构建。

为数而生,因云而新,未来一路同行!SelectDB 产品发布会众多精彩纷呈的内容,请点击阅读原文查看完整发布会!

如果您对 SelectDB Cloud 产品或技术感兴趣并想获得更多的了解,请通过下方的“SelectDB 产品咨询与体验” 来与我们取得联系;同时,我们也欢迎生态内的合作伙伴前来垂询,与我们一起打造新一代的数据分析方案与服务!

SelectDB 产品咨询及体验

如果您对 SelectDB 有相关问题,请将您的需求告诉我们,SelectDB 专业人员将为您进行 「1对1 专属服务」。同时,您还可以获得 SelectDB 商业产品「免费使用」体验。

扫描下方二维码,开启您的 SelectDB 云上之旅

关于我们 

SelectDB,即北京飞轮数据科技有限公司,是一家专注于开源技术创新的云原生实时数据仓库厂商,成立于2022年1月,公司总部位于北京。2022年4月,SelectDB 完成天使轮和天使+轮融资,由 IDG 资本、红杉中国等顶级 VC 投资,融资金额超3亿元人民币。SelectDB 创始团队由原百度智能云初创人员和 Apache Doris 项目核心成员组成,在云计算、大数据、人工智能方面具有丰富经验。作为依托于开源技术的科技创新公司,SelectDB 将开源作为长期核心战略,不断更新迭代开源版本与企业级商业版本。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/72504.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

蜂鸟E203学习笔记(五)——执行

1.1 执行概述 1.1.1 指令译码 指令所包含的信息编码在有限长度的指令字中,信息如下: 指令所需要读取的操作数寄存器索引指令需要写回的寄存器索引指令的其他信息如指令类型、指令的操作信息等 顺便注意:并非所有的处理器流水线都会在译码…

MySQL进阶篇(二) - 索引

一、索引概述(P66) 1. 介绍 索引(index)是帮助 MySQL 高效获取数据的数据结构(有序)。 在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用&…

浅析Python中的struct模块

最近在学习python网络编程这一块,在写简单的socket通信代码时,遇到了struct这个模块的使用,当时不太清楚这到底有和作用,后来查阅了相关资料大概了解了,在这里做一下简单的总结。 了解c语言的人,一定会知道…

同花顺Python量化交易接口有什么功能?

为了进一步满足私募机构“本地化交易接口”的诉求,“同花顺Python量化交易接口”就出现了,目前仅支持同花顺模拟资金账户,您可以在本地对模拟资金账户进行下单、撤单、资产查询、委托查询等操作!那么同花顺Python量化交易接口可以…

如何实现随机生成坐标点,并且使每个坐标点之间的距离大于某个距离?(用于散点图的绘制,进行数据的处理)

背景: 最近需要开发一个新需求,需要绘制一个随机生成数字的散点图,要求点与点的距离要大于某个特定值。 解决思路: 通过循环获取每个坐标点,每获取一个新的坐标点,都要与之前生成的坐标点进行对比&#…

为你揭秘保健品平台利用“消费全返”,半年净赚过百万背后的原因

​大家好,我是每天分享电商模式咨询的林工,最近林工了解到某一家保健品企业,利用做会员招商活动一招“消费全返”的商业模式,在短短半年内裂变近数十万会员,净挣过百万营业额,这个模式值得各行各业的企业家…

Python实战案例,tkinter+random模块,实现课堂随机抽选提问并语音播报学生姓名

前言 今天给大家介绍Python实现课堂随机抽选提问并语音播报学生姓名实战案例,废话不多说直接开整~ 开发工具 Python版本: 3.8 相关模块: tkinter模块 time模块 random模块 环境搭建 安装Python并添加到环境变量,pip安装需…

计算机毕业设计ssm+vue基本微信小程序的琴房管理系统 uniapp 小程序

项目介绍 随着互联网技术的发发展,计算机技术广泛应用在人们的生活中,逐渐成为日常工作、生活不可或缺的工具,钢琴培训企业各种管理系统层出不穷,为钢琴培训企业琴房管理开发必要的系统,能够有效的提升管理效率。一直以来,钢琴培训企业琴房预约一直没有进行系统化的管理,学生无…

sharing-jdbc-1-5.x版本应用

1总结 2:详解 运行模式 :: ShardingSphere 用户手册,开发手册。这俩比较重要 spring.shardingsphere.mode.type 默认内存模式 3官网案例 不同的依赖坐标,配置方式不一样。按照官网的配置来一步一步配置。 4 整合springboot方式 行表达式 :…

【JS】postMessage 用法(可以给iframe传值)

文章目录基本概念代码案例基本概念 跨文档消息,有时候也简称为XDM(cross-document messaging) 是一种在不同执行上下文(如不同源的页面)间传递信息的能力。例如:www.wrox.com上的页面想要与包含在内嵌窗格中的p2p.wrox.com上面的页…

第一个Spring Boot程序

⭐️前言⭐️ 本文主要介绍Spring Boot项目的创建流程,及Spring Boot项目目录的一些注意事项。 🍉博客主页: 🍁【如风暖阳】🍁 🍉精品Java专栏【JavaEE进阶】、【JavaEE初阶】、【MySQL】、【数据结构】 &…

JAVA SCRIPT设计模式--行为型--设计模式之Command命令模式(14)

JAVA SCRIPT设计模式是本人根据GOF的设计模式写的博客记录。使用JAVA SCRIPT语言来实现主体功能,所以不可能像C,JAVA等面向对象语言一样严谨,大部分程序都附上了JAVA SCRIPT代码,代码只是实现了设计模式的主体功能,不代…

服务器硬件规格常用查看命令——CPU相关命令

使用lscpu 命令可以从sysfs和/proc/cpuinfo中收集CPU体系结构信息,并解析优化为易阅读的格式。该信息包括:CPU的线程、核心、套接字数量和非一致内存访问(NUMA)节点的数量,以及CPU缓存、共享缓存、系列、型号等信息。 …

英文写作—Grammarly安装及下载

Grammarly是一款在线语法纠正和校对工具,支持Windows、Mac、iOS和Android等多个平台。 主要功能包括检查单词拼写、纠正标点符号、修正语法错误、调整语气以及给出风格建议等;对学术写作来说,Grammarly还可以帮助查重。 登陆界面&#xff1a…

每日一题:折半查找法,二分查找法

每日一题:折半查找法,二分查找法每日一题:折半查找法,二分查找法二分查找法定义:代码1:代码2:每日一题:折半查找法,二分查找法 ​ 💖💖个人博客:比…

SpringBoot之自定义注解

目录 1.java注解简介 1.1.java注解分类 1.1.1.JDK基本注解 1.1.2.JDK元注解 1.1.3.自定义注解 1.1.4 在这里如何自定义注解? 2、自定义注解 3.Aop应用自定义注解 1.java注解简介 Java注解是附加在代码中的一些元信息,用于一些工具在编译、运行时进行解…

可靠性udp传输大文件

高级计算机网络大作业-可靠性udp传输大文件实验数据zstd压缩1G文件(延迟100ms、丢包1%)0.1G文件(延迟100ms、丢包1%)0.01G文件(延迟100ms、丢包1%)多线程lzma压缩1G文件(延迟100ms、丢包1%&…

N子棋(外加双人对战)详解!推荐!!!

文章目录准备工作创建菜单进入游戏初始化棋盘、打印棋盘玩家下棋、电脑下棋、生成随机数判断输赢大家好!时隔多天,我终于写博客了,真的是开心!这一次带来的是N子棋有双人对战和单人下棋,请认真看下去,我会竭…

虚拟人纷纷「出道」,社交泛娱乐场景如何迎接新顶流?

⬆️“政企数智办公行业研究报告及融云新品发布会”明天直播! 本月 12 日,花房集团即将于香港上市。关注【融云全球互联网通信云】回复【融云】抽取高颜值大容量高端可乐保温杯哦~ 中国政企数智办公平台 在带货直播平台的赫赫之名下,娱乐直播…

Git —— 那些在工作中日常使用的操作

Git —— 那些在工作中日常使用的操作 《工欲善其事,必先利其器》—— 既然点进来了,麻烦你看下去,希望你有不一样的收获~ 一、同一项目关联不同平台的远程仓库 格式:git remote add 命名 仓库链接 git remote add github ssh:/…