活动回顾|首次 Cloudberry Database Meetup · 北京站成功举办

news2024/9/26 1:15:58

8 月 3 日,由酷克数据 HashData 主办的 Cloudberry Database Meetup 北京站活动圆满结束。本次 Meetup 以“以开源应对 Greenplum 闭源,原厂开发者再聚首”为主题,深入探讨了 Greenplum 闭源所带来的影响,并聚焦于 Cloudberry Database,邀请核心贡献者与大家分享了 Cloudberry Database 的开源孵化历程、发展路线图以及部分关键功能的实现细节。本次 Meetup 吸引了 30 多位开源数据库技术爱好者前来参加,现场朋友们提问不断、互动热烈。

近期 Greenplum 源码归档及走向闭源在圈内讨论火热,原有开源用户面临断档风险。作为 Greenplum 衍生版和开源替代,Cloudberry Database 由原厂核心开发者打造,与其保持兼容,并且具备更新内核和更丰富功能。Cloudberry Database 逐渐引起大家的关注,当前越来越多的社区用户正在考虑并选型 Cloudberry Database 作为 Greenplum 开源替代。为了加速 Cloudberry Database 开源生态建设,酷克数据 HashData 以线下交流的形式发起主题 Meetup,汇聚各方智慧,凝聚各方力量。

本次活动上,Cloudberry Database 社区负责人王殿进首先分享了 Cloudberry Database 的开源孵化之路。他回顾了 Cloudberry Database 项目自 2022 年 6 月初首个 commit 以来的重要里程碑,包括 2023 年 6 月底项目正式开源以及 Greenplum 闭源事件的影响。王殿进强调,Cloudberry Database 是由前 Greenplum 原厂工程团队倡议发起的项目。酷克数据 HashData 目前拥有全球第二大 Greenplum 内核开发团队,为 Cloudberry Database 长期发展提供了强大开发力量支撑。Cloudberry Database 遵循 Apache License 2.0 协议,确保项目的开放性和商业友好性,整体目标是实现与 Greenplum 的原生兼容和无缝迁移。

52a5ad4be26b11ff01d424fbfa958abc.jpeg王殿进分享 Cloudberry Database 的开源孵化之路

Cloudberry Database 技术负责人杨瑜,全面介绍了 Cloudberry Database 作为新一代开源 MPP 数据库的功能全景与未来路线图。Cloudberry Database 集成了 PostgreSQL 的多样数据类型与复杂查询能力,支持 MPP 架构实现高并发处理,具备行列混合存储、全文检索等先进特性,并承诺持续优化性能与增强安全性。同时,Cloudberry Database 致力于保持与 Greenplum 的原生兼容性,确保无缝迁移,为用户提供了高性能、可扩展且安全的数据库解决方案,以满足日益增长的数据处理需求。

82a71cd90728cb0793d664dc9c290c57.jpeg

杨瑜分享 Cloudberry Database 功能全景与路线图

在关键功能特性分享环节中,Cloudberry Database 研发工程师宋东晓深入剖析了 Cloudberry Database 的向量化计算引擎。他指出,Cloudberry Database 通过向量化处理和并行计算,显著提升了 OLAP 查询性能。通过减少外层循环次数、提高数据局部性和利用 SIMD 指令,Cloudberry Database 大幅降低了 CPU 消耗。同时,Cloudberry Database 向量化引擎还支持灵活地并行执行和向量化 Motion 操作,进一步增强了数据处理能力和响应速度,为用户提供了更高效、更强大的数据分析支持。

bac9affa6958ad4374911c4bb03bfb9a.jpeg宋东晓分享 Cloudberry Database 向量化计算引擎

Cloudberry Database 研发工程师段猛猛分享了 Cloudberry Database 在湖仓一体架构上的实现与应用。他指出,湖仓一体之前,数据分析经历了数据库、数据仓库和数据湖分析三个时代。数据仓库解决了数据快速分析的需求,数据湖解决了数据的存储和管理的需求,而湖仓一体旨在无缝集成两者,促进数据自由流动,使用户能借数据仓库之力解数据湖分析之困,并依托数据湖管理能力提升数据价值。

Cloudberry Database 通过其高效的 OLAP 查询引擎和 MPP 向量化分布式查询层,为湖上数据提供加速分析,并通过通过引入外部数据包装器(FDW)机制,支持多数据源联邦查询和数据整合,构建统一的数据分析平台,满足了企业对多样化数据处理和分析的需求,为构建企业级湖仓一体数据平台提供了强有力的支持。

4b8b3e6ca95cc5e67b98175bbee7de4a.jpeg

段猛猛分享湖仓一体在 Cloudberry Database 上的实现

此外,针对非结构化数据的管理难题,Cloudberry Database 研发工程师张文超分享了管理非结构化数据的 Directory Table 技术的原理与实现。他详细介绍了 Directory Table 作为一种新型表类型,如何支持非结构化数据的存储、查询和管理。通过引入 DFS Tablespace 和 Catalog/Schema 表结构,Directory Table 实现了非结构化数据的高效组织和管理,提供了包括数据导入、查询、删除在内的全面功能。未来,Cloudberry Database 还将进一步优化 Directory Table 技术,实现数据文件的加密/解密、备份等功能。

7c051ae3564b7c25219aa695decd842c.jpeg

张文超分享 Directory Table 的原理与实现

最后在演示环节,Cloudberry Database 研发工程师王晓冉演示了 Cloudberry Database 的 Web 管控台,展示了该管控台在数据库管理、集群监控、SQL 编辑、系统监控以及查询监控等方面的丰富功能。通过 Web 管控台,用户可以方便地进行自动化部署、实时监控集群性能、编辑和执行 SQL 查询、管理数据库表空间和连接,以及监控和分析查询执行情况。这一平台不仅提升了数据库管理的便捷性和效率,还为企业提供了全面的系统监控能力,确保了数据库的稳定运行。

567b08254256f21317f1bd6758906a23.jpeg

王晓冉演示 Cloudberry Database Web 管控台

讲师们的分享内容精彩纷呈,引发了现场开发者的热烈提问和积极互动,技术的交流与思想的碰撞贯穿始终。会后,在交流环节,多位参会者纷纷表达了对 Cloudberry Database 的期待与愿景。其中,一位参会者表示:“Cloudberry Database 不仅有效缓解了我们对 Greenplum 闭源的担忧,更凭借其强大的内核功能,让我们看到了未来数据库发展的新方向。我们计划在产品生态中引入 Cloudberry Database,相信它能为我们提供坚实的数据底座。”更有参会者主动提出愿意成为 Cloudberry Database 的社区贡献者,并表示非常愿意为 Cloudberry Database 社区贡献在数据库领域的经验和技能,与大家携手并进,共同推动社区的进步与发展。

231bfa2bc9e4cc1608b2bfb2a3718c1e.jpeg

参会者现场互动交流

展望未来,Cloudberry Database 将坚定地走开源路线,秉持开放、共享的理念,提升用户使用和开发者开发体验。我们期待与更多的开发者、企业以及社区成员携手合作,共同向世界交付一个优秀的开源数据库项目。同时,我们后续也将在其他城市举办更多的活动,邀请更多技术爱好者共同探索数据库的未来发展之路。让我们一同见证并参与 Cloudberry Database 的成长!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1988942.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

std::list里面的push_back和resize效率问题

2024年8月6日: 向list里面循环添加数据,两种写法 for(;;){myList.resize(myList.size()1);MyObject &obj *myList.rbegin();obj.a itervalue; } 第二种写法是push_back: for(;;){MyObject obj;obj.a itervalue;myList.push_back(obj)…

并发编程CompletableFuture

1. CompletableFuture简介 1.1 异步编程的概念 异步编程是一种编程范式,允许程序在等待某些操作完成时,继续执行其他任务。这在处理I/O密集型任务,如网络请求或文件读写时尤其有用。异步编程可以提高程序的响应性和效率,避免在等…

【docker】docker容器部署常用服务

1、容器部署nginx,并且新增一个页面 docker run -d -p 81:80 --name nginx2 nginx docker exec -it nginx2 /bin/bashcd /usr/share/nginx/html/ echo "hello world">>hello.html2、容器部署redis,成功部署后向redis中添加一条数据 do…

Spoon——数据库clickhouse驱动问题解决

问题 使用Spoon 软件连接clickhouse数据库,报错“Driver class ‘ru.yandex.clickhouse.ClickHouseDriver’ could not be found” 原因 错误消息表明Spoon无法找到ru.yandex.clickhouse.ClickHouseDriver驱动程序。这通常是因为ClickHouse的JDBC驱动程序没有正确…

JS操作dom修改Element中DatePicker的数据

let start document.querySelector(input[placeholder"请选择开始日期"]); start.value 2024-04-25 start.dispatchEvent(new Event(input)) var enterKeyEvent new KeyboardEvent(keydown, { key: Enter, code: Enter, keyCode: 13, // keyCode属性已被废弃&a…

linux 6.10.0 CXL/reg.c 详解

文章目录 前言Ref正文1. cxl_setup_regs2. cxl_probe_regs()3. cxl_probe_component_regs()4. cxl_probe_device_regs()5. cxl_map_device_regs()6. cxl_count_regblock() / cxl_find_regblock_instance() 前言 CXL 是一个比较新的技术,内核版本迭代太快&#xff0…

【秋招笔试】24-07-31-影石insta-秋招笔试题

🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 💻 ACM金牌团队🏅️ | 多次AK大厂笔试 | 编程一对一辅导 ✨ 本系列打算持续跟新 秋招笔试题 👏 感谢大家的订阅➕ 和 喜欢💗 ✨ 笔试合集传送们 -> 🧷春秋招笔试合集 💻 第一题 题目描述 给定一个字符串矩…

Mathtype安装教程/常见使用问题及快捷键大全

一、软件介绍 Mathtype目前来说还是最好用,最兼容的文本公式编辑器!而且MathType已经被普遍应用于教育教学、科研机构、工程学、论文写作、期刊排版、编辑理科试卷等领域。 在目前很多学术期刊中,对文章的文本有一定要求,SCI检索…

k8s—Prometheus原理

一、Prometheus 1.Prometheus介绍 Prometheus 是一个开源的系统监控和报警系统,现在已经加入到 CNCF 基金会,成为继k8s 之后第二个在 CNCF 托管的项目,在 kubernetes 容器管理系统中,通常会搭配prometheus 进行监控,同…

PXE 批量安装Linux系统

目录 一、 实验环境准备 1、一台红帽版本7的主机 2、开启主机图形 3、配置网络可用 4、关闭VMware dhcp 功能 ​编辑​编辑 5、配置好本地仓库,方便后续下载 二、配置kickstart自动安装脚本的工具 1、 安装图形化生成kickstart自动安装脚本的工具 2、启动图…

动手学深度学习7.2 使用块的网络(VGG)-笔记练习(PyTorch)

以下内容为结合李沐老师的课程和教材补充的学习笔记,以及对课后练习的一些思考,自留回顾,也供同学之人交流参考。 本节课程地址:25 使用块的网络 VGG【动手学深度学习v2】_哔哩哔哩_bilibili 本节教材地址:7.2. 使用…

软考-软件设计师 (计算机组成和体系结构习题)

💝💝💝欢迎来到我的博客,很高兴能够在这里和您见面!希望您在这里可以感受到一份轻松愉快的氛围,不仅可以获得有趣的内容和知识,也可以畅所欲言、分享您的想法和见解。 非常期待和您一起在这个小…

如何提前预防网络威胁

一、引言 随着信息技术的迅猛进步,网络安全议题愈发凸显,成为社会各界不可忽视的重大挑战。近年来,一系列网络安全事件的爆发,如同惊雷般震撼着个人、企业及国家的安全防线,揭示了信息安全保护的紧迫性与复杂性。每一…

力扣笔试题(十一)

1、删除链表的中间节点 给你一个链表的头节点 head 。删除 链表的 中间节点 ,并返回修改后的链表的头节点 head 。 长度为 n 链表的中间节点是从头数起第 ⌊n / 2⌋ 个节点(下标从 0 开始),其中 ⌊x⌋ 表示小于或等于 x 的最大整数…

java开发的ai文生图程序。

这个源码支持Web、Android、IOS、H5等多终端应用。它使用ChatGPT模型实现智能聊天机器人,并支持绘图自动生成Vincent图。 支持自动绘画功能。

面试:ArrayList和LinkedList

ArrayList和LinkedList是什么? ArrayList: ArrayList是Java集合框架中的一个类,它实现了List接口,底层基于数组实现。ArrayList的特点是支持动态数组,可以自动扩容,适合顺序访问和随机访问。LinkedList&am…

一行命令搞定内网穿透

一行命令搞定内网穿透 一款开源免费的内网穿透工具:localtunnel ,基于 nodejs 实现,无需修改 DNS 和防火墙设置,方便快捷的将内网服务暴露到外网,为开发人员、测试人员以及需要分享本地项目的人提供实时的公网访问方式…

Qt 快速部署环境(windeployqt.exe)

windeployqt.exe 是 Qt 框架提供的一个工具,主要用于将 Qt 应用程序部署到 Windows 环境中。它自动将所需的所有库、插件和文件复制到应用程序的目录中,以便用户能够直接运行应用程序,而无需额外的配置。 主要功能 自动识别依赖项&#xff…

《Milvus Cloud向量数据库指南》——高可用黄金标准:深入解析与业务策略

在当今这个数字化时代,系统的持续运行与稳定性已成为企业成功的关键因素之一。高可用性(High Availability, HA)作为保障系统稳定运行的重要策略,其重要性不言而喻。虽然高可用并不能承诺100%的无故障运行,但通过一系列精心设计的机制和技术手段,它能够极大地提升系统的可…

【颠覆数据处理的利器】全面解读Apache Flink实时大数据处理的引擎-上篇

什么是 Apache Flink? Apache Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。Flink 被设计为在所有常见的集群环境中运行,以内存速度和任何规模执行计算。 如何理解无界和有界数据? 无界数据&#…