Databend 开源周报 第 98 期

news2025/2/22 4:13:49

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

后台服务

Databend 的内置存储引擎 FuseTable 是一种与 Apache Iceberg 类似的日志结构表,需要定期执行表压缩、重聚类和清理以合并小数据块。小数据块合并的过程会涉及按聚类键排序数据或清理不需要的分支等阶段。

先前的实现需要使用不同的驱动,增加了基础设施的复杂性。而且必须部署和维护其他服务来触发驱动事件。为简化这一过程,我们实现了一个后台服务,允许 Databend 执行后台单次作业或以守护进程模式运行 cron 作业。这些作业可以根据条件触发自动压缩/清理/重新聚类等表维护任务,而无需其他服务介入。

此实现包括:

  1. 完整的 metasrv 模式定义,以及后台作业与后台任务的设计实现。
  2. 用于在元服务上更新和维护后台作业与后台任务状态的 API 。
  3. 支持 one_shotintervalcron 等不同作业类型的作业调度器实现。

后台服务 需要升级至 企业版 。如需了解升级信息,请联系 Databend 团队 。

如果你想要了解更多信息,请查看下面列出的资源。

  • PR | feat: implement Background service for databend

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

IceLake - Iceberg 的纯 Rust 实现

Iceberg 是为分析数据集设计的开放表格式标准。然而,目前 Rust 生态中缺乏成熟的 Iceberg 绑定,使其难以与像 Databend 这样的数据库系统集成。

IceLake 旨在填补这一空白,其致力于建立一个开放生态系统:

  • 用户可以从 任何 存储服务(如 s3、gcs、azblob、hdfs 等)读写 Iceberg 表。
  • 任何 数据库都可以集成 icelake,以支持读写 Iceberg 表。
  • 提供原生的 arrow 格式互转换的能力。
  • 提供多种语言绑定,使其他语言可以享有 Rust 核心带来的 Iceberg 生态支持。

如果你想要了解更多信息,请查看下面列出的资源。

  • GitHub - icelake-io/icelake
  • PR | feat: Integrate with icelake for iceberg support

亮点

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 新增对 MERGE JOIN 的支持。
  • 为 CSV 格式实现列位置支持。
  • 阅读 Docs | Computed Columns 以了解如何使用计算列,以及在选择使用何种类型计算列时的一些考量。
  • 阅读 Docs | Subquery-Based Deletions 以理解如何使用子查询和比较运算实现删除。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

COPY INTO 支持 VALIDATION_MODE

我们希望为 Databend 的 COPY INTO 语句支持 VALIDATION_MODE ,以验证需要载入的数据,并根据验证选项返回结果。

  • RETURN_ERRORS: 此模式验证数据并返回所有错误。
  • RETURN_<number>_ROWS: 此模式验证 <number> 行数据。如果没有错误,就返回数据载入后应当产生的信息。否则,报告对应的错误信息。

Issue #11582 | Feature: copy support VALIDATION_MODE

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 Add function to infer schema from files(CSV/Parquet) · Issue #6345 · datafuselabs/databend · GitHub 来挑选一个随机问题,祝好运!

New Contributors

一起认识社区中的新伙伴,Databend 因你们而变得更加美好。

  • @jonahgao 修复逻辑测试中 MySQLClient 的列类型,#11718 。
  • @akoshchiy 更新 MACOSX_DEPLOYMENT_TARGET 值以满足 z3-sys 的需要,#11783 。

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:Releases · datafuselabs/databend · GitHub

Contributors

非常感谢贡献者们在本周的卓越工作。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/666097.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

强化学习从基础到进阶-案例与实践[2]:马尔科夫决策、贝尔曼方程、动态规划、策略价值迭代

【强化学习原理项目专栏】必看系列&#xff1a;单智能体、多智能体算法原理项目实战、相关技巧&#xff08;调参、画图等、趣味项目实现、学术应用项目实现 专栏详细介绍&#xff1a;【强化学习原理项目专栏】必看系列&#xff1a;单智能体、多智能体算法原理项目实战、相关技巧…

zerotier自建planet

ZeroTier 是一个由 C 开发的软交换机&#xff0c;可以让多台内网机器组成一个私有的局域网。ZeroTier 的节点分为三类&#xff1a; Planet Server: 官方的根服务器&#xff0c;用于记录和配置每个局域网下客户端信息&#xff08;以下简称 Planet&#xff09;&#xff1b;Moon …

Qt学习10:MainWindow浅析

文章目录 QMainWindow的基本结构QMenuBarQToolBarQStatusBarQDockWidget QSystemTrayIcon 文章首发于我的个人博客&#xff1a;欢迎大佬们来逛逛 QMainWindow的基本结构 QMenuBar&#xff1a;菜单栏QToolBar&#xff1a;工具栏QDockWidget&#xff1a;浮动窗口QStatusBar&…

基于ENVI的遥感影像解译——以Landsat8数据为例(上)

遥感影像解译是一种指从图像获取信息的基本过程。即根据各专业&#xff08;部门&#xff09;的要求&#xff0c;运用解译标志和实践经验与知识&#xff0c;从遥感影像上识别目标&#xff0c;定性、定量地提取出目标的分布、结构、功能等有关信息&#xff0c;并把它们表示在地理…

火力全开,鏖战争锋|SCTF 2023圆满落幕!

2023年6月19日09:00&#xff0c;第八届XCTF国际联赛分站赛——SCTF 2023圆满落幕。本次赛事由XCTF国际联赛合作单位——成都信息工程大学Syclover战队组织&#xff0c;由赛宁网安提供技术支持。 经过持续48小时的夺旗厮杀&#xff0c;联合战队Nu1L最终力压群雄&#xff0c;夺得…

什么是mAP(mean average Precision)

Mean Average Precision&#xff0c;即 平均AP值 。AP&#xff08;Average precision&#xff09;单类标签平均&#xff08;各个召回率中最大精确率的平均数&#xff09;的精确率。AP: PR&#xff08; Precision-Recall&#xff09;曲线下面积&#xff0c;mAP(Mean Average Pre…

树莓派启用无密码 sudo

启用无密码 sudo&#xff0c;可以在不提供密码的情况下在树莓派上运行程序。 登录 Raspberry Pi 命令行界面。假设 Raspberry Pi 的默认用户名和密码分别为 pi 和 raspberry。在命令行界面中&#xff0c;键入以下命令&#xff1a; sudo nano /etc/sudoers 3. 通过添加以下行启…

被业务员缠着要数据,数据分析师除了加班还有第二种选择吗?

知乎的大数据给我推了这样一个问题&#xff1a;身为数据分析师&#xff0c;却被业务当做取数机&#xff1f; 热度很高&#xff0c;看来很多数据分析师有相似的处境。 作为一个数据分析师&#xff0c;大部分时间却忙于取数&#xff0c;即使996加班也忙不完&#xff0c;不仅没…

Word怎么删除空白页,4个方法轻松解决!

案例&#xff1a;我在编辑文档的时候会遇到空白页&#xff0c;我不能直接对它进行删除操作。我想知道如何删除Word里面的空白页&#xff1f;方法越简单越好&#xff01; Word是广泛使用的办公软件之一&#xff0c;但有时在编辑文档时会遇到一些空白页的问题。空白页的存在可能…

阿里云学生验证流程(申请入口、学生认证图文教程)

阿里云学生用户完成学生认证可以领取一台阿里云服务器&#xff0c;那么问题来了&#xff0c;阿里云学生验证申请入口​在哪&#xff1f;阿里云百科分享阿里云学生验证入口网页链接及学生认证全流程&#xff1a; 目录 阿里云学生验证入口及申请流程 打开学生验证申请入口 支…

BUG越改越多?微信团队用自动化测试化险为夷

&#x1f449;腾小云导读 作为后台开发 Coder&#xff0c;你可能会对以下场景感到似曾相识&#xff1a;历史上处理过的 BUG 反复横跳&#xff1b;版本兼容逻辑多&#xff0c;修复一个 BUG 触发了更多 BUG&#xff1b;上线时系统监控毫无异常&#xff0c;过段时间用户投诉某个页…

关于iOS16 以后屏幕旋转不得不说的事

由于笔者最近刚完成了一个强制屏幕横屏的需求 所以 顺便记录一下 实现过程中遇到 block点 也为广大的iOS开发者做一个笔记&#xff1a; 废话不多说直接上代码 //适配iOS16.0的横竖屏方法public static func switchInterfaceWtihIos16(orientation: UIInterfaceOrientation , o…

墨水屏服务更新及测试

一、更新墨水屏服务 ①删除tomcat/webapps/esls_new 缓存目录 ②替换新的esls_new.war ③重启tomcat,等待war包解压完成 ④修改数据库配置applicationContext-common.xml和回调接口配置urlConfig.properties ⑤重启tomcat 重启tomcat&#xff1a; tomcat/bin/shutdown.s…

我们还需要 SRE 吗?

在 「一文讲透研发&#xff0c;SRE&#xff0c;运维&#xff0c;DevOps 的区别」里&#xff0c;我们讲了几大工种的区别&#xff0c;这篇我们重点讲一下 SRE (Site Reliability Engineering)。 SRE 的兴起 SRE 最早起源于 2003&#xff0c;由 Google 提出。SRE 既是一种理念&a…

Linux Vim三种工作模式(命令模式、输入模式和编辑模式)详解

Linux 系统中所有的内容都以文件的形式进行存储&#xff0c;当在命令行下更改文件内容时&#xff0c;常会用到文本编辑器。 我们首选的文本编辑器是 Vim。使用 Vim 编辑文件时&#xff0c;存在 3 种工作模式&#xff0c;分别是命令模式、输入模式和编辑模式&#xff0c;这 3 种…

一文讲透研发,SRE,运维,DevOps 的区别

研发&#xff0c;SRE &#xff0c;运维是工种&#xff0c;而 DevOps 是体系。如果拿足球来打比方&#xff0c;研发&#xff0c;SRE &#xff0c;运维对应的就是前锋&#xff0c;中场&#xff0c;后卫这样的位置&#xff0c;而 DevOps 则是诸如 4-3-3 这样的阵型。 研发 也叫研…

聊聊如何独立使用ribbon实现业务客户端负载均衡

前言 ribbon是Netflix开源的客户端负载均衡工具&#xff0c;ribbon实现一系列的负载均衡算法&#xff0c;通过这些负载均衡算法去查找相应的服务。ribbon被大家所熟知&#xff0c;可能是来源于spring cloud&#xff0c;今天就来聊聊如何单独使用ribbon来实现业务客户端负载均衡…

我心中的编程语言之王:Python

我心中的编程语言之王&#xff1a;Python 在当今日益发展的信息技术领域&#xff0c;编程语言的地位愈发重要。它们是构建现代软件和应用的基石&#xff0c;也是实现科技进步的关键工具。在众多编程语言中&#xff0c;Python 以其简单、易用、高效等诸多优点&#xff0c;成为了…

Dubbo架构分层总结

进来闲来无事看了些有关dubbo源码的书籍和《极客时间》何辉老师的课程&#xff0c;由于知识点比较碎&#xff0c;遂以笔记的方式纪录&#xff0c;毕竟好记性不如烂笔头&#xff0c;也希望对感情趣的同学提供点帮助 假设你是个新手开发者&#xff0c;可能只是简单使用过dubbo框…

数字孪生世界建设核心能力:数据治理能力

随着世界经济由工业经济向数字经济转型&#xff0c;数据逐步成为关键的生产要素&#xff0c;企业开始将数据作为一种战略资产进行管理。数据从业务中产生&#xff0c;在IT系统中承载&#xff0c;要对数据进行有效治理&#xff0c;需要业务充分参与&#xff0c;IT系统确保遵从&a…