Databend 开源周报 第 97 期

news2025/1/15 19:45:34

Databend 是一款现代云数仓。专为弹性和高效设计,为您的大规模分析需求保驾护航。自由且开源。即刻体验云服务:https://app.databend.cn 。

What's On In Databend

探索 Databend 本周新进展,遇到更贴近你心意的 Databend 。

列位置

Databend 现在支持 $N 这一语法,用来表示列位置,例如:$2 意味着匹配第 2 列。Databend 也支持在 SQL 语句中将列位置和列名结合使用。下面是一个简单的例子:

CREATE TABLE IF NOT EXISTS t1(a int, b varchar);
INSERT INTO t1 values (1, 'a'), (2, 'b');
select $1, $2, a, b from t1;

┌─────────────────────────────────┐
│   $1  │   $2   │   a   │    b   │
│ Int32 │ String │ Int32 │ String │
├───────┼────────┼───────┼────────┤
│     1 │ a      │     1 │ a      │
│     2 │ b      │     2 │ b      │
└─────────────────────────────────┘

我们正在为 SELECT FROM @stage 添加列位置支持。目前,你可以在 NDJSON 格式上尝试这一新特性。其他格式的支持还在进行中。

select $1 from @my_stage

copy into my_table from (select $1 from @my_stage t)

需要注意的是,在 Databend 中使用 SELECT 语句处理 NDJSON 格式文件时,只允许使用 $1 表示整行数据,并且其数据类型为 Variant 。

-- Select the entire row using column position:
SELECT $1 FROM @my_stage

--Select a specific field named "a" using column position:
SELECT $1:a FROM @my_stage

如果你想要了解更多信息,请查看下面列出的资源。

  • Issue | Feature: support $<col_position>
  • Issue | Feature: copy/select from stage by pos
  • PR | feat: support column position like $N
  • PR | feat: select from stage support NDJson

Code Corner

一起来探索 Databend 和周边生态中的代码片段或项目。

了解 Databend 的持续集成工作流 - 拼写检查

Databend 现在有一组非常复杂的持续集成工作流,用于代码审计、测试、benchmark 和发布。拼写检查无疑是其中最简单的部分。

与其他工作流一样,我们使用 actions/checkout 检出代码。

- uses: actions/checkout@v3
  with:
    clean: "true"

typos-cli 是一个用 Rust 编写的拼写检查工具,快速、准确,适用于像 Databend 这样的大型单一代码库,并且非常适用于针对 PR 的检查。

- uses: baptiste0928/cargo-install@v1
  with:
    crate: typos-cli
    args: --locked
    cache-key: typos-check

使用 baptiste0928/cargo-install 可以轻松安装依赖,它几乎和 cargo install 保持一致,只是需要遵循 GitHub actions 的风格。另外,它还提供自动缓存支持,能够加速后续构建。

- name: do typos check with typos-cli
  run: typos

需要注意的是,虽然 crate 的名字是 typos-cli ,但是对应二进制可执行程序的名字是 typos 。

如果你想要了解更多信息,请查看下面列出的资源。

  • Workflows | typos.yml

亮点

以下是一些值得注意的事件,也许您可以找到感兴趣的内容。

  • 支持分布式 Top-N.
  • 默认启用 lazy_topn_threshold ,并设置默认阈值为 1000 。
  • 为保障安全性,root 用户可以变更密码。
  • 阅读 Blog | Databend X Tableau 了解如何使用 Tableau 连接 Databend 进行 BI 数据分析。
  • 阅读 Docs | Integrating Databend as a Sink for Vector 和 Docs | Analyzing Nginx Access Logs with Databend 理解如何集成 Vector 和 Databend 。

What's Up Next

我们始终对前沿技术和创新理念持开放态度,欢迎您加入社区,为 Databend 注入活力。

在 REST API 中添加去重标签字段

为了确保数据摄取是幂等操作,Databend 使用去重标签来支持 DML 的去重。你可以在 Docs | Setting Commands - SET_VAR 中找到关于此功能的更多信息。

为了方便跨语言驱动程序集成,我们可以在 REST API 中添加去重标签字段。

Issue #11710 | Feature: support to bring deduplication label on stage attachment api

如果你对这个主题感兴趣,可以尝试解决其中的部分问题或者参与讨论和 PR review 。或者,你可以点击 https://link.databend.rs/i-m-feeling-lucky 来挑选一个随机问题,祝好运!

Changelog

前往查看 Databend 每日构建的变更日志,以了解开发的最新动态。

地址:https://github.com/datafuselabs/databend/releases

Contributors

非常感谢贡献者们在本周的卓越工作。

Connect With Us

Databend 是一款开源、弹性、低成本,基于对象存储也可以做实时分析的新式数仓。期待您的关注,一起探索云原生数仓解决方案,打造新一代开源 Data Cloud。

  • Databend Website
  • GitHub Discussions
  • Twitter
  • Slack Channel

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/664879.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

MongoDB 数据库管理系统

MongoDB是一个非关系型数据库管理系统&#xff0c;它使用文档模型存储数据。MongoDB中的文档类似于JSON对象&#xff0c;可以包含键值对和嵌套文档。MongoDB提供了强大的查询语言、聚合框架、索引和直接在数据存储中运行的计算。 MongoDB被广泛应用于许多领域&#xff0c;特别…

React 组件生命周期

组件的生命周期可分成三个状态&#xff1a; Mounting(挂载)&#xff1a;已插入真实 DOMUpdating(更新)&#xff1a;正在被重新渲染Unmounting(卸载)&#xff1a;已移出真实 DOM Mounting 挂载阶段 Mounting阶段叫挂载阶段&#xff0c;伴随整个虚拟DOM的声明。它里面有四个小的…

Altium Designer软件点击没有反应?如何解决?

对电子工程师来说&#xff0c;Altium Designer&#xff08;AD&#xff09;是一款功能强大的PCB设计软件&#xff0c;被广泛应用在电子工程领域。然而在使用过程中可能会遇见AD软件点击没有反应的情况&#xff0c;面对这个问题该如何解决&#xff1f;下面来看看吧&#xff01; 1…

公网访问Linux CentOS本地搭建的Web站点

文章目录 前言1. 本地搭建web站点2. 测试局域网访问3. 公开本地web网站3.1 安装cpolar内网穿透3.2 创建http隧道&#xff0c;指向本地80端口3.3 配置后台服务 4. 配置固定二级子域名5. 测试使用固定二级子域名访问本地web站点 转载自cpolar文章&#xff1a;Linux CentOS本地搭建…

videojs-player视频播放技术学习

介绍&#xff1a; videojs是一个开源的HTML5视频播放器&#xff0c;它可以在各种设备和浏览器上播放视频。videojs提供了丰富的API和插件&#xff0c;可以实现自定义的视频播放功能。 使用videojs实现视频播放的步骤&#xff1a; 1. 引入videojs库 在HTML文件中引入videojs库…

chatgpt赋能python:Python打开文件路径:一种更轻松的办法

Python打开文件路径: 一种更轻松的办法 在Python编程中&#xff0c;打开文件路径是非常常见的任务。然而&#xff0c;对于许多初学者&#xff0c;Python打开文件路径时可能会面临一些问题和困难。本篇文章将介绍Python打开文件路径的方法&#xff0c;并给出一种更加轻松的解决…

5-垃圾回收

目录 1.死亡对象的判断算法 1.1.引用计数算法 1.2.可达性分析算法&#xff08;主流&#xff09; PS&#xff1a;强引用、软引用、弱引用、虚引用 2.垃圾回收算法 2.1.标记-清除算法 2.2.复制算法 2.3.标记-整理算法 2.4.分代算法&#xff08;主流&#xff09; PS&…

达梦体系结构

物理结构、逻辑结构、实例&#xff08;内存结构、进程结构&#xff09; 一、物理结构 配置文件、控制文件、数据文件、重做日志文件、归档日志文件、备份文件、跟踪日志文件、事件日志文件 &#xff08;一&#xff09;配置文件 以.ini结尾的文件&#xff0c;例如dm.ini (相…

chatgpt赋能python:Python打包成so文件的方法:详解

Python打包成so文件的方法&#xff1a;详解 Python是一种灵活且易于使用的高级编程语言&#xff0c;由于其强大的效率和易于上手的特性&#xff0c;在最近几年已经迅速地流行起来。Python支持多种开发范式&#xff0c;例如函数式编程、面向对象编程和脚本编程。 Python的这些…

【UCOS-III】自我学习笔记→第20讲→时间片调度

文章目录 前言实验步骤1.复制任务创建和删除工程文件并删除task3任务&#xff0c;修改任务1和任务2的优先级为22.修改任务1和任务2的内容3.查看示波器现象 测试代码工程文件总结 前言 无&#xff0c;仅作记录&#xff0c;不具有参考价值&#xff0c;所用开发板为STM32F411RET6…

chatgpt赋能python:Python如何打开电脑摄像头

Python如何打开电脑摄像头 Python是一种易于学习和使用的编程语言&#xff0c;因其灵活性和强大的功能而备受欢迎。其中&#xff0c;许多人使用Python来处理图像处理和计算机视觉&#xff0c;这样&#xff0c;了解如何打开电脑摄像头是非常重要的。 在这篇文章中&#xff0c;…

【高危】crypto-js<3.2.1 存在不安全的随机性漏洞

漏洞描述 crypto-js 是一个 JavaScript 加密库&#xff0c;用于在浏览器和 Node.js 环境中执行加密和解密操作。 crypto-js 3.2.1 之前版本中的 secureRandom 函数通过将字符串 0. 和三位随机整数拼接的格式生成加密字符串&#xff0c;攻击者可通过爆破破解加密字符。 漏洞…

ASEMI代理光宝LTV-M501光耦的特点和应用领域

编辑-Z LTV-M501光耦是一种常用的光电隔离器件&#xff0c;具有高速、高耐压、低功耗等特点。本文将从四个方面对LTV-M501光耦进行详细阐述&#xff0c;包括其结构和工作原理、特点和优势、应用领域以及市场前景。通过对LTV-M501光耦的全面介绍&#xff0c;帮助读者更好地了解…

chatgpt赋能python:Python扩展库扩展名:了解常见的.py、.pyc、.pyd、.so、.dll

Python扩展库扩展名&#xff1a;了解常见的.py、.pyc、.pyd、.so、.dll 如果你是一位Python开发者&#xff0c;你肯定会用到各种各样的库来简化你的代码。在Python中&#xff0c;一个库也称为模块&#xff0c;使用它需要将相应的扩展库引入你的代码中。但你是否曾想过扩展库扩…

C++基础学习(2)

C基础学习 一、运算符重载1.1 加号运算符的重载1.2 左移运算符的重载1.3 递增运算符的重载1.4 赋值运算符的重载1.5 关系运算符的重载 二、继承2.1 继承的基本用法2.2 继承方式2.3 继承当中的对象模型2.4 继承当中的构造和析构函数的顺序2.5 继承同名成员处理方式2.6继承同名静…

希尔排序—C语言实现

目录 前言 希尔排序 发展历史 基本思想 时间复杂度 &#x1f970;我们以一组数字来说操作说明&#xff1a; gap的选取 动图演示 代码&#xff1a; 总结&#xff1a; 前言 &#x1f970;在学数据结构的第一节课就知道了数据结构课程是要管理并且学会操作数据&#xff0c;…

对应分析——SPSS实例分析

对应分析是R型因子分析和Q型因子分析的结合。本质是将列联表里面的频数数据作变换&#xff08;通过降维的方法&#xff09;以后&#xff0c;利用二维图的方式&#xff0c;简单直观的表示行变量和列变量之间的相关性&#xff0c;适合于多分类型变量的研究。数据展示如下&#xf…

20利用灰色神经网络预测6个月订单需求(附matlab程序)

1.简述 学习目标&#xff1a;灰色神经网络预测订单需求 灰色系统理论是一种研究少数据、贫信息、不确定性问题的新方法&#xff0c;它以部分信息已知&#xff0c;部分信息未知的“小样本”&#xff0c;“贫信息”不确定系统为研究对象&#xff0c;通过对“部分”已知信息的生成…

Web服务器群集:部署LNMP平台

目录 一、理论 1.LNMP平台 2.Nginx服务基础 3.Nginx访问控制 4.Nginx虚拟主机 二、实验 1.LNMP架构DISCUZ论坛应用 三、问题 1.没有规则可以创建“default”需要的目标“build”。 四、总结 一、理论 1.LNMP平台 &#xff08;1&#xff09;概念 LNMP平台是高效稳定的…

LinkedList(1):链表介绍和单向链表的实现

1 链表介绍 链表的分类&#xff1a;单链表&#xff0c;双链表&#xff0c;循环链表 链表&#xff1a;由链将一个个元素连接&#xff0c;每一个元素我们通常将其称之为Node 节点Node 节点&#xff1a;由两部分组成 数据值的变量 Node next 用来存放下一个节点的Node 对象 pack…