clickhouse 中的数组(array)和元组(Tuple)—— clickhouse 基础篇(二)

news2024/12/27 13:10:31

文章目录

  • 数组
    • 判断是否为空
    • 计算数组长度
    • 获取数组元素
    • 判断某个元素是否存在
    • 数组切片
    • 数组元素展开
    • 数组元素去重
    • 删除连续重复元素
    • 连接多个数组
    • 数组倒序
    • 数组拍平
    • 数组元素映射
    • 数组元素过滤
    • 数组聚合分析
    • 计算数组交集
    • 计算数组并集
    • 计算数组差集
    • SQL 子查询进行集合操作
  • 元组
    • 创建元组
    • 获取元组中的元素
    • 插入元组元素

数组

数组中的数据类型

  • 数组中的每一个元素都是同一种数据,在一个数组中创建使用不同数据类型,会报错。
  • 当数组中的元素都不为空时,数组类型就是不可空的。
  • 如果数组中元素有一个NULL(空值),类型会相应地变成可空元素类型。

判断是否为空

SELECT
  empty([]) AS isEmpty,
  empty([1]) AS notEmpty
FORMAT Vertical

# 输出
isEmpty: 1
notEmpty: 0

计算数组长度

SELECT
  length([1,2,3]) AS a1,
  length([]) AS a2,
  length(NULL) AS a3
FORMAT Vertical

# 输出
a1: 3
a2: 0
a3: NULL

获取数组元素

clickhouse 数组元素通过索引访问,索引从1开始。
image.png

判断某个元素是否存在

SELECT has([1,2,3], 1) AS hasIt

###############
┌─hasIt─┐
│     1 │
└───────┘

数组切片

参数说明:

  • 数组
  • 偏移量,正数从左边开始,负数从右边开始,需要注意clickhouse 索引下标从1开始
  • 数组长度
SELECT
  arraySlice([10, 20, 30, 40, 50], 1, 2) AS res1,
  arraySlice([10, 20, 30, 40, 50], 1) AS res2
FORMAT Vertical

################
res1: [10,20]
res2: [10,20,30,40,50]

数组元素展开

将数组中的元素展开至多行

SELECT arrayJoin([1,2,3])

###############
┌─arrayJoin([1, 2, 3])─┐
│                    1 │
│                    2 │
│                    3 │
└──────────────────────┘

数组元素去重

SELECT arrayDistinct([1,1,nan,nan,2,3,3,3,NULL,NULL,3,4,5,6,6,6]) as c
FORMAT Vertical

#######################
c: [1,nan,2,3,4,5,6]

删除连续重复元素

SELECT arrayCompact([1,1,nan,nan,2,3,3,3,NULL,NULL,3,4,5,6,6,6]) AS c
FORMAT Vertical

####################
c: [1,nan,2,3,NULL,3,4,5,6]

连接多个数组

SELECT arrayConcat([1,2], [3,4], [5,6,3,4]) as res

#######################
┌─res───────────────┐
│ [1,2,3,4,5,6,3,4] │
└───────────────────┘

数组倒序

SELECT arrayReverse([1,2,3]) as res

################
┌─res─────┐
│ [3,2,1] │
└─────────┘

数组拍平

SELECT 
  arrayFlatten([[[1]], [[2], [3,4,5]]] AS src) AS flatArr, src
FORMAT Vertical

######################
flatArr: [1,2,3,4,5]
src:     [[[1]],[[2],[3,4,5]]]

数组元素映射

SELECT arrayMap(x -> (x*x), [1,2,3]) AS res
FORMAT Vertical

#####################
res: [1,4,9]

数组元素过滤

SELECT arrayFilter(x -> ((x%2) = 0), [1,2,3,4,5,6]) AS res
FORMAT Vertical

#############
res: [2,4,6]

数组聚合分析

将数组中的元素放入聚合函数执行,并返回结果,需要注意函数参数使用单引号

SELECT arrayReduce('max', [1,2,3,3,4,4]) as res

##################
┌─res─┐
│   4 │
└─────┘

SELECT arrayReduce('sum', [1,2,3,3,4,4]) as res

#############
┌─res─┐
│  17 │
└─────┘

计算数组交集

SELECT arrayIntersect([1,2,3,3], [4,5,6]) AS noIntersect,
       arrayIntersect([1,2,3,3], [3,4,5,6]) AS hasIntersect
FORMAT Vertical

##################
noIntersect:  []
hasIntersect: [3]

计算数组并集

SELECT 
  [1,2] AS a,
  [2,3] AS b,
  arrayDistinct(arrayConcat(a,b)) AS res
FORMAT Vertical

##################
a:   [1,2]
b:   [2,3]
res: [1,2,3]

计算数组差集

需要结合 arrayIntersect 和 arrayMap 和 arrayFilter 组合实现。

SELECT 
  [1,2] AS a,
  [2,3] AS b,
  arrayFilter(x -> (x IS NOT NULL), arrayMap(x -> multiIf(x NOT IN arrayIntersect(a,b), x, NULL), a)) AS res
FORMAT Vertical

##################
a:   [1,2]
b:   [2,3]
res: [1]

SQL 子查询进行集合操作

交集SQL

SELECT a.i
FROM
(
  SELECT arrayJoin([1,2]) AS i
) AS a
INTERSECT
SELECT b.i
FROM
(
  SELECT arrayJoin([2,3]) AS i
) AS b

####################
┌─i─┐
│ 2 │
└───┘

并集 SQL

SET union_default_mode = 'ALL';

SELECT DISTINCT t.i
FROM
(
  SELECT a.i
  FROM
  (
    SELECT arrayJoin([1,2]) AS i
  ) AS a
  UNION
  SELECT b.i
  FROM 
  (
    SELECT arrayJoin([2,3]) AS i
  )AS b
) AS t

########################
┌─i─┐
│ 2 │
│ 3 │
└───┘
┌─i─┐
│ 1 │
└───┘

差集 SQL

SELECT a.i
FROM
(
  SELECT arrayJoin([1,2]) AS i
) AS a
EXCEPT
SELECT b.i
FROM
(
  SELECT arrayJoin([2,3]) AS i
) AS b

########################
┌─i─┐
│ 1 │
└───┘

元组

元组中的数据类型说明

  • 不同于数组中的每个元素类型要一样,元组中的元素类型可以不一样
  • 元组一般表示列的聚合,SQL 中的 in 查询也是使用的元组
  • 在 clickhouse 中元组也可以作为查询的结果

创建元组

SELECT tuple(1, 'a', NULL) AS x, toTypeName(x) as tp FORMAT Vertical;

SELECT (1, 'a', NULL) AS x, toTypeName(x) as tp FORMAT Vertical;

获取元组中的元素

元组和数组一样,元素索引都是从1开始。

select (1, 'a', 3, 4) as tp1, tupleElement(tp1, 2) as t2 Format Vertical;
# 等价于
select (1, 'a', 3, 4) as tp1, tp1.2 as t2 Format Vertical;

################
tp1: (1,'a',3,4)
t2:  a

获取元组中的每个元素:

select (1, 'a', 3, 4) as tp1, untuple(tp1) as t2 Format Vertical;

#####################
tp1:  (1,'a',3,4)
t2.1: 1
t2.2: a
t2.3: 3
t2.4: 4

插入元组元素

CREATE TABLE t1
(
  `a` Date,
  `b` UInt8,
  `c` Tuple(UInt8, String)
)
Engine = MergeTree(a, b, 8192);

insert into t1(a, b, c) values(now(), 1, (1, 'a'));

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1684574.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

我的心情JSP+Servlet+JDBC+MySQL

系统概述 本系统采用JSPServletJDBCMySQL技术进行开发,包括查看我的心情列表, 编辑我的心情信息、新增我的心情。使用方法 将项目从idea中导入,然后配置项目的结构,包括jdk,库,模块,项目,工件…

【NumPy】关于numpy.arange()函数,看这一篇文章就够了

🧑 博主简介:阿里巴巴嵌入式技术专家,深耕嵌入式人工智能领域,具备多年的嵌入式硬件产品研发管理经验。 📒 博客介绍:分享嵌入式开发领域的相关知识、经验、思考和感悟,欢迎关注。提供嵌入式方向…

Autodesk Maya 2025软件安装教程(附软件下载地址)

软件简介: 软件【下载地址】获取方式见文末。注:推荐使用,更贴合此安装方法! Autodesk Maya 2025是一款领先的三维动画设计软件,界面直观且功能丰富。它集成了全球领先的3D设计技术,提供了多种创意功能&a…

【安装配置】WSL虚拟机导出、导入镜像(涉及到docker无法在wsl下使用的问题)

背景 WSL(Windows Subsystem Linux),是微软提供的在Windows下便携地使用Linux系统的方式,它支持使用虚拟化技术(也就是要在bios和控制面板中开启虚拟化支持),完美支持Ubuntu和Windows文件系统之…

【Linux取经路】线程安全和死锁

文章目录 一、线程安全1.1 常见的线程不安全情况1.2 常见的线程安全情况1.3 常见的不可重入情况1.4 常见可重入的情况1.5 可重入与线程安全的联系1.6 可重入与线程安全的区别 二、死锁2.1 死锁的四个必要条件2.2 如何避免产生死锁? 三、结语 一、线程安全 线程安全&…

Qt快速入门到熟练(电子相册项目(一))

经过一段时间的学习,相信大家对QT的基本用法都有所了解,从这篇文章开始,我准备记录一下电子相册的项目的一个学习过程。 实现项目创建功能 对于这个电子相册的项目,我并没有在一开始就把所有可能用到的功能模块去事无巨细的考虑周…

mysql数据库主从复制,搭建从库

1 期望效果 假设我们现在有两个服务器,两个服务器都有数据库,然后我们命名一个叫主数据库(Master),一个叫从数据库(Slave) 数据备份和容灾:通过主从复制,可以将主数据库…

【运维心得】双WAN配置的一个误区

目录 双WAN配置及优势 实际案例 解决之道 最后总结 双WAN配置及优势 什么是双WAN配置,这里就不多赘述,简单的说,首先你要有一台支持双WAN口的路由器,目前大多数企业级路由器都具备了这个功能。甚至有些家用路由器也有此类功能…

.gitignore配置以及解决文件不生效

.gitignore配置 新建.gitignore文件 文件内容如下: ###################################################################### # Build Tools.gradle /build/ !gradle/wrapper/gradle-wrapper.jarnbsdk/ logs/target/ !.mvn/wrapper/maven-wrapper.jar##########…

notepad++ 批量转所有文件编码格式为UTF-8

1、安装notepad及PythonScript_3.0.18.0插件 建议两者都保持默认路径安装x64版本: 阿里云盘分享https://www.alipan.com/s/xVUDpY8v5QL安装好后如下图: 2、new Script,新建脚本,文件名为ConvertEncoding 3、自动打开脚本&#xff…

Acrobat Pro DC 2024 Mac软件安装包下载PDF2024 Mac安装教程

安装 步骤 1,双击打开下载好的安装包。 2,选择acrobat dc installer.pkg双击启动安装程序。 3,点击继续。 4,点击继续。 5,点击继续。 6,点击安装。 7,输入电脑密码。 8,软件安装中…

Web Speech API(1)—— SpeechRecognition

Web Speech API 使你能够将语音数据合并到 Web 应用程序中。Web Speech API 有两个部分:SpeechSynthesis 语音合成(文本到语音 TTS)和 SpeechRecognition 语音识别(异步语音识别)。 SpeechRecognition 语音识别通过 S…

由于找不到mfc140u.dll,无法继续执行代码如何解决

在计算机使用过程中,我们经常会遇到一些错误提示,其中之一就是电脑找不到mfc140u.dll文件。这个问题可能会导致程序无法正常运行或系统崩溃。为了解决这个问题,本文将介绍5种修复方法,帮助大家快速恢复电脑的正常运行。 一&#x…

SD-WAN EVPN基本原理

SD-WAN EVPN是一种用于Overlay业务网络和底层传输网络分离以及业务网络路由和传输网络路由分离的VPN技术。SD-WAN EVPN技术采用类似于BGP/MPLS IP VPN的机制,通过扩展BGP协议,使用扩展后的可达性信息,使不同站点的底层传输网络互通&#xff0…

rocketmq 学习二 基本概念

教程:基本概念 | RocketMQ 视频教程 https://www.bilibili.com/video/BV1d5411y7UW?vd_sourcef1bd3b5218c30adf0a002c8c937e0a27 版本:5.0 一 基本概念 1.1 生产者/Producer 1.1.1 定义 消息发布者。是构建并传输消息到服务端的运行实体。…

php之web开发

目标 实现一款具有常用大部分功能的WEB应用&#xff0c;并初步了解WEB漏洞原理 登录功能&#xff1a; 1、基于前端的登录功能 <!DOCTYPE html> <html> <head> <title>简单登录功能</title> </head> <meta charset"UTF-8"…

yaml文件格式详解 及 k8s实战演示

目录 一 k8s 支持的语言格式 1&#xff0c;YAML 语法格式 2&#xff0c;查看 api 资源版本标签 二 k8s 运行nginx pod实例 yaml文件 具体讲解 1&#xff0c;写一个yaml文件demo 2&#xff0c;deployment 管理nginx 的yaml 文件 3&#xff0c;创建资源对象 4&#…

BGP(一)边界网关协议

BGP协议基础 路由分类 直连路由 非直连路由&#xff08;间接路由&#xff09; 静态路由动态路由 IGP&#xff1a;内网网关路由协议&#xff08;在企业内部或数据中心内部使用&#xff09; DV&#xff1a;距离矢量路由协议RIP&#xff08;v1/v2&#xff09;IGRP——网络直径&…

【超全干货】一文讲清什么是全民分销?怎么做好全民分销?

一、什么是全民分销&#xff1f; 全民分销&#xff0c;作为新时代营销模式的代表之一&#xff0c;是基于互联网尤其是社交媒体平台兴起的一种分销策略。它打破了传统零售与电子商务的界限&#xff0c;允许任何个人&#xff0c;无论是否为专业销售人员&#xff0c;都能成为品牌…

JJJ:ubuntu修改静态ip

一、IP变化的原因 1.DHCP协议 虚拟机系统(Ubuntu、CentOS、UOS等Linux系统)启动后&#xff0c;加入本地局域网网络时&#xff0c;会向本地网络申请租约一个IP地址&#xff0c;租约时长不定。我这里租约时间短到只有1小时左右就更换一次IP地址。 二、解决方法&#xff1a;手动…