【博学谷学习记录】超强总结,用心分享|Hive表生成函数

news2024/11/27 15:52:35

文章目录

    • explode函数
      • Array类型数据演示
        • 演示数据
        • 创建一张包含array类型的表
        • 插入表数据
        • 查询验证
        • 使用explode查询
      • Map 类型数据演示
        • 演示数据
        • 创建一张包含map类型的表
        • 加载表数据
        • 查询验证
        • 使用explode查询
    • later view侧视图关键字
      • 演示数据
      • 创建表并加载数据
      • 查询验证
      • 使用lateral view查询
    • reflect函数
      • 演示数据
      • 创建表并加载数据
      • 查询验证
      • 使用reflect查询

explode函数

explode(列): 将Hive表的某一列复杂类型的array或者map结构拆分成多行
explode(array): 数组中的每个元素生成一行
explode(map): map中每个键值对生成一行,key一列,value一列
注意: struct类不支持

Array类型数据演示

演示数据

zhangsan beijing,shanghai,tianjin,hangzhou
lisi xiamen,fuzhou,jiangxi,nanchang
wangwu changchun,chengdu,wuhan,beijing

创建一张包含array类型的表

create table work_locations(
  name string,
  citys array<string>
)
	row format delimited
	fields terminated by ' '
	collection items terminated by ',';

插入表数据

load data local inpath '/export/testdatas/emp.txt' into table emp;

查询验证

select * from emp;

image.png

使用explode查询

select explode (names) as name from emp;

image.png

Map 类型数据演示

演示数据

1,zhangsan,father:xiaoming#mother:xiaohuang#brother:xiaoxu,28
2,lisi,father:mayun#mother:huangyi#brother:guanyu,22
3,wangwu,father:wangjianlin#mother:ruhua#sister:jingtian,29
4,mayun,father:mayongzhen#mother:angelababy,26

创建一张包含map类型的表

create table family (
    id      int,
    name    string,
    members map<string,string>,
    age     int
)
	row format delimited
	fields terminated by ','
	collection items terminated by '#'
	map keys terminated by ':';
	

加载表数据

load data local inpath '/export/testdatas/map.txt' into table family;

查询验证

select * from family;

image.png

使用explode查询

select explode(members) from family;

image.png

later view侧视图关键字

和explode一起使用,可以把一列数据拆成多行数据,并且可以对拆分后的数据进行聚合

演示数据

zhangsan beijing,shanghai,tianjin,hangzhou
lisi xiamen,fuzhou,jiangxi,nanchang
wangwu changchun,chengdu,wuhan,beijing

创建表并加载数据

create table hive_array (
    name string,
    locations array<string>
)
    row format delimited
    fields terminated by ' '
    collection items terminated by ',';


load data local inpath '/export/testdatas/array.txt' into table hive_array;

查询验证

select * from hive_array;

image.png

使用lateral view查询

select name,locations,loca from hive_array lateral view explode(locations) emp as loca;

image.png

reflect函数

演示数据

1,2
4,3
6,4
7,5
5,6

创建表并加载数据

create table reflect(
    col1 int,
    col2 int
)
    row format delimited
        fields terminated by ',';


load data local inpath '/export/testdatas/reflect.txt' into table reflect;

查询验证

select * from reflect;

image.png

使用reflect查询

select reflect("java.lang.Math","max",col1,col2) as max from reflect;

image.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/3946.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JVM 面试速记

JVM结构图 类加载器 Bootstrap Class Loader 启动类加载器 C Extension Class Loader 扩展类加载器 java Application Class Loader 应用程序加载器 启动类加载器 只加载包名为java,javax,sun开头的类 扩展类加载器负责加载JAVA_HOME/lib/ext目录的下的类&#xff0c;开发…

R包WGCNA---转录组WGCNA共表达网络构建(基本概念)

R包WGCNA---转录组WGCNA共表达网络构建&#xff08;基本概念&#xff09;1. WGCNA简介2. WGCNA分析原理&#xff08;1&#xff09;R包WGCNA的主要功能&#xff08;2&#xff09;WGCNA的基本概念和工作流程&#xff08;3&#xff09;WGCNA分析的常见问题及注意事项1. WGCNA简介 …

嵌入式开发-STM32硬件I2C驱动OLED屏

嵌入式开发-STM32硬件I2C驱动OLED屏 I2C简介 I2C总线是由Philips公司开发的一种简单、双向二线制同步串行总线。它只需要两根线即可在连接于总线上的器件之间传送信息。 主器件用于启动总线传送数据&#xff0c;并产生时钟以开放传送的器件&#xff0c;此时任何被寻址的器件均…

zlMediaKit 10 http相关

HttpRequestSplitter.h HttpRequestSplitter 结构 ssize_t _content_len 0;size_t _remain_data_size 0;toolkit::BufferLikeString _remain_data;input 上次还有剩余的数据&#xff0c;就把这次的数据和上次的数据接上。 分包&#xff1a; const char *ptr data;if(!_re…

大数据之Hive(二)

文章目录前言一、Hive数据库和表操作&#xff08;一&#xff09;数据库操作1. 创建数据库2. 删除数据库&#xff08;二&#xff09;数据表操作1. 内部表和外部表的操作1.1 内部表操作1.2 外部表操作2. 复杂类型操作2.1 Array类型2.2 map类型2.3 struct类型前言 #博学谷IT学习技…

【数据结构与算法】二叉排序树平衡二叉树哈夫曼树

&#x1f525; 本文由 程序喵正在路上 原创&#xff0c;CSDN首发&#xff01; &#x1f496; 系列专栏&#xff1a;数据结构与算法 &#x1f320; 首发时间&#xff1a;2022年11月7日 &#x1f98b; 欢迎关注&#x1f5b1;点赞&#x1f44d;收藏&#x1f31f;留言&#x1f43e;…

Oracle 处理json数据

文章目录备注:一. Json数据存储二. Json数据insert三. json数据update四. json数据查询五. 常用的json函数5.1 json_array5.2 JSON_ARRAYAGG5.3 JSON_DATAGUIDE5.4 JSON_MERGEPATCH5.5 JSON_OBJECT5.6 JSON_OBJECTAGG5.7 JSON_QUERY5.8 json_serialize5.9 JSON_TABLE5.10 JSON_…

作为前端还在使用GIF动画吗?换一种更优雅的方案吧

Web-Editor 前言 动画需求在业务开发中是很常见的功能&#xff0c;无论是客户端开发、Web 开发、还是桌面端开发&#xff0c;为了产品有更好的用户体验&#xff0c;UED 设计的视觉效果也愈发的复杂&#xff0c;一般些简单的淡入淡出&#xff0c;旋转效果开发花费些时间即可搞…

三只松鼠,“跑”不动了?

【潮汐商业评论/ 原创】 编辑部的Lisa是个典型的吃货&#xff0c;而坚果零食绝对是她的心头好。用她的话来说“坚果提供优质脂肪&#xff0c;每天吃点&#xff0c;解馋又健康啊。” 而作为网红坚果零食“开山鼻祖”之一的三只松鼠&#xff0c;最近的日子似乎并不好过。 近日…

阿里云SLB之:基于HTTPS协议的SLB应用场景(十二)

文章目录 1.配置域名解析2.配置HTTPS协议类型的SLB七层负载2.1.点击监听配置向导2.2.配置负载均衡类型2.3.设置负载均衡算法2.4.设置域名使用的SSL证书2.5.设置后端虚拟服务器组2.6.开机健康检查2.7.审核配置完成创建3.配置HTTP强转HTTPS4.配置ECS中的Nginx支持HTTPS协议5.通过…

文件传输协议

1、FTP 文件传送协议FPT&#xff08;File Transfer Protocol&#xff09;是互联网上使用的最广泛的文件传输协议。FTP提供交互式访问&#xff0c;允许客户指明文件的类型与格式&#xff0c;并允许文件具有存取权限&#xff08;如访问文件的用户必须经过授权&#xff0c;如输入有…

pg故障修复记录

一个线上实例&#xff0c;用户数据大概300g 400g的样子&#xff0c;由于用户自己修改了最大连接数&#xff0c;超过了我们设置的合理范围&#xff0c;导致自动恢复失败&#xff0c;现在需要我们手动搭建起来新的主从关系。 但是在搭建的过程中&#xff0c;出现了两个比较麻烦的…

我用python分析买房数据

首先说明&#xff0c;这是一篇技术文章。 明年打算买房&#xff0c;媳妇这段时间总去看房子&#xff0c;这种状态持续了两个月&#xff0c;最近终于消停了。现在整个市场不明朗&#xff0c;我们也不确定换到哪里。不如先整理点数据&#xff0c;至少能监控一些区域价格&#xf…

Vue利用flex布局实现TV端城市列表

Vue利用flex布局实现TV端城市列表 vue中城市列表和搜索很常见&#xff0c;这篇博客就来说说咋实现搜索和城市列表 1.实现搜索布局代码&#xff1a; <div class"search-bar"><input class"search-input" v-model"citySearchResult" :…

Java【数组】定义与使用,什么是引用类型你知道吗

文章目录前言一、数组的基本概念1.什么是数组2.数组的创建和初始化1.数组的创建2. 数组的初始化3.数组的使用4.遍历数组&#xff08;两种方式&#xff09;二、数组是引用类型1.初识JVM内存分配2.引用类型3.认识null三、数组的应用场景1.保存数据2.作为方法的参数1.参数传基本数…

STM32F407ZGT6|SPI主从模式

功能&#xff1a;主机发送数据0x34–>从机接收数据–>通过串口将数据发送出去–>串口猎人显示0x34 必备知识点 1、SPI串行外设接口特点 高速、全双工、同步、串行高速&#xff1a;发送数据的速度很快全双工&#xff1a;两设备可同时双向通信&#xff08;接收与发送&…

STM32 CAN过滤器标识符学习笔记

最近看了下STM32 CAN 通讯其中标示符过滤器设置大有讲究。特别是你要使用ST库函数时&#xff0c;当过滤器工作在屏蔽模式下&#xff0c;并且你把屏蔽位设了1也就是标示符对应位必须全部匹配才能通过&#xff0c;这是由其要小心。 举个例子吧&#xff0c;过滤器长度为32位&…

【MindSpore易点通】在开发环境中如何使用MindInsight在线调试器

背景信息 在使用开发环境训练任务过程中&#xff0c;为方便开发人员更形象地观察到实时训练任务中的数值变化情况以分析精度问题&#xff0c;ModelArts在线调节器应运而生。与离线调试器的区别在于&#xff0c;离线调试器只能待整个任务运行完成后&#xff08;收集到整个任务过…

【机器学习大杀器】Stacking堆叠模型

1.前言 Kaglle比赛中使用Stacking模型是非常常见的大杀器&#xff0c;这是为什么呢&#xff1f; 【机器学习大杀器】Stacking堆叠模型 1.前言 2.Model 3: Stacking model 2.1 description of the algorithms: 2.2 interpretation of the estimated models: 3. Extend 3.1 …

终于盼到了,Python 数据科学速查表中文版来了

近几年以来&#xff0c;Python 的应用场景越来越多&#xff0c;几乎可以应用于自然科学、工程技术、金融、通信和商业等各种领域。究其原因在于 Python 的简单易学、功能强大。 想系统地学点东西&#xff0c;发现很多不错的技术文档都是英文资料&#xff0c;发现英文竟然成为了…