Hive知识点的回顾

news2026/2/10 5:06:37

一、Hive的序列化和反序列化

==Hive读取文件机制==：读取文件中的每一行 => 反序列化 => 通过分隔符进行切割，返回数据表中的每一行对象。

==Hive写文件机制==：把数据表中的每一行Row对象 => 调用LazySimpleSerde类中的序列化方法 => 把Row对象转换为字节码 => 调用OutputFormat方法把字节码写入到文件中。

序列化与反序列化的核心：分隔符的定义。分隔符定义的好，有助于序列化和反序列化操作。

行和行之间默认'\n'分割

复杂分隔符案例：

默认分隔符案例：

二、内部表和外部表

内部表（Internal table）也称为被Hive拥有和管理的托管表（Managed table）。==默认情况下创建的表就是内部表==，Hive拥有该表的结构和数据文件。换句话说，Hive完全管理表（元数据和实际数据）的生命周期，类似于RDBMS中的表。删除内部表不仅会删除表元数据，还会从HDFS中删除其所有数据/文件。

外部表（External table）中的数据不是Hive拥有或管理的，只管理表元数据的生命周期。要创建一个==外部表，需要使用EXTERNAL语法关键字==。==而且外部表更为方便的是可以搭配location语法指定数据的路径。==特征：删除外部表只会删除元数据，而不会删除实际数据。在Hive外部仍然可以访问实际数据。

（外部表相当于给HDFS建立了一个链接）

当需要通过Hive完全管理控制表的整个生命周期时，请使用内部表。

当文件已经存在或位于远程位置时，请使用外部表，因为即使删除表，文件也会被保留。

三、分区表

1.静态分区

静态分区指的是分区的字段值是由用户在加载数据的时候手动指定的。

2.动态分区

动态分区指的是分区的字段值是基于查询结果自动推断出来的。核心语法就是insert+select。

3.分区总结

多重分区：

四、分桶表

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/497828.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

基于AT89C51单片机的电子秒表设计与仿真

基于AT89C51单片机的电子秒表设计与仿真

点击链接获取Keil源码与Project Backups仿真图： https://download.csdn.net/download/qq_64505944/87759735?spm1001.2014.3001.5503 源码获取主要内容： 设计一个电子钟,实现对时、分、秒的显示的控制,电路采用24小时计时方式。另一个功能是秒表功能…

阅读更多...

JVM内存模型和结构介绍

JVM内存模型和结构介绍

什么是JVM JVM是Java Virtual Machine（Java虚拟机）的缩写，JVM是一个虚构出来的计算机，有着自己完善的硬件架构，如处理器、堆栈等。为什么需要JVM？ Java语言使用Java虚拟机屏蔽了与具体平台相关的信息&…

阅读更多...

执行网格中有特定数量节点的传感器网络部署（Matlab代码实现）

执行网格中有特定数量节点的传感器网络部署（Matlab代码实现）

目录 💥1 概述 📚2 运行结果 🎉3 参考文献 👨‍💻4 Matlab代码 💥1 概述无线传感器网络是通过大量分布的传感器节点作为终端来协同感知和自主地监测外部世界,以多跳、自组织或协作的方式进行通信和…

阅读更多...

Java 基础进阶篇（十二）—— Arrays 与 Collections 工具类

Java 基础进阶篇（十二）—— Arrays 与 Collections 工具类

文章目录一、Arrays工具类1.1 Arrays 类常用方法1.2 对于 Comparator 比较器的支持1.3 Arrays 的综合应用1.3.1 应用一：数组的降序排序1.3.2 应用二：根据学生年龄进行排序二、Collections工具类2.1 Collections 类常用方法2.2 Collections 排序相关 AP…

阅读更多...

哈希表相关知识总结

哈希表相关知识总结

一、哈希表的定义散列表（Hash table，也叫哈希表），是根据键（Key）而直接访问在内存存储位置的数据结构。也就是说，它通过计算一个关于键值的函数，将所需查询的数据映射到表中一个位置…

阅读更多...

C++相比于C语言增加的8个特性（详解）

C++相比于C语言增加的8个特性（详解）

C相比于C语言增加的8个特性（详解） 文章目录 C相比于C语言增加的8个特性（详解）一、命名空间二、C输入和输出三、缺省参数四、函数重载五、引用六、内联函数七、auto关键字八、指针空值nullptr总结一、命名空间 c的命名空间是为了…

阅读更多...

【刷题之路】LeetCode 21. 合并两个有序链表

【刷题之路】LeetCode 21. 合并两个有序链表

【刷题之路】LeetCode 21. 合并两个有序链表 1、题目描述二、解题1、方法1——直接合并1.1、思路分析1.2、代码实现 2、方法2——递归2.1、思路分析2.2、代码实现 1、题目描述原题连接： 21. 合并两个有序链表题目描述： 将两个升序链表合并为一个新的 …

阅读更多...

Camtasia Studio2023Mac最新电脑版屏幕录像软件

Camtasia Studio2023Mac最新电脑版屏幕录像软件

Camtasia Studio2023提供了强大的屏幕录像、视频的剪辑和编辑、视频菜单制作、视频剧场和视频播放功能等。它能在任何颜色模式下轻松地记录屏幕动作，包括影像、音效、鼠标移动的轨迹，解说声音等等，另外，它还具有及时播放和编辑压缩…

阅读更多...

数字化转型导师坚鹏：美的集团数字化转型案例研究

数字化转型导师坚鹏：美的集团数字化转型案例研究

美的集团数字化转型案例研究课程背景： 很多企业存在以下问题： 不清楚企业数字化转型能否成功？ 不知道其它企业数字化转型的实际做法？ 不知道其它企业的数字化转型战略是如何演变的？ 课程特色： 用…

阅读更多...

汽车架构-工作流程以及相关协议解读

汽车架构-工作流程以及相关协议解读

全车架构（E/E） 车载测试阶段： 台架测试 HIL测试（硬件在环测试） ADAS智能辅助驾驶测试 OTA测试（远程升级测试） 测试工具： Can协议工具：Canoe Pcan Zcanpro 辅助工具…

阅读更多...

【Stable Diffusion】ControlNet基本教程（三）

【Stable Diffusion】ControlNet基本教程（三）

接上篇【Stable Diffusion】ControlNet基本教程（二），本篇再介绍两个ControlNet常见的基本用法，更多用法欢迎关注博主，博主还会更新更多有趣的内容。 3.3更换物体皮肤有时，我们不想改变物体的轮廓&#xff…

阅读更多...

毫米波雷达系列 | 传统CFAR检测（均值类）

毫米波雷达系列 | 传统CFAR检测（均值类）

毫米波雷达系列 | 传统CFAR检测（均值类） 文章目录毫米波雷达系列 | 传统CFAR检测（均值类）1.CA-CFAR算法2.SO-CFRA算法3.GO-CFAR算法4.仿真对比 CFAR检测器主要用于检测背景杂波环境中的雷达目标，常见的均值类CFAR检测…

阅读更多...

数据结构之队列的详解

数据结构之队列的详解

文章目录一.什么是队列二.队列的使用2.1 队列的基本操作2.2 队列的基本使用三.队列的模拟实现3.1 数组实现队列3.2 链表实现队列四.队列的应用4.1 设计循环队列4.2 设计双端队列4.3 队列实现栈4.4 栈实现队列五.总结一.什么是队列队列是一种先入先出(FIFO)的线性表数据结…

阅读更多...

点评项目导入

点评项目导入

文章目录开篇导读项目地址导入SQL项目架构介绍后端项目导入前端项目导入开篇导读实战篇我们要学习以下内容短信登录这一块我们会使用redis共享session来实现商户查询缓存通过本章节，我们会理解缓存击穿，缓存穿透，缓存雪崩等问题&…

阅读更多...

力扣刷题Day12

力扣刷题Day12

239. 滑动窗口最大值 (此题逻辑真心牛皮） 做此题之前，首先明确此题的目的。我最开始没搞明白此题目的，看代码的时候卡死。 copy他人代码： from collections import dequeclass MyQueue: #单调队列（从大到小def __ini…

阅读更多...

6.S081——陷阱部分(一文读懂Xv6系统调用)——xv6源码完全解析系列(5)

6.S081——陷阱部分(一文读懂Xv6系统调用)——xv6源码完全解析系列(5)

0.briefly speaking 这篇博客将要开始尝试阅读和研究与Xv6陷阱机制相关的代码，主要有以下文件，最重要的是结合Xv6 book将Xv6处理陷阱的相关逻辑和流程弄透。在Xv6的语境中所谓陷阱的触发有以下三种情况： 系统调用严重错误（比如除…

阅读更多...

windows守护进程工具--nssm使用

windows守护进程工具--nssm使用

一、nssm简介 nssm是一个服务封装程序，它可以将普通exe程序封装成服务，实现开机自启动，同类型的工具还有微软自己的srvany，不过nssm更加简单易用，并且功能强大。它的特点如下： 支持普通exe程序(控制台程序…

阅读更多...

每天看一个fortran文件（7）之寻找cesm边界层高度计算代码

每天看一个fortran文件（7）之寻找cesm边界层高度计算代码

自从我把我的代码移到了单独的F90 中，从tphysac.F90中调用后。我发现有很多的变量我没办法调用了，特别是边界层中原先已经算好的变量，比如说我想调用原来模式中的pblh,但是那是在vertical diffusion.F90中计算的，在tphysac中根本调…

阅读更多...

基于springcloud实现的医院信息系统

基于springcloud实现的医院信息系统

访问【WRITE-BUG数字空间】_[内附完整源码和文档] 医疗信息就诊系统，系统主要功能按照数据流量、流向及处理过程分为临床诊疗、药品管理、财务管理、患者管理。诊疗活动由各工作站配合完成，并将临床信息进行整理、处理、汇总、统计、分析等。本系统包括以…

阅读更多...

以前以为去流量大的部门是好事，能学技术，现在才知道，流量大的部门狗都不去！晚上9点才下班，一天到晚都是监控告警！...

以前以为去流量大的部门是好事，能学技术，现在才知道，流量大的部门狗都不去！晚上9点才下班，一天到晚都是监控告警！...

流量大的部门好，还是流量小的部门好？ 一位网友说，工作以前以为去流量大的部门是好事，能学技术；工作后才知道，流量大的部门和组，狗都不去！待在流量大的组，晚上9点起步才下…

阅读更多...

推荐文章

最新文章