【Hive】【Hadoop】工作中常操作的笔记-随时添加

news2026/2/15 8:26:11

文章目录

- - 1、Hive 复制一个表:
  - 2、字段级操作
  - 3、hdfs 文件统计

1、Hive 复制一个表:

直接Copy文件

create table new_table  like table_name;

hdfs dfs -get /apps/hive/warehouse/ods.db/table_name

load data local inpath '/路径' into table new_table;

修复表：

msck repair table table_name;

分析表

analyze table table_name compute statistics;

2、字段级操作

--新增字段
alter table add columns (filed1 data_type,filed2 data_type) cascade;

--修改字段
alter table change column filed_name new_filed_name data_type

--删除字段
--如果想删除最后一个字段column_2
create table table_name (
column_1 string,
column_2 int);
 
--删除column_2
alter table table_name replace columns(
column_1 string) cascade;    --column_2不写，即删除column_2，保留column_1

NOTE :

CASCADE会刷历史分区字段。

说明：

因为hive表大部分是分区表，而加上cascade【注：中文翻译为“级联”】关键字，不仅会变更新分区的表结构（metadata），同时也会变更旧分区的表结构。
当使用级联删除表中信息时，如果A表中的字段引用了B表中的字段，删除B表中字段信息，相应的A表也会删除。（当父表的信息删除，子表的信息也自动删除）
对于分区表，在增删改时，一定要加上cascade，否则其历史分区的元数据（metadata）信息将无法正常更新，可能会出现访问历史分区时数据为NULL等问题。

3、hdfs 文件统计

hdfs dfs -ls /apps/hive/warehouse/edw.db/table_name/ | wc -l

hdfs dfs -count /apps/hive/warehouse/edw.db/table_name

在这里插入图片描述
第一个数值表示目录下的文件夹的个数，

第二个数值表是当前文件夹下文件的个数，

第三个数值表示该文件夹下文件所占的空间大小，这个大小是不计算副本的个数的。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1315612.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

【Hive】【Hadoop】工作中常操作的笔记-随时添加

文章目录

1、Hive 复制一个表:

2、字段级操作

3、hdfs 文件统计

相关文章

[pasecactf_2019]flask_ssti proc ssti config

数据结构 | 查漏补缺之顺式存储和链式存储、如何评价哈希函数的好坏、链地址法、树的遍历、关键路径、完全图、连通图、迪杰斯特拉、b树

单例模式⭐️通过具体代码实现单例模式的不同实现以及周末总结

『App自动化测试之Appium应用篇』| uiautomator + accessibility_id定位方法完全使用攻略

Threejs漫天多彩粒子天空--粒子系统打造

【Unity 实用工具篇】| 游戏多语言解决方案，官方插件Localization 实现本地化及多种语言切换

AWS-CDN只能备用域名访问-使用Lambda@Edge（禁止分配的域名访问）

从菜鸟到专业人士：来自真实 PRD 写作经验的 5 个改变游戏规则的产品管理课程

【C语言】动态内存管理（C语言的难点与精华，数据结构的前置知识，你真的掌握了吗？）

DevEco Studio自定义代码颜色

使用下载代替物理串口输出-STM32 Debug (printf) Viewer

BugKu-Web-滑稽

Java: Random

jmeter 如何循环使用接口返回的多值？

测试用例设计方法之判定表详解！！

Redis常用内存淘汰策略？

【AI美图】第03期效果图，AI人工智能全自动绘画，二次元美图欣赏

VBA技术资料MF96：单字段多条件高级筛选

基于CNN+数据增强+残差网络Resnet50的少样本高准确度猫咪种类识别—深度学习算法应用(含全部工程源码)+数据集+模型（六）

Day10 Liunx高级系统设计11-数据库2