hadoop 常用命令总结

news2024/9/27 21:24:59

背景

在本地记事本记得太多了,有的命令使用频次很低,时间长了容易忘记,分享出来后续使用时查找

常用命令

  • 列出数据库下的所有表
hadoop fs -ls /user/hive/warehouse/test.db

  • 统计数据库占用磁盘的总大小
hadoop fs -du -s -h /user/hive/warehouse/test.db

  • 查看数据表中的数据
hadoop fs -cat /user/hive/warehouse/test.db/test/00000_0 | head 

  • 设置副本数
    Hadoop默认是3个副本,replication factor 副本因子
hadoop fs -setrep -R 1 /user/hive/warehouse/test.db/test

  • 创建文件夹
hadoop fs -mkdir /user/datashare

  • 修改文件权限
hadoop fs -chmod 700 /user/datashare
hadoop fs -chmod -R 700 /user/datashare   #递归进行,针对子文件夹

  • 检查HDFS中的文件是否存在
hadoop fs -test -e /user/hive/warehouse/test.db/test/0*

  • 统计文件个数
hadoop fs -ls -h /user/hive/warehouse/test.db/test/dt=202310 | wc -l
hadoop fs -count /user/hive/warehouse/test.db/test/dt=202310

  • 统计多个文件夹的总占用大小
hadoop fs -du -s  /user/hive/warehouse/test.db/test/dt=202310*  |   awk '{print $1}' | awk '{sum+=$1}END{print sum/1024**3 " G"}'

  • 统计每个文件夹的单独大小
hadoop fs -du -s  /user/hive/warehouse/test.db/test/dt=202310*  |   awk '{print $1/1024**3 " G"}'

  • 跨集群访问
hadoop fs -ls hdfs://10.20.1.100:8100/

  • 查看hadoop 版本
hadoop version

  • 查看数据缺失的块
hadoop fsck /user/hive/warehouse/test.db/test

  • 复制分区至新表
1. CREATE TABLE new_table LIKE old_table;
2. 使用hadoop fs -cp 命令,把old_table对应的HDFS目录的文件夹全部拷贝到new_table对应的HDFS目录下;
3. 使用MSCK REPAIR TABLE new_table;修复新表的分区元数据;

  • 查看数据库里面各数据表的大小,并进行排序
hadoop fs -du -s /user/hive/warehouse/test.db/* | sort -n | numfmt --to=iec --field=1

numfmt --to=iec --field=1 的作用是仅将第一列(大小)转换为人类可读的格式,而不改变第二列(路径)的内容。
--field=1 让 numfmt 只处理第一列,从而避免误修改文件路径

  • 删除文件、空目录
hadoop fs -rm /user/hive/warehouse/emptydir

  • 删除文件夹
hadoop fs -rmr /user/hadoop/dir

历史相关文章

  • Hive 中把一行记录拆分为多行记录
  • Hive中对相邻访问时间进行归并分组
  • Hive 数据聚合成键值对时,根据值大小进行排序
  • Hive中的常用函数
  • Hive中各种日期格式转换方法总结
  • Hive HQL支持的2种查询语句风格,你喜欢哪一种?

以上是自己实践中遇到的一些问题,分享出来供大家参考学习,欢迎关注微信公众号:DataShare ,不定期分享干货

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2171100.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

EasyAR自定义相机RTSP视频流(CustomCamera)

EasyAR可以使用视频源作为输入源,官方给出了示例和文档,但是对于大部分Unity开发人员来说看了文档还是一头雾水。 在Android Studio中将custom-camera.jar添加libs中,就可以查看源代码了 分析其源代码,主要是ExternalCameraSampl…

【linux 多进程并发】linux下使用常见命令,来解析进程家族体系脉络

0101 Linux进程 ​专栏内容: postgresql使用入门基础手写数据库toadb并发编程 个人主页:我的主页 管理社区:开源数据库 座右铭:天行健,君子以自强不息;地势坤,君子以厚德载物. 文章目录 0101 Li…

ASP.NET Core 打包net8.0框架在Linux CentOS7上部署问题

问题1 libstdc.so.6版本过低。 CentOS7默认安装的gcc版本太低,达不到.net8的启动条件。 /lib64/libstdc.so.6: version GLIBCXX_3.4.20’ not found (required by ./IDT_net) /lib64/libstdc.so.6: version GLIBCXX_3.4.21’ not found (required by ./IDT_net) 解…

恢复丢失的数据:恢复数据库网络解决方案

探索恢复数据库网络的深度对于了解现代企业如何防御其数据不断增长的威胁至关重要。在一个时代,数字证据和取证网络安全在法律和商业领域扮演关键角色,这些网络提供的弹性是不可或缺的。深入研究恢复数据库网络的重要性不仅仅是数据保护,它还…

ubuntu安装mysql 8,mysql密码的修改

目录 1.安装mysql 82.查看当前状态3.手动给数据库设置密码mysql5mysql8 4.直接把数据库验证密码的功能关闭掉 1.安装mysql 8 apt install mysql-server-8.0敲 Y 按回车 table 选ok 2.查看当前状态 service mysql status显示active(running)证明安装成…

媒界:吉利星瑞百炼成钢,持续引领中国汽车价值向上

秋风送爽绘秋色,出行良辰恰逢时。9月28日至9月29日,2024安行中国汽车安全科技公益巡展迎来尾声,安行中国携手吉利汽车,步履轻盈地踏入苏州星湖天街,共同呈献一场融合环保科技前沿、安全驾驶理念与深厚文化底蕴的48小时…

使用jQuery处理Ajax

使用jQuery处理Ajax HTTP协议 超文本传输协议(HTTP,HyperText Transfer Protocol)是互联网上应用最为广泛的一种网络协议 设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法 所有的WWW文件都必须遵守这个标准 一次HTTP操作称为一个事务&am…

如何使用 CCF Communicator 框架快速开发设备接口

什么是 CCF Communicator Framework? 通信器框架通过封装 CCF 和设备之间的连接,简化了硬件之间的低级消息处理。 举例来说,考虑一下控制软件和硬件设备之间的连接方式。ASCII 串行连接需要使用 TCP 的套接字连接、用于处理设备发送/接收的…

肺癌类器官培养研究概述

前 言 2023年是类器官被《Science》杂志评为年度十大技术的10周年。10年后类器官技术发展迅猛,犹如一颗璀璨的明珠,不断的为生命科学研究揭示新的奥秘,推动生物医学领域不断前行。肺类器官培养条件也在不断完善,在基础和临床研究…

MySQL面试知识汇总

学习链接 创建索引有哪些注意点? 索引应该建在查询频繁的字段,比如where查询、order排序索引的个数应该适量(最多64个),索引需要占用空间,更新时也需要维护区分度低的字段,例如性别&#xff0c…

声阔头戴式耳机怎么样?西圣、jBL、声阔头戴式耳机终极pk测评推荐

我们深知,一款优秀的头戴式耳机,不仅仅是音乐的传递者,更是用户情感与个性的延伸。因此,在设计之初,便将极致的佩戴舒适度视为核心追求,通过人体工学的精准设计与优质材料的精心挑选,力求让每一…

Linux 配置与管理 SWAP(虚拟内存)

Linux 配置与管理 SWAP(虚拟内存) 一、作用二、创建交换文件(以创建一个2GB的交换文件为例)1. 创建交换文件2. 设置文件权限2.1. **关于 sudo chmod 600 /root/swapfile 是否一定要执行**2.2. **关于其他用户启动是否没权限用到交换分区** 3.…

大数据电商数仓项目--实战(一)数据准备

第一章 数仓分层 1.1 为什么要分层 1.2 数仓命名规范 1.2.1 表命名 ODS层命名为ods_表名DIM层命名为dim_表名DWD层命名为dwd_表名DWS层命名为dws_表名DWT层命名为dwt_表名ADS层命名为ads_表名临时表命名为tmp_表名 1.2.2 表字段类型 数量类型为bigint金额类型为decimal(16…

猫咪独自在家可以吗?希喂、美的、有哈宠物空气净化器哪款好?

这不是快要国庆了吗,本来计划去旅游的,结果我妈让我假期回家。收拾行李已经很烦了,行李箱旁的猫咪更是让我头疼。我妈因为之前浮毛过敏的事情,禁止我把猫咪再带回家,朋友们也各有计划,甚至连上门喂养都约满…

设备管理与点巡检系统

在现代企业管理中,设备的高效运作至关重要。为此,我们推出了设备管理与点巡检系统,通过自动化管理提升设备使用效率,保障生产安全。 系统特点 设备全生命周期管理 系统涵盖设备的各个阶段,从设备管理、点检、巡检、保…

计算曲线5s1-2的斜率

在行列可自由变换的条件下,平面上的5点结构只有34个 这次将5点结构通过结构加法化成2点结构5s1-4-3-2,并比较5s1-4-3-2的变化规律。 (A,B)---6*n*2---(0,1)(1,0) 分类A和B,A是34个5点结构,让B全是0。当收敛误差为7e-4&#xff0…

Netty源码解析-响应式实现(Reactor模式)

Netty基本介绍,参考 Netty与网络编程 1、Netty如何支持Reactor模式 1.1 主从Reactor模式 实现这种模式需要定义两个EventLoopGroup,bossGroup就是mainReactor, workerGroup就是subReactor, 接着我们进入下图的b.group方法 1.…

Tomcat部署及其优化

目录 一、Tomcat概述 二、Tomcat的组成 三、Tomcat请求过程 四、Tomcat服务部署 五、/usr/local/tomcat/目录下的主要目录说明 六、Tomcat虚拟主机配置 七、Tomcat优化 1.Tomcat配置文件参数优化 2.Tomcat JVM优化 一、Tomcat概述 Tomcat是基于java语言开发&#xff0c…

传知代码-轻量注意力网络实现苹果叶片识别

代码以及视频讲解 本文所涉及所有资源均在传知代码平台可获取 引言 该系统基于EfficientNet与多头自注意力机制,构建了一个高效、精准的苹果叶片识别模型,能够对不同种类的苹果叶片进行准确分类。通过结合EfficientNet的强大特征提取能力和多头注意力…

Ks渲染做汽车动画吗?汽车本地渲染与云渲染成本分析

Keyshot是一款强大的实时光线追踪和全域光渲染软件,它确实可以用于制作汽车动画,包括汽车模型的渲染和动画展示。Keyshot的动画功能允许用户创建相机移动、物体变化等动态效果,非常适合用于汽车动画的制作。 至于汽车动画的渲染成本&#xff…