Hadoop Hive入门

news2025/1/11 20:06:37

0目录

1.linux 安装hive

2.hive入门

3.hive高级语法1

1.linux 安装hive

先确保linux虚拟机中已经安装jdk;mysql和hadoop 并可以成功启动hadoop和mysql

下载hive对应版本到opt/install目录下并解压到opt/soft目录下

重命名 hive312

配置profile 文件,加入hive环境变量

vim /etc.profile

更新资源

source /etc/profile

拷贝mysql connector 到cd/opt/soft/hive312/lib目录下

进入 cd/opt/soft/hive312/conf目录

新建vim ./hive-site.xml

编辑

cd /opt/soft/hadoop313目录下查找juava*开头的文件

cd /opt/soft/hive312/lib目录下删除

拷贝juava* (确保版本相同)

cp /opt/soft/hadoop313/share/hadoop/common/lib/guava-27.0-jre.jar ./

初始化hive

hive初始化

[root@kb129 hive312]# schematool -dbType mysql -initSchema

输入hive命令

show databases;

启动metastore和hiveserver2

与数据库建立连接

2.hive基本语法

查看数据库

选择数据库

创建表和添加数据

强制删除某个数据库

产看表信息

覆盖原有数据

重命名表名和添加和替换列名

创建内部表

指定上传路径(两种方式)location(hdfs路径) 和load data local inpath(虚拟机路径)

分区表(手动分区,根据一个字段名)

分区表(手动分区,根据多个字段名) ;添加和删除分区

动态分区 创建studenttp 导入数据

创建studenttp1 指定分区字段(age和gender)

插入数据完成

创建外外部表

路径为hdfs路径

内部表和外部表区别

删除内部表时,表结构和文件同时被删除,外部表只删除表结构

练习(内部表,路径是虚拟机系统路径)

外部表(路径是hdfs路径)

记得上传  cd/opt/kb23路径下

hdfs dfs -put ./employee.txt /user/hive/warehouse/kb23hivedb.db/stu/employeefile

union拼接查询结果

写法2

将r1的结果作为r2查询的表(类似sqi子查询)

子查询(先性别男然后名字will)

结果

3.hive高级查询1

删除、修改表

分桶表

创建分桶表

Hdfs查看

随机

创建视图

侧视图

CTE查询

关联查询

Union

hive四大排序

补充in和exists

exists的返回值是true和false

wordCount案例

新建表结构和加载数据

Case when语句

列转行

练习

新建App表和userapp表

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/981544.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

结构体的简单介绍(3)——结构体的内存对齐

目录 结构体的内存对齐: 举例&提出疑问? 内存对齐: 对齐规则: 偏移数:类似于数组的下标,指的是结构体每个成员的首个地址距离结构体起始位置的距离。 用结构体内存对齐的图例示范:——…

【开发】安防监控/视频存储/视频汇聚平台EasyCVR优化播放体验的小tips

视频云存储/安防监控EasyCVR视频汇聚平台基于云边端智能协同,可实现视频监控直播、视频轮播、视频录像、云存储、回放与检索、智能告警、服务器集群、语音对讲、云台控制、电子地图、H.265自动转码H.264、平台级联等。为了便于用户二次开发、调用与集成,…

优化SOCKS5的方法

在今天的互联网世界中,保护个人隐私和提升网络速度至关重要。作为一种常用的代理协议,SOCKS5代理服务器不仅可以保护您的隐私,还可以实现更快速的网络访问。本文将为您介绍一些优化SOCKS5代理服务器的方法,以提高网络速度和安全性…

数据结构例题代码及其讲解-递归与树

树 ​ 树的很多题目中都包含递归的思想 递归 递归包括递归边界以及递归式 即:往下递,往上归 递归写法的特点:写起来代码较短,但是时间复杂度较高 01 利用递归求解 n 的阶乘。 int Func(int n) {if (n 0) {return 1;}else …

看涨期权计算例题(期权案例计算)

看涨期权又称认购期权,买进期权,买方期权,买权,延买期权,或“敲进”,是指期权的购买者拥有在期权合约有效期内按执行价格买进一定数量标的物的权利,下文为大家科普看涨期权计算例题(…

【Redis】2、Redis持久化

Redis 高可用 在web服务器中,高可用是指服务器可以正常访问的时间,衡量的标准是在多长时间内可以提供正常服务(99.9%、99.99%、99.999%等等)。 但是在Redis语境中,高可用的含义似乎要宽泛一些,除了保证提供…

【数论】容斥问题教程+符号含义+公式(c++)

容斥问题是什么 比如我们平常考试,我们会统计有几个语文及格,有几个数学及格,比如5个语文及格,2个数学及格,当然了,也会有大学霸两科都及格,比如1个人语文数学都及格,那我们班上一共…

React三属性之:state

作用: state是用于在组件中存储数据,称之为"状态机" 类似于vue2中的data属性,不过操作和vue中data差别很大. 使用: this.state的值不能直接进行赋值操作,如:this.state.value_str 修改的值,需要使用this.setState方法 this.setState({修改的key:修改的value},数…

vue Router从入门到精通

文章目录 介绍使用多级路由实例 路由的query参数传递参数接收参数实例 命名路由作用使用 params参数声明接收params参数传参接收参数实例 props配置实例 router-link的replace属性编程式路由导航作用使用实例 缓存路由组件两个新的生命周期钩子实例 路由守卫作用分类全局守卫独…

软件架构设计(四) 基于服务的架构(SOA)

前面我们了解到了层次架构中表示层的架构分层,分为了MVC,MVP,MVVM等架构风格,下面我们了解一下SOA架构与微服务架构。 什么是服务? 服务是一种为了满足某项业务需求的操作,规则等的逻辑组合,它包含了一系列有序活动的交互,为实现用户目标提供支持。 SOA的起源 前面…

车载网络扫盲

目录 车载以太网发展技术 车载网络通信架构与拓扑 车载网络的车载网关 车载网络通信协议 二层确定性以太网协议 二层车载网络扩展协议 三层安全加密协议 四层应用通信协议 车载网络通信架构的网络安全 车载以太网发展技术 车载网络技术包括车载影音娱乐和车载导航需要的MOST&am…

通用的方法在任何云VM上安装Mikrotik的Cloud Hosted Router

文章目录 1. 创建新的Instance(Ubuntu或Debian,理论上任何 linux都可以)2. 启动,然后将tempfs挂载到/tmp3. 下载镜像4. 写入镜像文件5.强制重启 通用的方法在任何云VM上安装Mikrotik的Cloud Hosted Router 许多云提供商不允许上传…

海康工业相机:MVC软件安装、官方sdk例子、sdk使用手册、

海康工业相机软件安装 首先下载海康的MVC,官方网址:https://www.hikrobotics.com/cn/machinevision/service/download 直接默认安装,一顿点击下一步,就不说了。 界面如下: sdk官方例子 如果你在windows系统是默认…

网络技术五:IP基本原理

IP基本原理 IP的作用 标识节点和链路 用唯一的IP地址标识每一个节点 用唯一的IP网络号标识每一个链路 寻址和转发 确定节点所在网络的位置,进而确定节点所在的位置 IP路由器选择适当的路径将IP包转发到目的节点 适应各种数据链路 根据链路的MTU对IP包进行分片…

【学习笔记】元学习如何解决计算机视觉少样本学习的问题?

目录 1 计算机视觉少样本学习 2 元学习 3 寻找最优初始参数值方法:MAML 3.1 算法步骤 3.2 代码:使用MAML 和 FO-MAML、任务增强完成Few-shot Classification 4 距离度量方法:Siamese Network,ProtoNet,RN 4.1 孪生网络(Sia…

不安全的反序列化(phpjava)及漏洞复现

不安全的反序列化 1. 序列化与反序列化 A8:2017-不安全的反序列化 A08:2021-Software and Data Integrity Failures 为什么要序列化? 序列化,将对象的状态信息转换为可以存储或传输的形式的过程,这种形式大多为字节流、字符串、json 串。…

搭建PyTorch神经网络进行气温预测

import numpy as np import pandas as pd import matplotlib.pyplot as plt import torch import torch.optim as optim import warnings warnings.filterwarnings("ignore") %matplotlib inline features pd.read_csv(temps.csv)#看看数据长什么样子 features.he…

React三属性之:refs

作用 refs是为了获取节点,使用场景主要在需要操作dom的时候,比如echarts,就需要真实的dom节点 使用 import React from "react"; class RefsTest extends React.Component{state {value:输入框的值}refPlan React.createRef()logRef ()>{console.log(this.r…

AlmaLinux 经济收益增加,红帽 RHEL 源码限制不成威胁

导读红帽在两个月前发布公告表示,将限制对 Red Hat Enterprise Linux (RHEL) 源代码的访问,未来 CentOS Stream 将成为公共 RHEL 相关源代码发布的唯一仓库。对于这一决策,AlmaLinux OS Foundation 主席 Benny Vasquez 则向 SiliconANGLE 表示…

线性代数的学习和整理21,向量的模,矩阵的模,矩阵的模和行列式比较(未完成)

目录 1 模的定义 2 向量的模是距离 2.1 向量的模的定义 2.2 向量的模的计算公式 3 矩阵的模 3.1 矩阵/向量组的模的定义 3.2 矩阵的模的公式 4 矩阵的模和行列式的关系? 1 模的定义 模,又称为范数。范数,是具有“长度”概念的函数。…