Hive数据定义语言-DDL-入门基础(含四个实践案例)

news2025/1/17 13:57:12

1. 概述

  • 数据定义语言DDL,是SQL语言集中对数据库内部的对象结构进行创建删除修改等的操作语言,这些数据库对象包括database、table、view、index等。
  • DDL核心语法由CREATE、ALTER与DROP三个所组成。DDL并不涉及表内部数据的操作。
  • 在某些上下文中,该术语也称为数据描述语言,因为它描述了数据库表中的字段何记录。

2. 建表语法

2.1 完整建表语法树

在这里插入图片描述

注意事项

  • 蓝色字体是建表语法的关键字,用户指定某些功能。
  • [ ] 中括号的语法表示可选。
  • | 表示使用的时候,左右语法二选一。
  • 建表语句中的语法顺序要和语法树中顺序保持一致

2.2 数据类型

Hive数据类型指的是表中列的字段类型

  • 整体分为两类:原生数据类型复杂数据类型
    • 原生数据类型包括:数据类型、时间日期类型、字符串类型、杂项数据类型。
    • 复杂数据类型包括:array数据、map映射、struct结构、union联合体。
      在这里插入图片描述
  • 原生数据类型:
    在这里插入图片描述
  • 复杂数据类型:

在这里插入图片描述

注意事项

  • HIive SQL中,数据类型英文字母大小写不敏感;
  • 除SQL数据类型外,还支持Java数据类型,比如字符串string;
  • 复杂数据类型的使用通常需要和分隔符指定语法配合使用;
  • 如果定义的数据类型和文件不一致,Hive会尝试隐式转换,但不保证成功。

隐式转换

  • 与标准SQL类似,HQL支持隐式和显示类型转换。
  • 原生类型从窄类型到宽类型的转换成为隐式转换,反之,则不允许。
  • 下表描述了类型之间允许的隐式转换:
    在这里插入图片描述

显示转换

  • 显示转换使用CAST函数。
    例如,CAST (‘100’ as INT) 会将100字符串转换为100整数值。
    如果强制转换失败,例如CAST (’Allen’ as INT) ,该函数返回NULL。

3. 案例练习

3.1 原生数据类型使用

目标要求:

  • 文件archer.txt记录手游《王者荣耀》射手的相关信息,包括生命、物防、物攻等属性信息,其中字段之间分隔符额为制表符\t,要求Hive中建表映射成功该文件。
    archer.txt
    分析思路:
    在这里插入图片描述
    实现过程及结果:
  • 创建数据库并切换使用:
create database if not exists kox01;
use kox01;

在这里插入图片描述

  • 创建表:
create table t_archer(
    id int comment "ID",
    name string comment "英雄名称",
    hp_max int comment "最大生命",
    mp_max int comment "最大法力",
    attack_max int comment "最高物攻",
    defense_max int comment "最大物防",
    attack_range string comment "攻击范围",
    role_main string comment "主要定位",
    role_assist string comment "次要定位"
) comment "王者荣耀射手信息"
row format delimited
fields terminated by "\t";

验证是否创建成功

在这里插入图片描述在这里插入图片描述

  • 将文件上传到对应表文件夹下:
    • mkdir hivedata
    • cd hivedata/
    • 上传archer.txt:pass
    • 将文件上传到HDFS表所对应的目录下:hadoop fs -put archer.txt /user/hive/warehouse/kox01.db/t_archer

验证查询是否成功

在这里插入图片描述
在这里插入图片描述

3.2 复杂数据类型使用

目标要求:

  • 文件hot_hero_skin_price.txt中记录了手游《王者荣耀》热门英雄的相关皮肤价格信息,要求在Hive中建表映射成功该文件。
    在这里插入图片描述

实现过程及结果

  • 创建表:
create table t_hot_hero_skin_price(
    id int,
    name string,
    win_rate int,
    skin_price map<string,int> -- 复杂类型
) row format delimited
fields terminated by ',' -- 指定字段之间分隔符
collection items terminated by '-' -- 指定集合元素之间的分隔符
map keys terminated by ':'; -- 指定map元素kv之间的分隔符

验证是否创建成功

在这里插入图片描述

  • 将文件上传到对应表文件夹下:
    在这里插入图片描述
  • 将文件上传到HDFS表所对应的目录下: hadoop fs -put hot_hero_skin_price.txt /user/hive/warehouse/kox01.db/t_hot_hero_skin_price

验证查询是否成功

在这里插入图片描述

在这里插入图片描述

3.3 默认分隔符使用

目标任务:

  • 文件team_ace_player.txt中记录了手游《王者荣耀》主要战队内最受欢迎的王牌选手信息,字段之间使用的是\001作为分隔符,要求在Hive中建表
    在这里插入图片描述
    实现过程及结果:
  • 创建表:
create table t_team_ace_player(
    id int,
    team_name string,
    ace_player_name string
); --没有指定row format语句 此时采用的是默认的\001作为字段的分割符

验证是否创建成功

在这里插入图片描述

  • 将文件上传到对应表文件夹下:
    在这里插入图片描述
  • 将文件上传到HDFS表所对应的目录下: hadoop fs -put team_ace_player.txt /user/hive/warehouse/kox01.db/t_team_ace_player

验证查询是否成功

在这里插入图片描述

在这里插入图片描述

3.4 指定数据存储路径

任务目标:

  • 文件team_ace_player.txt中记录了手游《王者荣耀》主要战队内最受欢迎的王牌选手信息,字段之间使用的是\001作为分隔符。
    要求把文件上传到HDFS任意路径下,不能移动复制,并在Hive中建表映射成功该文件。
    实现过程及结果:
  • 在根目录创建文件夹:hadoop fs -mkdir /data
  • 上传文件: hadoop fs -put team_ace_player.txt /data
  • 创建表:
create table t_team_ace_player_location(
    id int,
    team_name string,
    ace_player_name string
) location '/data'; -- 使用loacation关键字指代指定本张表数据在hdfs上的存储路径

验证查询是否成功

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/23831.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Docker ENV 与 ARG 详解

Docker Env 与 ARG 详解 Env 与ARG 差异可以用下面一张图来表示 ENV 使用说明 ENV 变量只能在容器运行时&#xff0c;生效 如果想在执行命令的时候&#xff0c;使用ENV变量需要在shell 模式下采用生效&#xff0c;比如我们运行spring boot 应用, 其中JAVA_OPTS 变量通过doc…

德国跨国汽车巨头大陆集团遭LockBit勒索软件组织攻击

据BleepingCompuer11月3日消息&#xff0c;知名勒索软件组织LockBit宣布他们对德国跨国汽车集团大陆集团&#xff08; Continental&#xff09; 发动了网络攻击。 LockBit声称&#xff0c;他们窃取了大陆集团系统中的一些数据&#xff0c;如果不能在11 月 4 日 15:45:36&#x…

Docker基本管理

一、Docker概述 1.什么是Docker 是一个开源的应用容器引擎&#xff0c;基于go语言开发并遵循了apache2.0协议开源&#xff1b; 是在Linux容器里运行应用的开源工具&#xff1b; 是一种轻量级的“虚拟机”&#xff1b; Docker的容器技术可以在一台主机上轻松为任何应用创建一个…

GC暂停时间过长——排查分析

告警 本次GC日志分析 2022-11-17T17:58:50.5180800: 1217960.132: [GC (Allocation Failure) 2022-11-17T17:58:50.5180800: 1217960.132: [ParNew: 1382400K->153600K(1382400K), 0. 5626158 secs] 3419277K->2410488K(4040704K), 0.5628652 secs] [Times: user1.07 sy…

vue3【toRef和toRefs--详】

通过下面的代码例子分析这两个作用及其用法&#xff1a; <template><h1>姓名&#xff1a;{{person.name}}</h1><h1>年龄&#xff1a;{{person.age}}</h1><h1>薪资&#xff1a;{{person.job.job1.salary}}w</h1><button click&qu…

springboot+vue网上零食购物商城网站java

零食商店管理系统是基于java编程语言&#xff0c;mysql数据库&#xff0c;springboot框架和idea开发工具开发&#xff0c;本系统主要分为用户和管理员两个角色&#xff0c;用户可以注册登陆查看零食资讯&#xff0c;零食分类&#xff0c;零食详情&#xff0c;收藏零食&#xff…

SwiftUI之iOS16中的三种SF字体的样式和使用

一、前言 在 iOS 16 中&#xff0c;Apple 引入了三种新的宽度样式字体到 SF 字体库&#xff1a;Compressed、Condensed、Expend&#xff0c;展示效果如下&#xff1a; 二、UIFont.Width Apple 引入了新的结构体 UIFont.Width&#xff0c;这代表了一种新的宽度样式。目前已有的…

纯前端 excel 导出

前端 excel 表格导出 我们习惯了后端去处理表格&#xff0c;直接接口返回 &#xff0c;那前端如何轻松的导出表格呢&#xff1f; 文章目录前端 excel 表格导出Ⅰ. 通过 js-xlsx ⭐⭐⭐⭐⭐安装① vue2 中使用② vue3 中使用③ react 中使用Ⅲ. 通过 vue-json-excel ⭐⭐安装使…

语音芯片KT148A的一线串口和KT148A的串口版本以及按键版本有什么区别

目录 一、简介 一线串口版本&#xff1a;应用场景是搭配MCU&#xff0c;KT148A受到MCU的控制&#xff0c;来播放语音 按键版本&#xff1a;KT148A有三个IO口&#xff0c;可以灵活配置为不同的触发播放形式 二、详细描述 2.1 一线串口版本和按键版本的硬件说明 一线串口版…

MeganeX VR原型体验:中心视觉清晰,畸变和IPD等细节待优化

前不久&#xff0c;松下子公司Shiftall在AWE Europe 2022上展示了MeganeX VR头显的新版原型设计&#xff0c;这个新版本采用和此前不同的外观设计&#xff0c;最大的特点是配备定制的SteamVR定位模块&#xff0c;可兼容Index VR手柄。相比于市面上一些主流PC VR头显&#xff0c…

SpringMVC之完成对前端传来的数据进行校验

假设您需要在网页上注册一个账号&#xff0c;其中有一项需要填入您的年龄&#xff0c;如果您不小心填了一个字符串&#xff0c;那么您的这个账号是不可能成功进行注册的&#xff0c;而本篇文章实现的功能就是&#xff0c;在后端将前端串传入的数据进行校验和识别。 第一步&…

yolo数据集的制作教程之海绵宝宝数据集的制作

yolo海绵宝宝数据集的制作 1、视频转图片 新建名为hm的文件目录&#xff0c;用于存放图片 代码如下&#xff1a; import cv2 from datetime import datetime def video_to_frames(path,savepath,m):video_cap cv2.VideoCapture()video_cap.open(path)fps video_cap.get(…

【云原生系列】第三讲:Knative 之 Serving

目录 序言 1. knative 1.1 发展历程 1.2 特点 2.Serving 2.1 基本介绍 2.2 支持类型 2.3 资源类型 2.3.1 service 2.3.2 Route 2.3.3 Configuration 2.3.4 Revision 2.4 Serving管理能力实现方式 2.4.1 四个 kubernetes Service 2.4.2 二个Deployment 2.4.3…

5G无线技术基础自学系列 | 5G下行物理信道和信号

素材来源&#xff1a;《5G无线网络规划与优化》 一边学习一边整理内容&#xff0c;并与大家分享&#xff0c;侵权即删&#xff0c;谢谢支持&#xff01; 附上汇总贴&#xff1a;5G无线技术基础自学系列 | 汇总_COCOgsta的博客-CSDN博客 5G空中接口下行的物理信道包括PB CH、P…

[附源码]计算机毕业设计JAVA基于web旅游网站的设计与实现

[附源码]计算机毕业设计JAVA基于web旅游网站的设计与实现 项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; …

docker打包多架构镜像(manifest)

在docker仓库上&#xff0c;经常能看到这样的镜像 在一个”镜像“中&#xff0c;包含了三个架构的镜像 本质上&#xff0c;外部看到的这个镜像&#xff0c;其实不算是一个镜像&#xff0c;应该称它为镜像清单列表&#xff08;manifest list&#xff09; manifest是一个文件&a…

通过面积证明:两个函数相乘 / 相除的导数为什么长成这样?

参考视频 MIT 微积分课程 两个函数相乘的导数 (f(x)g(x))′f′(x)g(x)g′(x)f(x)(f(x)g(x))^{}f^{}(x)g(x)g^{}(x)f(x)(f(x)g(x))′f′(x)g(x)g′(x)f(x) 这是我们都非常熟悉的公式&#xff0c;熟悉到根本不知道是咋推出来的其实推导这个公式有两种方法&#xff0c;一种就是靠…

微服务平滑迁移上云最佳实践

作者&#xff1a;草谷 背景 许多企业在做微服务架构改造的时候&#xff0c;在自建还是上云的选择上难以决策&#xff0c;选择上云后&#xff0c;在微服务上云过程中&#xff0c;如何能够做到不影响业务情况下平滑迁移呢&#xff0c;通过阅读本文&#xff0c;你可以快速获得以…

树之基本概念(有图头真相)

文章目录树的概念及结构1.树的概念2.树的相关概念3.树的表示4.树在实际中的应用树的概念及结构 1.树的概念 树是一种非线性的数据结构&#xff0c;它是由n&#xff08;n>0&#xff09;个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树&#…

高项 干系人管理论文

4个过程&#xff1a; 1&#xff0c;识别干系人&#xff1a;识别能影响项目决策、活动或结果的个人、群体或组织&#xff0c;以及被项目、活动或者结果影响的个人、群体或者组织&#xff0c;并分析和记录他们的相关信息的过程。这些信息包括他们的利益、参与度、互相依赖、影响…