使用hive进行大数据项目分析

news2024/9/22 14:26:20

目录

一、首先要创建表:在txt记事本中先输入创建语句备用,创建class1~class5的表。

二、启动hadoop集群,MySQL,hive。

三、创建数据库zhh,用户为zhh,之后将之前写在txt记事本里的创建表class1~class5的命令复制到hive当中:

四、将txt里的数据上传到/data/zhh/class1(class1~class5依次进行)

五、相关大数据分析要求:


一、首先要创建表:在txt记事本中先输入创建语句备用,创建class1~class5的表。

create table class5(

num String comment'this is the xuhao of students',

xuehao String comment 'this is the xuehao of students',

name String comment 'this is the name of student',

banji String comment 'this is the banji of students',

kqbxcj String comment 'this is the kaoqinbiaoxianchengji of students',

pszycj String comment 'this is the pingshizuoyechengji of student',

qimocj String comment 'this is the qimochengji of student',

zhcj String comment'this is the zonghechengji of students'

)

row format delimited fields terminated by ',' stored as textfile

location '/data/zhh/class5';

二、启动hadoop集群,MySQL,hive。

相关命令:

start-all.sh

mysql5.7/support-files /mysql.server start

Hive

三、创建数据库zhh,用户为zhh,之后将之前写在txt记事本里的创建表class1~class5的命令复制到hive当中:

四、将txt里的数据上传到/data/zhh/class1(class1~class5依次进行)

命令:hdfs dfs -put class01.txt  /data/zhh/class

五、相关大数据分析要求:

1、查询2019级1班ETL技术期末考试的综合分数80分以上的学生信息(含80分)。

命令:select *from class1 where zhcj>=80;

2、查询2019级1班ETL技术期末考试考试成绩90分以上的学生信息(含90分)。

 命令:select *from class1 where qimocj>=90;

3、统计2019级1班ETL技术期末考试成绩70分以上的学生人数(含70分)

命令:select count(*) from class1 where qimocj>=70;

4、统计2019级2班ETL技术期末考试成绩及格的学生人数。

命令:select count(*) from class2 where qimocj>=60;

5、统计2019级1班参加ETL技术考试的学生总人数(序号数即为人数则课使用num为关键字查询)

命令:select count(num) from class1;

 

6、统计2019级2班参加ETL技术考试的学生总人数。

命令:select count(num) from class2;

7、统计2019级3班参加ETL技术考试的学生总人数。

命令:select count(*) from class3;

8、统计2019级4班参加ETL技术考试的学生总人数。

命令:select count(*) from class4;

9、统计2019级数据科学与大数据技术全年级的学生总人数。

命令:select count(*) from class5;

10、查询2019级全年级ETL技术的期末考试成绩80分及以上的学生信息。

命令:select * from class5 where qimocj>=80;

11、查询2019级全年级ETL技术的期末综合成绩85分及以上的学生信息。

命令:select * from class5 where qmcj>=85;

12、统计2019级全年级ETL技术的期末综合成绩86分及以上的学生的总人数。

命令:select count(zhcj>=86) from class5 ;

13、查询2019级数据科学与大数据技术1班吉苇同学的学号、以及所有成绩。

命令:select xuehao,name,kqbxcj,qimocj,zhcj from class1 where name=”吉苇”;

14、查询2019级数据科学与大数据技术2班彭艳同学的学号、以及所有成绩。

命令:select xuehao,name,kqbxcj,qimocj,zhcj from class2 where name=”彭艳”;

15、统计2019级1班ETL技术的期末综合成绩不及格的学生人数。

命令:select count(*) from class1 where zhcj>=60;

16、统计2019级全年级ETL技术的期末综合成绩不及格的学生人数。

命令:select count(*) from class5 where zhcj<60;

17、分析出2019级全年级ETL技术的期末考试成绩分布在70-85分之间的学生信息。

命令:select * from class5 where qimocj between 70 and 85;

18、分析出2019级1班ETL技术的期末考试成绩分布在70-79分之间的学生信息。

命令:select * from class1 where qimocj between 70 and 79;

19、分析出2019级2班ETL技术的期末考试成绩分布在60-69分之间的学生信息。

命令:select * from class2 where qimocj between 60 and 69;

20、统计2019级数据科学与大数据技术全年级学生的期末综合成绩80分以上的学生人数(含80分)。

命令:select count(*) from class5 where qimocj>=80;

结束!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/32932.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

浅谈企业信息化安全建设中的三大误区

伴随着信息化的深度建设与应用&#xff0c;与之相伴的信息安全事件也层出不穷&#xff01;很多企业开始关注信息安全问题、关注信息安全建设&#xff0c;大家的共识已经达到前所未有的高度。 虽然许多的企业虽然认识到信息安全的重要性&#xff0c;在实际实施过程中却又无从下…

【附源码】计算机毕业设计JAVA亦心化妆品网站

【附源码】计算机毕业设计JAVA亦心化妆品网站 目运行 环境项配置&#xff1a; Jdk1.8 Tomcat8.5 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; JAVA myba…

【软件测试】我们测试人搭上元宇宙的列车,测试一直在进军......

目录&#xff1a;导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09;前言 虚拟宇宙&#xff0…

微信抽奖小程序开发_分享微信抽奖小程序制作的步骤

各位商家在节日期间做活动的时候&#xff0c;都希望用更少的费用去或者更好的宣传和推广的效果。比较常见的就是抽奖活动小程序。无须玩家下载&#xff0c;通过微信扫码或者指定入口就可以参与。 方便&#xff0c;效果又好。 那么,性价比高的抽奖活动小程序怎么做&#xff1f…

使用 MITRE ATTCK 技术保护您的 Active Directory安全

Active Directory (AD域)保存着企业的敏感数据&#xff0c;例如用户凭据、员工的个人信息、安全权限等。正因为如此&#xff0c;AD域很容易成为网络攻击者的目标。恶意攻击者不断升级新的攻击策略&#xff0c;使企业保护AD域安全成为一项挑战。这就是为什么每个企业都必须制定网…

scratch猫捉老鼠 电子学会图形化编程scratch等级考试一级真题和答案解析2022年9月

目录 scratch猫捉老鼠 一、题目要求 1、准备工作 2、功能实现 二、案例分析

【U8+】用友U8成本管理模块下,定额分配标准中无法取到新增存货的数据。

【问题描述】 用友U8&#xff0c;新增存货后&#xff0c; 在【成本管理】模块下&#xff0c;操作【定额分配标准】取数后&#xff0c;无法取到新增存货数据。 【解决方案】 由于没有过多的研究过用友U8的成本管理模块&#xff0c; 以下过程是在处理该问题时&#xff0c;整理的…

java发送邮件

前言 借用hutool工具&#xff0c;实现多账号发送邮件 相关实现 maven依赖 Hutool对所有第三方都是可选依赖&#xff0c;因此在使用MailUtil时需要自行引入第三方依赖。 <dependency><groupId>cn.hutool</groupId><artifactId>hutool-all</arti…

机器学习笔记之高斯网络(一)基本介绍

机器学习笔记之高斯网络——基本介绍引言回顾&#xff1a;条件独立性概率图模型高斯网络高斯网络介绍高斯网络的条件独立性随机变量之间的边缘独立随机变量之间的条件独立引言 本节将介绍高斯网络 回顾&#xff1a; 条件独立性 在概率图模型——背景介绍中介绍了条件独立性…

Dissertation写作常用的研究方法

英文毕业论文的撰写&#xff0c;有很多值得注意的重要因素&#xff0c;而研究方法的选择无疑是最重要的内容之一。留学毕业论文不同于平常的研究性论文&#xff0c;其难度和复杂程度要大得多&#xff1b;同时&#xff0c;导师对于留学毕业论文的要求又非常严格。因此写好一篇优…

[附源码]SSM计算机毕业设计教务系统JAVA

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

跨境电商卖家必知的【圣诞节营销】终极指南(二)

关键词&#xff1a;圣诞节营销、跨境电商卖家 不知不觉又到了年底&#xff0c;而对于跨境电商来说也是非常重要的一段促销时期&#xff0c;上一篇文章我们探讨了一些圣诞节营销的创意方法&#xff0c;今天我们将告诉您完整的圣诞节营销指南。 1. 闪购和 FOMO 限时抢购是您的电…

ImmunoChemistry艾美捷基本细胞毒性试验试剂盒测定方案

ImmunoChemistry艾美捷基本细胞毒性试验试剂盒是一种通过流式细胞仪测定细胞毒性的单管双色试验。该试验使用绿色荧光细胞染色剂CFSE标记靶细胞&#xff0c;使用红色活/死活性染料7-AAD识别细胞毒性试验样品中存在的死细胞。使用流式细胞仪分析结果。 细胞裂解活性是清除细胞内…

D-012 时钟硬件电路设计

时钟硬件电路设计1 简介2 晶振电路中电容的选择3 时钟电路设计要点4 晶振选型5 电路实战1 简介 晶振时数字电路的心脏&#xff0c;数字电路需要一个稳定的工作时钟信号&#xff0c;时钟电路时硬件电路设计中不可或缺的一个重要内容。晶振一般指晶体振荡器。而在封装内部添加 I…

Shell脚本学习指南(四)——管道的神奇魔力

文章目录前言从结构化文本文件中提取数据针对Web的结构型数据文字解谜好帮手单词列表标签列表前言 当你在UNIX里对付文字处理作业时&#xff0c;必须谨记一个UNIX工具使用原则就是&#xff1a;想清楚这个问题该如何划分为更简单的工作&#xff0c;每个部分是不是已有现成的工具…

Servlet上传文件

一、核心方法 1、HttpServletRequest类相关方法 方法描述Part getPart(String name)获取请求中给定name的文件Collection<Part> getParts()获取所有的文件 2、Part类相关方法 方法描述String getSubmittedFileName()获取文件名String getContentType()获取文件类型…

【Hack The Box】Linux练习-- Knife

HTB 学习笔记 【Hack The Box】Linux练习-- Knife &#x1f525;系列专栏&#xff1a;Hack The Box &#x1f389;欢迎关注&#x1f50e;点赞&#x1f44d;收藏⭐️留言&#x1f4dd; &#x1f4c6;首发时间&#xff1a;&#x1f334;2022年11月17日&#x1f334; &#x1f36…

Docker——镜像操作命令

目录 一、镜像操作命令 1.1 镜像操作命令&#xff08;常用图示&#xff09; 1.2 查看docker帮助文档 1.3 案例&#xff1a;从DockerHub拉取Nginx镜像并查看 1.3.1 拉取 1.3.2 查看 1.4 案例&#xff1a;利用docker save将Nginx镜像导出磁盘&#xff0c;然后再通过load加…

一文讲清场景工程方法论及运维组织能力内化

随着业务支撑要求的变化&#xff0c;和技术架构的升级&#xff0c;运维管理建设模式跟之前也有了很大区别&#xff0c;场景上更注重主动工作、防范风险&#xff0c;而体系上更注重赋能组织、平台化、一体化。 因而&#xff0c;我们基于过去几年的大量客户实践&#xff0c;分享…

关于HashMap默认容量的选择

HashMap默认容量思量什么是容量容量与哈希hash的实现指定容量初始化扩容思考总结集合是Java开发日常开发中经常会使用到的&#xff0c;而作为一种典型的K-V结构的数据结构&#xff0c;HashMap对于Java开发者一定不陌生。 在日常开发中&#xff0c;经常会像如下方式创建一个Has…