HiveSQL初级题目

news2025/1/12 1:54:54

文章目录

  • Hive SQL题库(初级)
    • 第一章 环境准备
      • 1.1 建表语句
      • 1.2 数据准备
      • 1.3 插入数据
    • 第二章 简单查询
      • 2.1 查找特定条件
        • 2.1.1 查询姓名中带“冰”的学生名单
        • 2.1.2 查询姓“王”老师的个数
        • 2.1.3 检索课程编号为“04”且分数小于60的学生的课程信息,结果按分数降序排列
        • 2.1.4 查询数学成绩不及格的学生和其对应的成绩,按照学号升序排序
    • 第三章 汇总分析
      • 3.1 汇总分析
        • 3.1.1 查询编号为“02”的课程的总成绩
        • 3.1.2 查询参加考试的学生个数
      • 3.2 分组
        • 3.2.1 查询各科成绩最高和最低的分,以如下的形式显示:课程号,最高分,最低分
        • 3.2.2 查询每门课程有多少学生参加了考试(有考试成绩)
        • 3.2.3 查询男生、女生人数
      • 3.3 分组结果的条件
        • 3.3.1 查询平均成绩大于60分的学生的学号和平均成绩
        • 3.3.2 查询至少选修四门课程的学生学号
        • 3.3.3 查询同姓(假设每个学生姓名的第一个字为姓)的学生名单并统计同姓人数大于2的姓
        • 3.3.4 查询每门课程的平均成绩,结果按平均成绩升序排序,平均成绩相同时,按课程号降序排列
        • 3.3.5 统计参加考试人数大于等于15的学科
      • 3.4 查询结果排序&分组指定条件
        • 3.4.1 查询学生的总成绩并按照总成绩降序排序
        • 3.4.2 按照如下格式显示学生的语文、数学、英语三科成绩,没有成绩的输出为0,按照学生的有效平均成绩降序显示
        • 3.4.3 查询一共参加三门课程且其中一门为语文课程的学生的id和姓名
    • 第四章 复杂查询
      • 4.1 子查询
        • 4.1.1 查询所有课程成绩均小于60分的学生的学号、姓名
        • 4.1.2 查询没有学全所有课的学生的学号、姓名
        • 4.1.3 查询出只选修了三门课程的全部学生的学号和姓名
    • 第五章 多表查询
      • 5.1 表联结
        • 5.1.1 查询有两门以上的课程不及格的同学的学号及其平均成绩
        • 5.1.2 查询所有学生的学号、姓名、选课数、总成绩
        • 5.1.3 查询平均成绩大于85的所有学生的学号、姓名和平均成绩
        • 5.1.4 查询学生的选课情况:学号,姓名,课程号,课程名称
        • 5.1.5 查询出每门课程的及格人数和不及格人数
        • 5.1.6 查询课程编号为03且课程成绩在80分以上的学生的学号和姓名及课程信息
      • 5.2 多表连接
        • 5.2.1 课程编号为"01"且课程分数小于60,按分数降序排列的学生信息
        • 5.2.2 查询所有课程成绩在70分以上的学生的姓名、课程名称和分数,按分数升序排列
        • 5.2.3 查询该学生不同课程的成绩相同的学生编号、课程编号、学生成绩
        • 5.2.4 查询课程编号为“01”的课程比“02”的课程成绩高的所有学生的学号
        • 5.2.5 查询学过编号为“01”的课程并且也学过编号为“02”的课程的学生的学号、姓名
        • 5.2.6 查询学过“李体音”老师所教的所有课的同学的学号、姓名
        • 5.2.7 查询学过“李体音”老师所讲授的任意一门课程的学生的学号、姓名
        • 5.2.8 查询没学过"李体音"老师讲授的任一门课程的学生姓名
        • 5.2.9 查询至少有一门课与学号为“001”的学生所学课程相同的学生的学号和姓名
        • 5.2.10 按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

Hive SQL题库(初级)

第一章 环境准备

1.1 建表语句

使用default数据库。

-- 创建学生表
DROP TABLE IF EXISTS student;
create table if not exists student_info(
    stu_id string COMMENT '学生id',
    stu_name string COMMENT '学生姓名',
    birthday string COMMENT '出生日期',
    sex string COMMENT '性别'
) 
row format delimited fields terminated by ',' 
stored as textfile;

-- 创建课程表
DROP TABLE IF EXISTS course;
create table if not exists course_info(
    course_id string COMMENT '课程id',
    course_name string COMMENT '课程名',
    tea_id string COMMENT '任课老师id'
) 
row format delimited fields terminated by ',' 
stored as textfile;

-- 创建老师表
DROP TABLE IF EXISTS teacher;
create table if not exists teacher_info(
    tea_id string COMMENT '老师id',
    tea_name string COMMENT '学生姓名'
) 
row format delimited fields terminated by ',' 
stored as textfile;

-- 创建分数表
DROP TABLE IF EXISTS score;
create table if not exists score_info(
    stu_id string COMMENT '学生id',
    course_id string COMMENT '课程id',
    score int COMMENT '成绩'
) 
row format delimited fields terminated by ',' 
stored as textfile;

1.2 数据准备

(1)创建/opt/module/data目录

mkdir -p /opt/module/data

(2)将如下4个文件放到/opt/module/data目录下

vim student_info.txt

student_info.txt文件内容如下:

001,彭于晏,1995-05-16,男
002,胡歌,1994-03-20,男
003,周杰伦,1995-04-30,男
004,刘德华,1998-08-28,男
005,唐国强,1993-09-10,男
006,陈道明,1992-11-12,男
007,陈坤,1999-04-09,男
008,吴京,1994-02-06,男
009,郭德纲,1992-12-05,男
010,于谦,1998-08-23,男
011,潘长江,1995-05-27,男
012,杨紫,1996-12-21,女
013,蒋欣,1997-11-08,女
014,赵丽颖,1990-01-09,女
015,刘亦菲,1993-01-14,女
016,周冬雨,1990-06-18,女
017,范冰冰,1992-07-04,女
018,李冰冰,1993-09-24,女
019,邓紫棋,1994-08-31,女
020,宋丹丹,1991-03-01,女
vim course_info.txt

course_info.txt文件内容如下:

01,语文,1003
02,数学,1001
03,英语,1004
04,体育,1002
05,音乐,1002
vim teacher_info.txt

teacher_info.txt文件内容如下:

1001,张高数
1002,李体音
1003,王子文
1004,刘丽英
vim score_info.txt

score_info.txt文件内容如下:

001,01,94
002,01,74
004,01,85
005,01,64
006,01,71
007,01,48
008,01,56
009,01,75
010,01,84
011,01,61
012,01,44
013,01,47
014,01,81
015,01,90
016,01,71
017,01,58
018,01,38
019,01,46
020,01,89
001,02,63
002,02,84
004,02,93
005,02,44
006,02,90
007,02,55
008,02,34
009,02,78
010,02,68
011,02,49
012,02,74
013,02,35
014,02,39
015,02,48
016,02,89
017,02,34
018,02,58
019,02,39
020,02,59
001,03,79
002,03,87
004,03,89
005,03,99
006,03,59
007,03,70
008,03,39
009,03,60
010,03,47
011,03,70
012,03,62
013,03,93
014,03,32
015,03,84
016,03,71
017,03,55
018,03,49
019,03,93
020,03,81
001,04,54
002,04,100
004,04,59
005,04,85
007,04,63
009,04,79
010,04,34
013,04,69
014,04,40
016,04,94
017,04,34
020,04,50
005,05,85
007,05,63
009,05,79
015,05,59
018,05,87

1.3 插入数据

(1)插入数据

load data local inpath '/opt/module/data/student_info.txt' into table student_info;
load data local inpath '/opt/module/data/course_info.txt' into table course_info;
load data local inpath '/opt/module/data/teacher_info.txt' into table teacher_info;
load data local inpath '/opt/module/data/score_info.txt' into table score_info;

image-20230609091520291

(2)验证插入数据情况

select * from student_info limit 5;

image-20230609091615282

select * from course_info limit 5;

image-20230609091645273

select * from teacher_info limit 5;

image-20230609091711933

select * from score_info limit 5;

image-20230609091818136

第二章 简单查询

2.1 查找特定条件

2.1.1 查询姓名中带“冰”的学生名单

视频地址: https://www.bilibili.com/video/BV1g84y147sX/?p=47&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

select
    *
from student_info
where stu_name like "%冰%";

结果:

image-20230609091947250

2.1.2 查询姓“王”老师的个数

select 
    count(*)  wang_count
from teacher_info
where tea_name like '王%';

结果:

image-20230609092207494

2.1.3 检索课程编号为“04”且分数小于60的学生的课程信息,结果按分数降序排列

视频地址:

048-Hive-初级题目-2.1.3

select
    stu_id,
    course_id,
    score
from score_info
where course_id ='04' and score<60
order by score desc;

结果:

image-20230609092529305

2.1.4 查询数学成绩不及格的学生和其对应的成绩,按照学号升序排序

视频地址: https://www.bilibili.com/video/BV1g84y147sX/?p=49&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

实现思路:

image-20230609100217094

SQL实现:

select
    s.stu_id,
    s.stu_name,
    t1.score
from student_info s
join (
    select
        *
    from score_info
    where course_id=(select course_id from course_info where course_name='数学') and score < 60
    ) t1 on s.stu_id = t1.stu_id
order by s.stu_id;

结果为:

image-20230609100304634

第三章 汇总分析

3.1 汇总分析

3.1.1 查询编号为“02”的课程的总成绩

视频地址: https://www.bilibili.com/video/BV1g84y147sX/?p=50&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

select
    course_id,
    sum(score) score_sum
from score_info
where course_id='02'
group by course_id;

结果为:

course_id    score_sum  
02           1133 

这个语句可以执行:

select
    sum(score) score_sum
from score_info
where course_id='02';

但是加上course_id会报错,原因是缺少group by:

image-20230609100927367

3.1.2 查询参加考试的学生个数

思路:对成绩表中的学号做去重并count

select
    count(distinct stu_id) stu_num
from score_info;

结果为:

stu_num
19

3.2 分组

3.2.1 查询各科成绩最高和最低的分,以如下的形式显示:课程号,最高分,最低分

视频地址: https://www.bilibili.com/video/BV1g84y147sX/?p=51&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

思路:按照学科分组并使用max和min。

select
    course_id,
    max(score) max_score,
    min(score) min_score
from score_info
group by course_id
order by course_id;

结果为:

course_id       max_score       min_score
01      		94      		38
02      		93      		34
03      		99      		32
04      		100     		34
05      		87      		59

3.2.2 查询每门课程有多少学生参加了考试(有考试成绩)

视频地址: https://www.bilibili.com/video/BV1g84y147sX/?p=52&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

思路:根据课程进行分组,统计学生个数。

select
    course_id,
    count(stu_id) stu_num
from score_info
group by course_id
order by course_id;

结果为:

course_id       stu_num
01      		19
02      		19
03      		19
04      		12
05      		5

3.2.3 查询男生、女生人数

select
    sex,
    count(stu_id) count
from student_info
group by sex;

结果为:

sex     count
女      9
男      11

3.3 分组结果的条件

3.3.1 查询平均成绩大于60分的学生的学号和平均成绩

1)思路分析

(1)平均成绩:展开来说就是计算每个学生的平均成绩

(2)这里涉及到“每个”就是要分组了

(3)平均成绩大于60分,就是对分组结果指定条件

(4)首先要分组求出每个学生的平均成绩,筛选高于60分的,并反查出这批学生,统计出这些学生总的平均成绩。

2)Hql实操

select
    stu_id,
    avg(score) score_avg
from score_info
group by stu_id
having score_avg > 60
order by stu_id;

结果为:

stu_id  score_avg
001     72.5
002     86.25
004     81.5
005     75.4
006     73.33333333333333
009     74.2
013     61.0
015     70.25
016     81.25
020     69.75

3.3.2 查询至少选修四门课程的学生学号

1)思路分析

(1)需要先计算出每个学生选修的课程数据,需要按学号分组

(2)至少选修两门课程:也就是每个学生选修课程数目>=4,对分组结果指定条件

2)Hql实操

select
    stu_id,
    count(course_id) course_count
from score_info
group by stu_id
having course_count >=4
order by stu_id;

结果为:

stu_id  course_count
001     4
002     4
004     4
005     5
007     5
009     5
010     4
013     4
014     4
015     4
016     4
017     4
018     4
020     4

3.3.3 查询同姓(假设每个学生姓名的第一个字为姓)的学生名单并统计同姓人数大于2的姓

1)思路分析

视频链接: https://www.bilibili.com/video/BV1g84y147sX/?p=68&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

思路:先提取出每个学生的姓并分组,如果分组的count>=2则为同姓

函数说明:

语法:substring(string A, int start, int len) 
返回值:string
说明:返回字符串A从start位置开始,长度为len的字符串

2)Hql实操

select
    t1.first_name,
    count(*) count_first_name
from (
         select
             stu_id,
             substr(stu_name,0,1) first_name
         from student_info
) t1
group by t1.first_name
having count_first_name >= 2;

结果为:

t1.first_name   count_first_name
周      		    2
刘      			2
陈      			2

3.3.4 查询每门课程的平均成绩,结果按平均成绩升序排序,平均成绩相同时,按课程号降序排列

1)思路分析

按照课程号分组并求组内的平均值

2)Hql实操

select
    course_id,
    avg(score) score_avg
from score_info
group by course_id
order by score_avg, course_id desc;

结果为:

course_id       score_avg
02      		59.63157894736842
04      		63.416666666666664
01      		67.15789473684211
03      		69.42105263157895
05      		74.6

3.3.5 统计参加考试人数大于等于15的学科

1)思路分析

按课程分组并统计组内人数,过滤条件大于等于15

2)Hql实操

select
    course_id,
    count(stu_id) stu_count
from score_info
group by course_id
having stu_count >= 15;

结果为:

course_id       stu_count
03      		19
02      		19
01      		19

3.4 查询结果排序&分组指定条件

3.4.1 查询学生的总成绩并按照总成绩降序排序

1)思路分析

分组、sum、排序

2)Hql实操

select
    stu_id,
    sum(score) sum_score
from score_info
group by stu_id
order by sum_score desc;

结果为:

stu_id  sum_score
005     377
009     371
002     345
004     326
016     325
007     299
001     290
015     281
020     279
013     244
010     233
018     232
006     220
014     192
017     181
012     180
011     180
019     178
008     129

3.4.2 按照如下格式显示学生的语文、数学、英语三科成绩,没有成绩的输出为0,按照学生的有效平均成绩降序显示

学生id	语文	数学	英语	有效课程数	有效平均成绩

1)思路分析

实现1: https://www.bilibili.com/video/BV1g84y147sX/?p=53&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

实现2: https://www.bilibili.com/video/BV1g84y147sX/?p=69&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

2)Hql实操

SQL实现1:

-- nvl(a,b):如果a不为null,则返回a,否则返回b
-- coalesce:增强版的nvl
select t4.stu_id,
       nvl(t1.score, 0) `语文`,
       nvl(t2.score, 0) `数学`,
       nvl(t3.score, 0) `英语`,
       cnt              `有效课程数`,
       avg_score        `平均成绩`
from (select stu_id, score
      from score_info -- 语文
      where course_id = '01') t1
         full outer join
     (select stu_id, score
      from score_info-- 数学
      where course_id = '02') t2
     on t1.stu_id = t2.stu_id
         full outer join
     (select stu_id, score
      from score_info -- 英语
      where course_id = '03') t3
     on nvl(t1.stu_id, t2.stu_id) = t3.stu_id
         right outer join
     (select stu_id, count(*) cnt, avg(score) avg_score
      from score_info
      group by stu_id) t4
     on coalesce(t1.stu_id, t2.stu_id, t3.stu_id) = t4.stu_id;

SQL实现2:

-- sum(if()):有条件的聚合
select
  si.stu_id,
  sum(if(ci.course_name='语文',score,0))  `语文`,
  sum(if(ci.course_name='数学',score,0))  `数学`,
  sum(if(ci.course_name='英语',score,0))  `英语`,
  count(*)  `有效课程数`,
  avg(si.score)  `平均成绩`
from
  score_info si
join
  course_info ci
on
  si.course_id=ci.course_id
group by
  si.stu_id
order by
  `平均成绩` desc;

结果为:

si.stu_id       语文    数学    英语    有效课程数      平均成绩
002     		74      84      87      4       	86.25
004     		85      93      89      4       	81.5
016     		71      89      71      4       	81.25
005     		64      44      99      5       	75.4
009     		75      78      60      5       	74.2
006     		71      90      59      3       	73.33333333333333
001     		94      63      79      4       	72.5
015     		90      48      84      4       	70.25
020     		89      59      81      4       	69.75
013     		47      35      93      4       	61.0
012     		44      74      62      3       	60.0
011     		61      49      70      3       	60.0
007     		48      55      70      5       	59.8
019     		46      39      93      3       	59.333333333333336
010     		84      68      47      4       	58.25
018     		38      58      49      4       	58.0
014     		81      39      32      4       	48.0
017     		58      34      55      4       	45.25
008     		56      34      39      3       	43.0

3.4.3 查询一共参加三门课程且其中一门为语文课程的学生的id和姓名

思路:两个筛选条件:一共参加三门课程,其中一门为语文;两张表:score_info,student_info。

SQL实现1:

select stu_id, stu_name
from student_info as stu
where stu.stu_id in
      (select t.stu_id
       from score_info as s
                right outer join
            (select stu_id, count(score) cnt
             from score_info
             group by stu_id
             having cnt = 3) t
            on s.stu_id = t.stu_id
       where course_id = '01');

SQL实现2:

第四章 复杂查询

4.1 子查询

4.1.1 查询所有课程成绩均小于60分的学生的学号、姓名

视频链接: https://www.bilibili.com/video/BV1g84y147sX/?p=70&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

select s.stu_id,
       s.stu_name
from (
         select stu_id,
                sum(if(score >= 60, 1, 0)) flag
         from score_info
         group by stu_id
         having flag = 0
     ) t1
         join student_info s on s.stu_id = t1.stu_id;

输出结果为:

s.stu_id  s.stu_name
008          吴京
017          范冰冰

4.1.2 查询没有学全所有课的学生的学号、姓名

思路:没有学全所有课,也就是该学生选修的课程数 < 总的课程数

select
    s.stu_id,
    s.stu_name
from student_info s
left join score_info sc on s.stu_id = sc.stu_id
group by s.stu_id, s.stu_name
having count(course_id) < (select count(course_id) from course_info)
order by s.stu_id;

输出结果为:

s.stu_id  s.stu_name
001       彭于晏
002       胡歌
003       周杰伦
004       刘德华
006       陈道明
008       吴京
010       于谦
011       潘长江
012       杨紫
013       蒋欣
014       赵丽颖
015       刘亦菲
016       周冬雨
017       范冰冰
018       李冰冰
019       邓紫棋
020       宋丹丹

4.1.3 查询出只选修了三门课程的全部学生的学号和姓名

解释:学生选修的课程数 = 3

select
    s.stu_id,
    s.stu_name
from student_info s
left join score_info sc on s.stu_id = sc.stu_id
group by s.stu_id, s.stu_name
having count(course_id) = 3
order by s.stu_id;

输出结果为:

s.stu_id  s.stu_name
006       陈道明
008       吴京
011       潘长江
012       杨紫
019       邓紫棋

第五章 多表查询

5.1 表联结

5.1.1 查询有两门以上的课程不及格的同学的学号及其平均成绩

视频链接:https://www.bilibili.com/video/BV1g84y147sX/?p=71&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

先找出有两门以上不及格的学生名单,按照学生分组,过滤组内成绩低于60的并进行count,count>=2,然后使用avg统计平均成绩。

select stu_id, avg(score) avg_score
from score_info
group by stu_id
having sum(if(score < 60, 1, 0)) >= 2
order by stu_id;

结果

t1.stu_id       t2.avg_score
007           59.8
008           43.0
010           58.25
013           61.0
014           48.0
015           70.25
017           45.25
018           58.0
019           59.333333333333336
020           69.75

5.1.2 查询所有学生的学号、姓名、选课数、总成绩

select s.stu_id, stu_name, count(course_id) cnt, sum(nvl(score, 0)) score_sum
from student_info s
         left outer join score_info si on s.stu_id = si.stu_id
group by s.stu_id, stu_name
order by s.stu_id;

没有周杰伦的成绩,直接使用sum得到的是null。

结果

stu_id      stu_name    course_count    course_sum
001           彭于晏              4              290
002           胡歌                4              345
003	           周杰伦              0              0
004           刘德华              4              326
005           唐国强              5              377
006           陈道明              3              220
007           陈坤                5              299
008           吴京                3              129
009           郭德纲              5              371
010           于谦                4              233
011           潘长江              3              180
012           杨紫                3              180
013           蒋欣                4              244
014           赵丽颖              4              192
015           刘亦菲              4              281
016           周冬雨              4              325
017           范冰冰              4              181
018           李冰冰              4              232
019           邓紫棋              3              178
020           宋丹丹              4              279

5.1.3 查询平均成绩大于85的所有学生的学号、姓名和平均成绩

思路:使用score_info表左连接student_info表,根据stu_id, stu_name分组,然后筛选出平均成绩大于85的学号。

select si.stu_id, stu_name, avg(score) avg_score
from score_info si
         left outer join student_info s on si.stu_id = s.stu_id
group by si.stu_id, stu_name
having avg_score > 85;

结果

stu_id        stu_name      avg_score
002           胡歌            86.25

5.1.4 查询学生的选课情况:学号,姓名,课程号,课程名称

思路:将student_info、course_info、score_info表进行连接。

select s.stu_id, stu_name, si.course_id, course_name
from student_info s
         join score_info si on s.stu_id = si.stu_id
         join course_info ci on si.course_id = ci.course_id;

结果:

s.stu_id        stu_name        si.course_id    course_name
001     彭于晏  01      语文
002     胡歌    01      语文
004     刘德华  01      语文
005     唐国强  01      语文
006     陈道明  01      语文
007     陈坤    01      语文
008     吴京    01      语文
009     郭德纲  01      语文
010     于谦    01      语文
011     潘长江  01      语文
012     杨紫    01      语文
013     蒋欣    01      语文
014     赵丽颖  01      语文
015     刘亦菲  01      语文
016     周冬雨  01      语文
017     范冰冰  01      语文
018     李冰冰  01      语文
019     邓紫棋  01      语文
020     宋丹丹  01      语文
001     彭于晏  02      数学
002     胡歌    02      数学
004     刘德华  02      数学
005     唐国强  02      数学
006     陈道明  02      数学
007     陈坤    02      数学
008     吴京    02      数学
009     郭德纲  02      数学
010     于谦    02      数学
011     潘长江  02      数学
012     杨紫    02      数学
013     蒋欣    02      数学
014     赵丽颖  02      数学
015     刘亦菲  02      数学
016     周冬雨  02      数学
017     范冰冰  02      数学
018     李冰冰  02      数学
019     邓紫棋  02      数学
020     宋丹丹  02      数学
001     彭于晏  03      英语
002     胡歌    03      英语
004     刘德华  03      英语
005     唐国强  03      英语
006     陈道明  03      英语
007     陈坤    03      英语
008     吴京    03      英语
009     郭德纲  03      英语
010     于谦    03      英语
011     潘长江  03      英语
012     杨紫    03      英语
013     蒋欣    03      英语
014     赵丽颖  03      英语
015     刘亦菲  03      英语
016     周冬雨  03      英语
017     范冰冰  03      英语
018     李冰冰  03      英语
019     邓紫棋  03      英语
020     宋丹丹  03      英语
001     彭于晏  04      体育
002     胡歌    04      体育
004     刘德华  04      体育
005     唐国强  04      体育
007     陈坤    04      体育
009     郭德纲  04      体育
010     于谦    04      体育
013     蒋欣    04      体育
014     赵丽颖  04      体育
016     周冬雨  04      体育
017     范冰冰  04      体育
020     宋丹丹  04      体育
005     唐国强  05      音乐
007     陈坤    05      音乐
009     郭德纲  05      音乐
015     刘亦菲  05      音乐
018     李冰冰  05      音乐
Time taken: 22.912 seconds, Fetched: 74 row(s)

5.1.5 查询出每门课程的及格人数和不及格人数

思路:score_info表根据course_id进行分组,然后统计及格人数和不及格人数,最后连接course_info。

select c.course_id,
       c.course_name,
       t1.`及格人数`,
       t1.`不及格人数`
from course_info c
         join (
    select course_id,
           sum(if(score >= 60, 1, 0)) as `及格人数`,
           sum(if(score < 60, 1, 0))  as `不及格人数`
    from score_info
    group by course_id
) t1 on c.course_id = t1.course_id
order by c.course_id;

结果

c.course_id     c.course_name   t1.及格人数     t1.不及格人数
01            	语文             12            7
02            	数学             8             11
03            	英语             13            6
04            	体育             6             6
05            	音乐             4             1
Time taken: 10.746 seconds, Fetched: 5 row(s)

5.1.6 查询课程编号为03且课程成绩在80分以上的学生的学号和姓名及课程信息

思路:score_info表查询course_id='03'并且score > 80的学生,然后连接

select s.stu_id,
       s.stu_name,
       t1.score,
       t1.course_id,
       c.course_name
from student_info s
         join (
    select stu_id,
           score,
           course_id
    from score_info
    where score > 80
      and course_id = '03'
) t1
              on s.stu_id = t1.stu_id
         join course_info c on c.course_id = t1.course_id;

结果:

s.stu_id        s.stu_name      t1.score       t1.course_id    c.course_name
002             胡歌             87             03             英语
004             刘德华           89             03             英语
005             唐国强           99             03             英语
013             蒋欣             93             03             英语
015             刘亦菲           84             03             英语
019             邓紫棋           93             03             英语
020             宋丹丹           81             03             英语
Time taken: 9.064 seconds, Fetched: 7 row(s)

5.2 多表连接

5.2.1 课程编号为"01"且课程分数小于60,按分数降序排列的学生信息

select s.stu_id,
       s.stu_name,
       s.birthday,
       s.sex,
       t1.score
from student_info s
         join (
    select stu_id,
           course_id,
           score
    from score_info
    where score < 60
      and course_id = '01'
) t1
              on s.stu_id = t1.stu_id
order by t1.score desc;

结果

s.stu_id        s.stu_name      s.birthday      s.sex   t1.score
017     		范冰冰  		  1992-07-04      女      58
008     		吴京   		   1994-02-06      男      56
007     		陈坤    		   1999-04-09      男      48
013     		蒋欣    		   1997-11-08      女      47
019     		邓紫棋           1994-08-31      女      46
012     		杨紫             1996-12-21      女      44
018     		李冰冰           1993-09-24      女      38
Time taken: 2.29 seconds, Fetched: 7 row(s)

5.2.2 查询所有课程成绩在70分以上的学生的姓名、课程名称和分数,按分数升序排列

select
    s.stu_id,
    s.stu_name,
    c.course_name,
    s2.score
from student_info s
join (
    select
        stu_id,
        sum(if(score >= 70,0,1)) flage
    from score_info
    group by stu_id
    having flage =0
    ) t1
on s.stu_id = t1.stu_id
left join score_info s2 on s.stu_id = s2.stu_id
left join course_info c on s2.course_id = c.course_id;

结果

s.stu_id        s.stu_name      c.course_name   s2.score
002     胡歌    语文    74
002     胡歌    体育    100
002     胡歌    英语    87
002     胡歌    数学    84
016     周冬雨  语文    71
016     周冬雨  体育    94
016     周冬雨  英语    71
016     周冬雨  数学    89
Time taken: 22.456 seconds, Fetched: 8 row(s)

5.2.3 查询该学生不同课程的成绩相同的学生编号、课程编号、学生成绩

select sc1.stu_id,
       sc1.course_id,
       sc1.score
from score_info sc1
         join score_info sc2 on sc1.stu_id = sc2.stu_id
    and sc1.course_id <> sc2.course_id
    and sc1.score = sc2.score;

结果:

sc1.stu_id      sc1.course_id   sc1.score
016     01      71
017     02      34
016     03      71
005     04      85
007     04      63
009     04      79
017     04      34
005     05      85
007     05      63
009     05      79
Time taken: 2.689 seconds, Fetched: 10 row(s)

5.2.4 查询课程编号为“01”的课程比“02”的课程成绩高的所有学生的学号

知识点:多表连接 + 条件

select s1.stu_id
from (
         select sc1.stu_id,
                sc1.course_id,
                sc1.score
         from score_info sc1
         where sc1.course_id = '01'
     ) s1
         join
     (
         select sc2.stu_id,
                sc2.course_id,
                score
         from score_info sc2
         where sc2.course_id = "02"
     ) s2
     on s1.stu_id = s2.stu_id
where s1.score > s2.score;

结果

s1.stu_id
001
005
008
010
011
013
014
015
017
019
020
Time taken: 2.467 seconds, Fetched: 11 row(s)

5.2.5 查询学过编号为“01”的课程并且也学过编号为“02”的课程的学生的学号、姓名

select t1.stu_id  as `学号`,
       s.stu_name as `姓名`
from (
         select stu_id
         from score_info sc1
         where sc1.course_id = '01'
           and stu_id in (
             select stu_id
             from score_info sc2
             where sc2.course_id = '02'
         )
     ) t1
         join student_info s
              on t1.stu_id = s.stu_id;

结果

学号    姓名
001     彭于晏
002     胡歌
004     刘德华
005     唐国强
006     陈道明
007     陈坤
008     吴京
009     郭德纲
010     于谦
011     潘长江
012     杨紫
013     蒋欣
014     赵丽颖
015     刘亦菲
016     周冬雨
017     范冰冰
018     李冰冰
019     邓紫棋
020     宋丹丹
Time taken: 2.448 seconds, Fetched: 19 row(s)

5.2.6 查询学过“李体音”老师所教的所有课的同学的学号、姓名

视频地址: https://www.bilibili.com/video/BV1g84y147sX/?p=72&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

思路:“李体音”老师–>course_id–>stu_id–>stu_name

select t1.stu_id,
       si.stu_name
from (
         select stu_id
         from score_info si
         where course_id in
               (
                   select course_id
                   from course_info c
                            join teacher_info t
                                 on c.tea_id = t.tea_id
                   where tea_name = '李体音' --李体音教的所有课程
               )
         group by stu_id
         having count(*) = 2 --学习所有课程的学生
     ) t1
         left join student_info si
                   on t1.stu_id = si.stu_id;

结果

t1.stu_id       si.stu_name
009     郭德纲
005     唐国强
007     陈坤
Time taken: 4.62 seconds, Fetched: 3 row(s)

5.2.7 查询学过“李体音”老师所讲授的任意一门课程的学生的学号、姓名

视频地址:https://www.bilibili.com/video/BV1g84y147sX/?p=73&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

select t1.stu_id,
       si.stu_name
from (
         select stu_id
         from score_info si
         where course_id in
               (
                   select course_id
                   from course_info c
                            join teacher_info t
                                 on c.tea_id = t.tea_id
                   where tea_name = '李体音'
               )
         group by stu_id
     ) t1
         left join student_info si
                   on t1.stu_id = si.stu_id;

结果

t1.stu_id       si.stu_name
002     胡歌
017     范冰冰
009     郭德纲
001     彭于晏
016     周冬雨
013     蒋欣
005     唐国强
010     于谦
015     刘亦菲
018     李冰冰
020     宋丹丹
014     赵丽颖
007     陈坤
004     刘德华
Time taken: 4.58 seconds, Fetched: 14 row(s)

5.2.8 查询没学过"李体音"老师讲授的任一门课程的学生姓名

视频地址: https://www.bilibili.com/video/BV1g84y147sX/?p=74&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

select stu_id,
       stu_name
from student_info
where stu_id not in
      (
          select stu_id
          from score_info si
          where course_id in
                (
                    select course_id
                    from course_info c
                             join teacher_info t
                                  on c.tea_id = t.tea_id
                    where tea_name = '李体音'
                )
          group by stu_id
      );

结果

stu_id  stu_name
003     周杰伦
006     陈道明
008     吴京
011     潘长江
012     杨紫
019     邓紫棋
Time taken: 6.686 seconds, Fetched: 6 row(s)

5.2.9 查询至少有一门课与学号为“001”的学生所学课程相同的学生的学号和姓名

视频地址:https://www.bilibili.com/video/BV1g84y147sX/?p=75&share_source=copy_web&vd_source=e6e32ebc65d9be6b5ec630207a388b36

select si.stu_id,
       si.stu_name
from score_info sc
         join student_info si
              on sc.stu_id = si.stu_id
where sc.course_id in
      (
          select course_id
          from score_info
          where stu_id = '001' --001的课程
      )
  and sc.stu_id <> '001' --排除001学生
group by si.stu_id, si.stu_name;

结果

si.stu_id       si.stu_name
009     郭德纲
018     李冰冰
004     刘德华
020     宋丹丹
012     杨紫
011     潘长江
013     蒋欣
010     于谦
014     赵丽颖
016     周冬雨
002     胡歌
006     陈道明
008     吴京
005     唐国强
019     邓紫棋
015     刘亦菲
007     陈坤
017     范冰冰
Time taken: 2.359 seconds, Fetched: 18 row(s)

5.2.10 按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩

实现1:

select si.stu_name,
       ci.course_name,
       sc.score,
       t1.avg_score
from score_info sc
         join student_info si
              on sc.stu_id = si.stu_id
         join course_info ci
              on sc.course_id = ci.course_id
         join
     (
         select stu_id,
                avg(score) avg_score
         from score_info
         group by stu_id
     ) t1
     on sc.stu_id = t1.stu_id
order by t1.avg_score desc;

结果:

si.stu_name     ci.course_name  sc.score        t1.avg_score
胡歌    语文    74      86.25
胡歌    数学    84      86.25
胡歌    英语    87      86.25
胡歌    体育    100     86.25
刘德华  语文    85      81.5
刘德华  数学    93      81.5
刘德华  英语    89      81.5
刘德华  体育    59      81.5
周冬雨  语文    71      81.25
周冬雨  数学    89      81.25
周冬雨  英语    71      81.25
周冬雨  体育    94      81.25
唐国强  语文    64      75.4
唐国强  数学    44      75.4
唐国强  英语    99      75.4
唐国强  体育    85      75.4
唐国强  音乐    85      75.4
郭德纲  语文    75      74.2
郭德纲  数学    78      74.2
郭德纲  英语    60      74.2
郭德纲  体育    79      74.2
郭德纲  音乐    79      74.2
陈道明  语文    71      73.33333333333333
陈道明  数学    90      73.33333333333333
陈道明  英语    59      73.33333333333333
彭于晏  语文    94      72.5
彭于晏  数学    63      72.5
彭于晏  英语    79      72.5
彭于晏  体育    54      72.5
刘亦菲  语文    90      70.25
刘亦菲  数学    48      70.25
刘亦菲  英语    84      70.25
刘亦菲  音乐    59      70.25
宋丹丹  语文    89      69.75
宋丹丹  数学    59      69.75
宋丹丹  英语    81      69.75
宋丹丹  体育    50      69.75
蒋欣    语文    47      61.0
蒋欣    数学    35      61.0
蒋欣    英语    93      61.0
蒋欣    体育    69      61.0
潘长江  语文    61      60.0
杨紫    语文    44      60.0
潘长江  数学    49      60.0
杨紫    数学    74      60.0
潘长江  英语    70      60.0
杨紫    英语    62      60.0
陈坤    语文    48      59.8
陈坤    数学    55      59.8
陈坤    英语    70      59.8
陈坤    体育    63      59.8
陈坤    音乐    63      59.8
邓紫棋  语文    46      59.333333333333336
邓紫棋  数学    39      59.333333333333336
邓紫棋  英语    93      59.333333333333336
于谦    语文    84      58.25
于谦    数学    68      58.25
于谦    英语    47      58.25
于谦    体育    34      58.25
李冰冰  语文    38      58.0
李冰冰  数学    58      58.0
李冰冰  英语    49      58.0
李冰冰  音乐    87      58.0
赵丽颖  语文    81      48.0
赵丽颖  数学    39      48.0
赵丽颖  英语    32      48.0
赵丽颖  体育    40      48.0
范冰冰  语文    58      45.25
范冰冰  数学    34      45.25
范冰冰  英语    55      45.25
范冰冰  体育    34      45.25
吴京    语文    56      43.0
吴京    数学    34      43.0
吴京    英语    39      43.0
Time taken: 2.558 seconds, Fetched: 74 row(s)

实现2:

select s.stu_name,
       sum(if(ci.course_name = '语文', score, 0)) `语文`,
       sum(if(ci.course_name = '数学', score, 0)) `数学`,
       sum(if(ci.course_name = '英语', score, 0)) `英语`,
       sum(if(ci.course_name = '体育', score, 0)) `体育`,
       sum(if(ci.course_name = '音乐', score, 0)) `音乐`,
       avg(si.score)                            `平均成绩`
from score_info si
         join
     course_info ci
     on
         si.course_id = ci.course_id
         join student_info s on si.stu_id = s.stu_id
group by si.stu_id, s.stu_name
order by `平均成绩` desc;

结果为:

s.stu_name      语文    数学    英语    体育    音乐    平均成绩
胡歌    74      84      87      100     0       86.25
刘德华  85      93      89      59      0       81.5
周冬雨  71      89      71      94      0       81.25
唐国强  64      44      99      85      85      75.4
郭德纲  75      78      60      79      79      74.2
陈道明  71      90      59      0       0       73.33333333333333
彭于晏  94      63      79      54      0       72.5
刘亦菲  90      48      84      0       59      70.25
宋丹丹  89      59      81      50      0       69.75
蒋欣    47      35      93      69      0       61.0
杨紫    44      74      62      0       0       60.0
潘长江  61      49      70      0       0       60.0
陈坤    48      55      70      63      63      59.8
邓紫棋  46      39      93      0       0       59.333333333333336
于谦    84      68      47      34      0       58.25
李冰冰  38      58      49      0       87      58.0
赵丽颖  81      39      32      40      0       48.0
范冰冰  58      34      55      34      0       45.25
吴京    56      34      39      0       0       43.0
Time taken: 2.456 seconds, Fetched: 19 row(s)

参考文章:

尚硅谷大数据Hive 3.x教程全新升级版(基于hive3.1.3)
p46-p53
p67-p75

, sum(if(ci.course_name = '英语', score, 0)) 英语, sum(if(ci.course_name = '体育', score, 0)) 体育, sum(if(ci.course_name = '音乐', score, 0)) 音乐, avg(si.score) 平均成绩from score_info si join course_info ci on si.course_id = ci.course_id join student_info s on si.stu_id = s.stu_id group by si.stu_id, s.stu_name order by平均成绩` desc;


结果为:

s.stu_name 语文 数学 英语 体育 音乐 平均成绩
胡歌 74 84 87 100 0 86.25
刘德华 85 93 89 59 0 81.5
周冬雨 71 89 71 94 0 81.25
唐国强 64 44 99 85 85 75.4
郭德纲 75 78 60 79 79 74.2
陈道明 71 90 59 0 0 73.33333333333333
彭于晏 94 63 79 54 0 72.5
刘亦菲 90 48 84 0 59 70.25
宋丹丹 89 59 81 50 0 69.75
蒋欣 47 35 93 69 0 61.0
杨紫 44 74 62 0 0 60.0
潘长江 61 49 70 0 0 60.0
陈坤 48 55 70 63 63 59.8
邓紫棋 46 39 93 0 0 59.333333333333336
于谦 84 68 47 34 0 58.25
李冰冰 38 58 49 0 87 58.0
赵丽颖 81 39 32 40 0 48.0
范冰冰 58 34 55 34 0 45.25
吴京 56 34 39 0 0 43.0
Time taken: 2.456 seconds, Fetched: 19 row(s)




参考文章:

尚硅谷大数据Hive 3.x教程全新升级版(基于hive3.1.3)
p46-p53
p67-p75


本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/629539.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

chatgpt赋能python:Python如何保存文件到文件夹?

Python如何保存文件到文件夹&#xff1f; Python是一种高级编程语言&#xff0c;广泛应用于数据科学、网络编程、自动化任务等领域。其中&#xff0c;保存文件到文件夹是Python编程中的重要功能。本文将介绍Python如何保存文件到文件夹的方法&#xff0c;包括如何创建文件夹和…

动态网站JSP技术

文章目录 零、本节学习目标一、JSP概述&#xff08;一&#xff09;什么是JSP1、JSP的概念2、JSP的特征&#xff08;二&#xff09;编写第一个JSP1、创建Web项目2、修改Artifact名称&#xff0c;重新部署项目3、创建欢迎JSP页面4、启动服务器&#xff0c;查看结果 二、JSP基本语…

chatgpt赋能python:Python怎么产生方波?

Python怎么产生方波&#xff1f; 随着科技的发展&#xff0c;数字信号处理在各个领域都有广泛的应用&#xff0c;产生方波是其中一个基础的信号处理技术。在Python中&#xff0c;可以通过一些简单的代码来产生方波信号。本文将介绍如何使用Python产生方波。 什么是方波信号&a…

牛客小白赛复盘] 牛客小白月赛74

[牛客小白赛复盘] 牛客小白月赛74 总结A 简单的整除1. 题目描述2. 思路分析3. 代码实现 B 整数划分1. 题目描述2. 思路分析3. 代码实现 C 传送阵1. 题目描述2. 思路分析3. 代码实现 D 修改后的和1. 题目描述2. 思路分析3. 代码实现 E 幼稚园的树21. 题目描述2. 思路分析3. 代码…

一分钟学一个 Linux 命令 - tar

前言 大家好&#xff0c;我是 god23bin。今天给大家带来的是 Linux 命令系列&#xff0c;每天只需一分钟&#xff0c;记住一个 Linux 命令不成问题。今天&#xff0c;我们要介绍的是一个常用且强大的命令&#xff1a;tar。 什么是 tar 命令&#xff1f; tar 是 tape archive…

C语言经典题目(三)

C站的小伙伴们&#xff0c;大家好呀&#xff01;&#x1f60a;&#x1f60a;✨✨这一篇是C语言之经典题目篇&#xff0c;除程序设计&#xff0c;还有一些不错的程序分析&#xff0c;快来和我一起进入C语言的世界吧&#xff01;✨✨✨ &#x1f495;C语言其他刷题篇在这里哦&…

【Python程序设计】——重点题目(期末不挂科)

课本&#xff1a; 目录 &#x1f552; 1. 控制结构&#x1f552; 2. 数据类型&#x1f552; 3. 函数&#x1f552; 4. 文件操作&#x1f552; 5. 面向对象&#x1f552; 6. Excel操作&#x1f552; 7. 实验课题目合集&#x1f552; 8. 思政题 &#x1f552; 1. 控制结构 【例…

chatgpt赋能python:Python怎么二次安装?

Python怎么二次安装&#xff1f; 介绍 Python作为一种广泛应用的编程语言&#xff0c;其安装也是极其简单。只需要在Python官网上下载对应版本的安装包&#xff0c;并按照提示进行安装即可。但是&#xff0c;如果你需要二次安装Python&#xff0c;比如更新到新的版本或者将Py…

百度、头条、360、搜狗下拉拓词及长尾关键词挖掘-批量多线程

百度、头条、360、搜狗下拉拓词及长尾关键词挖掘软件介绍&#xff1a; 1、在如今竞争激烈的互联网时代&#xff0c;作为SEO站长&#xff0c;我们都知道一个事实&#xff1a;流量就是金钱&#xff01;而要想在海量信息中脱颖而出&#xff0c;我们需要借助一些强大的工具来帮助我…

OpenMMLab-AI实战营第二期——4-1.目标检测与MMDetection

文章目录 1. 目标检测的基本范式1.0-1 目标检测简介1.0-2 基本概念1.1 滑窗1.1.1 滑窗基本思想1.1.2 滑窗效率问题改进1.1.3 感受野计算 1.2-1 使用卷积实现密集预测1.2.1 在特征图上进行密集预测1.2.2 边界框回归1.2.3 非极大值抑制&#xff08;Non-Maximum Suppression&#…

chatgpt赋能python:Python入门:如何下载和安装JupyterNotebook

Python入门&#xff1a;如何下载和安装Jupyter Notebook Jupyter Notebook是Python编程必备的工具之一&#xff0c;它可以帮助你快速地编写和测试Python代码。在这篇文章中&#xff0c;我们将向你展示如何下载和安装Jupyter Notebook。如果你是一名Python入门者&#xff0c;这…

神经网络:CNN中的filter,kernel_size,strides,padding对输出形状的影响

输入数据在经过卷积层后&#xff0c;形状一般会发生改变&#xff0c;而形状的变化往往与以下四个超参数有关。 1&#xff0c;filter&#xff08;out_channel&#xff09; 该超参数控制着输入数据经过卷积层中需要与几个卷积核进行运算&#xff0c;而输入数据与每个卷积核进行…

【P57】JMeter 保存响应到文件(Save Responses to a file)

文章目录 一、保存响应到文件&#xff08;Save Responses to a file&#xff09;参数说明二、准备工作三、测试计划设计 一、保存响应到文件&#xff08;Save Responses to a file&#xff09;参数说明 可以将结果树保存到文件 使用场景&#xff1a;当结果太大&#xff0c;使…

Mybatis插件001分页 pagehelper

Mybatis-PageHelper/Important.md at master pagehelper/Mybatis-PageHelper GitHubMybatis通用分页插件. Contribute to pagehelper/Mybatis-PageHelper development by creating an account on GitHub.https://github.com/pagehelper/Mybatis-PageHelper/blob/master/wikis…

短视频社区的商业化和流量分发

商业化本质上是一门流量生意&#xff0c;那么为什么要做流量&#xff1f; 1、流量分配影响社区生态 一个社区的总流量是要在三类流量里面做分配&#xff0c;此消彼长&#xff1a; 私域流量公域流量&#xff08;中心化运营 算法推荐&#xff09;商业化的流量&#xff08;也是…

chatgpt赋能python:Python代码的保存:保障开发效率和代码质量

Python 代码的保存&#xff1a;保障开发效率和代码质量 Python 是一种高级语言&#xff0c;被广泛应用于数据分析、机器学习、 Web 开发等各个领域。它的语法简洁、易于学习&#xff0c;拥有丰富的标准库和第三方库&#xff0c;帮助开发者快速实现功能。在这样一个代码生产效率…

[ruby on rails] passenger+nginx 部署rails

安装Passenger 方法1 Passenger 是一个 app server&#xff0c;支持基于 Rack 框架的 Ruby app&#xff08;包括 Rails&#xff09;&#xff0c;作为模块变异到Nginx&#xff0c;不需要自己启动。 安装 Passenger 最简单的方法是通过 apt 安装&#xff0c;首先导入 Passenger…

英语4级技巧

真题链接&#xff1a;https://pan.baidu.com/s/1IZ0MmEpkANUm77ZLDmHs1A?pwd1111 提取码&#xff1a;1111 一、听力技巧 听到什么选什么 听发音 4级 90% 6级 60% 1、开头原则 2、顺序原则 1、单词发音/语音现象&#xff08;连读、弱读、失去爆破&#xff09; 反转词&#…

chatgpt赋能python:Python如何产生随机整数?

Python如何产生随机整数&#xff1f; Python是一种高级编程语言。它允许程序员轻松地创建各种类型的应用程序&#xff0c;包括生成随机整数。本文将介绍如何在Python中使用内置的随机数函数来生成随机整数。 random模块 Python中的random模块提供了生成随机数的函数。这些函…

chatgpt赋能python:Python实现二分查找

Python实现二分查找 在计算机科学中&#xff0c;二分查找是一种在有序数组中查找特定值的算法。 以一个有序数组为例&#xff0c;二分查找从数组的中间元素开始查找。如果需要查找的值与中间元素相同&#xff0c;则返回中间元素的位置。否则&#xff0c;如果查找的值比中间元…