目录
Q.左连接和右连接的区别
Q.union 和 union all的区别
1、取结果的交集
2、获取结果后的操作
Q.熟悉开窗函数吗?讲一下row_number和dense_rank的区别。
Q.hive行转列怎么操作的
Q.要求手写的题主要考了聚合函数和窗口函数,row_number(),sum() over ()的使用
Q.sql的留存率,
Q.新用户留存率,
Q.用户活动参与率等
Q.cohort图
主要被问的:
Q.左连接和右连接的区别
A.表链接:把表连接在一起(3种方式)
学习链接:https://blog.csdn.net/qq_44772660/article/details/112675699
(1)内连接:只两个表保留连接字段相同的
(2)左连接:连接后左边不可能有null——左边有的,右边没有的为null。
(3)右连接:与左相反,连接后右边不可能有null——左边没有的,右边有的为null。
【基础语法】
(1)内连接
select 字段名
from 表名1 inner join 表名2 on 表名1.字段名 = 表名2.字段名
注意内连接inner可以省略,直接使用join默认为内连接
(2)左连接
select 字段名
from 表名1 left join 表名2 on 表名1.字段名 = 表名2.字段名
(3)右连接
select 字段名
from 表名1 right join 表名2 on 表名1.字段名 = 表名2.字段名
Q.union 和 union all的区别
A.
1、取结果的交集
1)union: 对两个结果集进行并集操作, 不包括重复行,相当于distinct, 同时进行默认规则的排序;
2)union all: 对两个结果集进行并集操作, 包括重复行, 即所有的结果全部显示, 不管是不是重复;
2、获取结果后的操作
1)union: 会对获取的结果进行排序操作
2)union all: 不会对获取的结果进行排序操作
3、总结
union all只是合并查询结果,并不会进行去重和排序操作,在没有去重的前提下,使用union all的执行效率要比union高。
Q.熟悉开窗函数吗?讲一下row_number和dense_rank的区别。
Q.hive行转列怎么操作的
Q.要求手写的题主要考了聚合函数和窗口函数,row_number(),sum() over ()的使用
Q.sql的留存率
有一次性求出次日留存率,3日留存率,7日留存率,30日留存率(我用的datediff做的,感觉不是很好)
Q.新用户留存率
Q.用户活动参与率
Q.cohort图
(慢慢积累,慢慢更新)