七周成为数据分析师 | 数据分析思维

news2024/12/27 13:46:08

为什么思维重要?

不知道问题发生没

不知道问题在哪

不知道为什么

不确定分析对不对

不确定执行结果

不知道老板给不给加薪

一.What:三种核心思维

1.结构化

①核心论点

它可以是假设,是问题,是预测,是原因

②结构拆解

自上而下,将核心论点层层拆解成分论点,上下之间呈因果或依赖关系

③MECE

相互独立,完全穷尽。论点之间避免交叉和重复,分论点们要尽量完善

④验证

不论核心论点还是分论点,都应该是可量化的,用数据说话。它们必然是可验证的

【例1】现在有一个线下销售的产品。我们发现8月的销售额度下降,和去年同比下降了20%。我想先观察时间趋势下的波动,看是突然暴跌,还是逐渐下降。再按照不同地区的数据看一下差异,有没有地区性的因素影响。我也准备问几个销售员,看一下现在的市场环境怎么样,听说有几家竞争对手也缩水了,看一下是不是这个原因。顾客访谈也要做,但是往常一直找不到原因,这次我也不抱希望,姑且试试吧。要是还找不出原因,我也很绝望啊。

将论点归纳和整理将论点递进和拆解 → 将论点完善和补充

2.公式化

上下互为计算

左右呈关联

一切结构皆可量化

最小不可分割

结构化是分析的思维,但它还不够数据,而且难免有发散的缺点

销售额有什么组成的?销量和客单价相乘

利润有什么组成?销售额收益和成本相减

销售额是单一的维度吗?不是,销售额是多个商品/SKU的总和

地区的销量由什么组成?是不同线下渠道的累加

销量还能再细挖吗?不妨想成人均销量和购买人数

 不同类别的业务叠加可以用加法

减法常用来计算业务间的逻辑关系

乘法和除法是各种比例或者比率

3.业务化

用结构化思考+公式化拆解,获得的最终分析论点,很多时候,是现象。数据是某个结果的体现,但不代表原因

有没有从业务方的角度思考?

真的分析出原因了吗?

能不能将分析结果落地?

【例1】一家销售公司业绩没有起色,对它进行了分析

销售人员的效率降低,因为士气低落

产品质量不佳,和同期竞争对手比没有优势

价格平平,顾客并不喜欢

【例2】如何预估上海地区的共享单车投放量

 单车是有损耗的,计算公式中应该考虑单车的消耗因素

怎么想:我是数据分析师,我会设立哪些指标?换位,如果我是参与其中的人,我会怎么考虑/哪些行为

二.Why:数据分析的思维技巧

1.象限法

2.对比法

好的数据指标,一定是比例或者比率

好的数据分析,一定会用到对比

【例1】节日大促,女生消费占比从60%变为70%,女生节日爱消费

这个结论是有问题的,占比提高了,不代表绝对值提高了,某商品平时销售额1000万,女生占60万,节日销售额80万,女生占56万,女生真的消费变高了?谁说节日销售额会提高?别忘了竞争对手

竞争对手对比

类别对比

特征和属性对比

时间同比环比

转化对比

前后变化对比

3.二八法

 数据中,20%的变量将直接产生80%的效果,数据分析更应该围绕这20%做文章

持续关注TopN的数据,是一个非常好的习惯,尤其在部分行业

虽然指标很多,但往往某些指标更有价值,二八法则不仅能分析数据,也能管理数据

4.漏斗法

5.指数法

中国今年的经济指标如何?

美国NBA最佳球星是谁?

竞争对手产品表现的如何?

NBA比赛数据贡献值:(得分+篮板+助攻+抢断+封盖)-(出手次数-命中次数)-(罚球次数-罚球命中次数)-(失误次数/球员上场比赛的场次)

很多时候,我们有数据,但不知道怎么用。就是因为缺乏了一个有效的方向。这个方向可以成为目标指数。通过将数据加工成指数。达到聚焦的目的

方法:线性加权;反比例;log

6.假设法

很多时候,数据分析是没有数据可明确参考的:比如新进入一个市场,公司开拓某样产品,老板让你预测一年后的销量,或者产品的数据基础非常糟糕,你拿不到数据

【例1】现在,马上,公司要派你去贝宁出差,如果你只能携带一个背包,你会往里面装什么东西?你为什么要往里面装它?

虽然贝宁这个地方我并不熟悉,但我假设它在非洲,那么现在我得考虑炎热的情况...

【例2】公司在节日进行了一次营销活动,APP上的销量数据整体比上周上升了20%。因为统计失误问题,拿不到明细数据,也就是说,活动效果是一个黑盒。现在的问题是,销量本身就有可能因为节日而提高,那么怎么证明活动是有效或者无效的呢?

假设活动是有效的 → 会发生什么事情 → 会有一定数量的用户购买,如果能证明这条,那么我们有理由相信活动是有效的 → 用户通过活动购买商品,会发生什么可观测的行为呢?假设有一些用户会评论留言,那么可以统计提及活动的字眼 → 当用户提及了这次营销活动,接下来的问题是,有效了多少?10%?20%?→假设参与活动的用户行为没有变化,那么通过历史数据的用户评论占比,反推购买人数

【例3】你是自营电商的数据分析师,现在想商品提价后,收入会不会有变化?你会怎么做?

假设商品提价后,销量一定会下跌,问题是销量下跌多少? → 首先假设流量不会有变化,流量和渠道营销正相关,商品价格影响转化率,那么现在确定转化率的波动 → 找出平时的转化率,预估提价后的转化率变化。假设各类型用户对价格敏感度不同,那么将用户划分为忠诚XX,普通XX,羊毛XX → 不同用户层次数量不同,反应不同。忠诚用户转化率变化极低,羊毛几乎不会转化,这些数据可以凭借经验作出假设,最后汇总

 7.多维法

用户统计维度:性别,年龄

用户行为维度:注册用户,用户偏好,用户兴趣,用户流失

消费维度:消费金额,消费频率,消费水平

商品维度:商品品类,商品品牌,商品属性

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/66018.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

单片机通信总述——理论部分(CAN、串口、SPI、I2C等)

一、基础概念 1.1 通信方法 并行通信:传输原理:数据各个位同时传输;优点:速度快; 缺点:占用引脚资源多。是指使用 8、16、32 及 64 根或更多的数据线(有多少信号为就需要多少信号位)进行传输的通讯方式&a…

争议不断的AI绘画,靠这个成为了顶流?

今年以来,AIGC迅速崛起。所谓AIGC,即AI-Generated Content,指的是利用人工智能来生成内容,被认为是继专业产出内容(PGC)、用户产出内容(UGC)后的新型内容创作方式。不久前掀起热议的…

GitHub上架即下架,《分布式系统人人都是架构师》全彩笔记开源

又来给大家分享好书了:高翔龙老师的 《超大流量分布式系统架构解决方案:人人都是架构师2.0》,我在网上没找见开源的PDF版本所以分享一下!小编会在文末附电子版免费方式。 高翔龙是谁? 云集基础架构负责人&#xff0c…

真香!阿里最新公开的200页Spring全家桶进阶指南及视频汇总

最近看了下粉丝们的后台留言以及面试情况,发现很多人知道自己的问题和短板在哪里,对自己的技术水平和能力认知也很清晰,都很迫切想要学习提高,奈何自己盲目学习的过程很费力,效果也不佳,遇到好些困难和阻碍…

2023年新授的IBDP物理/化学/生物课程有何不同?

2023年升读IBDP的小伙伴们将迎来的IB课程改革变化更大,因为IBDP第4科学科目组的主流课程——物理、化学和生物三门课程都将迎来改革。 改革后的IBDP生物、物理和化学课程的学习内容、评估方式、课时分配、主题顺序、考试时间分配、成绩占比等跟现在的IBDP同门课程均…

NLP词向量技术

什么是词向量: 词向量(Word Vector)是对词语义或含义的数值向量表示,包括字面意义和隐含意义。 词向量可以捕捉到词的内涵,将这些含义结合起来构成一个稠密的浮点数向量,这个稠密向量支持查询和逻辑推理。 …

代码随想录算法训练营第十四天 |二叉树

1.理论基础 二叉树定义 Class TreeNode() {int val;TreeNode left;TreeNode right;TreeNode(){};TreeNode(int val) {this.val val;}TreeNode(int val, TreeNode left, TreeNode right) {this.val val;this.left left;this.right right;} }二叉树种类 在我们解题过程中二叉…

Mysql事务隔离级别是怎么实现的?

文章目录事务隔离级别解析常用命令查看事务隔离级别设置修改隔离级别隔离级别演示Mysql事务操作MVCC实现原理undo log版本链ReadView练习一下案例1案例2问答环节1、Mysql 可重复读到底有没有解决幻读?事务隔离级别 Mysql的事务隔离级别是由Mysql的各种锁以及MVCC机…

基于工业网关的储罐在线监测系统解决方案

储罐可以用来存放油、气、化学原料、工业原料等物资,是石油、化工、粮油、国防、冶金等行业必不可少的基础设施。随着储罐行业和相关行业的发展,越来越多企业开始运用储罐并产生储罐在线监测需求,需要实时了解储罐内的状态,保证重…

最强ADI SHARC系列DSP:ADSP-SC589的开发入门详解

作者的话 ADI的SHARC系列DSP,现阶段最强的型号是SC589,那么我就以SC589为例,写一点资料,让新手能够比较便捷的熟悉开发环境,软硬件,顺利的进入开发。 文档解决的是入门的问题,所以不会深入去写…

SpringCloud Alibaba框架都有啥啊

前言 文章目录前言1.集成Nacos实现服务的自动注册与发现2. Feign负载均衡注:OpenFeign和Feign的区别:3.使用Sentinel实现了接口的限流4.Feign整合Sentinel实现容错5.API网关6.Sleuth整合ZipKin实现链路追踪7.消息队列MQspring cloud是一个基于springboot…

做软件测试如何突破月薪20K?

IT行业从事技术岗位,尤其对于测试来说,月薪20K,即便在北上广深这类一线城市薪水也不算低了,可以说对于大部分测试岗位从业者来说,20K都是一个坎儿。 那么,问题来了,做软件测试如何可以达到月薪…

贪心,动态规划的区别

题目(力扣53): 给你一个整数数组 nums ,请你找出一个具有最大和的连续子数组(子数组最少包含一个元素),返回其最大和。子数组 是数组中的一个连续部分。 示例: 输入:n…

System V 消息队列(一)—— 消息队列相关接口函数(msgget / msgctl)

SystemV方案是在OS内核层面专门为进程间通信设计的一个方案,然后通过系统调用(system call)给用户提供通信接口。SystemV方案包含三种:共享内存、消息队列、信号量。 和System V 共享内存一样,OS为了管理这些消息队列…

【机器学习实战】对加州住房价格数据集进行数据探索(读书笔记)

1. 数据集描述及获取 数据集下载地址:housing.csv数据集的结构: 其中数据集有10个属性,分别为经度、纬度、housing_median_age、房间总数、卧室总数、人口数、家庭数、收入中位数、房价中位数、ocean_proximity。 2. 对数据集进行探索 2.…

web系统开发中关于企业里各种系统分类

关于企业里各种系统 OA 办公自动化系统 Office Automation (将现代化办公和计算机网络功能结合起来的新型办公方式) 功能:工作流、知识管理 功能模块:日报、考勤、事项审批等CRM 客户关系管理 Customer Relationship Management&…

C++日期和时间编程小结

C11 的日期和时间编程内容在 C Primer(第五版)这本书并没有介绍,目前网上的文章又大多质量堪忧或者不成系统,故写下这篇文章用作自己的技术沉淀和技术分享,大部分内容来自网上资料,文末也给出了参考链接。 日期和时间库是每个编程…

百度前端二面常考面试题

HTTP分层 第一层:物理层,TCP/IP 里无对应;第二层:数据链路层,对应 TCP/IP 的链接层;第三层:网络层,对应 TCP/IP 的网际层;第四层:传输层,对应 TCP…

编写递归函数,求斐波那契数列第n项

要求&#xff1a;编写递归函数int f(int n)&#xff0c;计算如下公式&#xff1a; 定义main函数输入n&#xff0c;调用f函数进行计算&#xff0c;在main函数中输出计算结果。 【样例输入】 10 【样例输出】 89 主函数&#xff1a; #include<stdio.h> int main() { in…

基于ssm的社区疫情返乡管控系统设计实现

项目描述 临近学期结束&#xff0c;还是毕业设计&#xff0c;你还在做java程序网络编程&#xff0c;期末作业&#xff0c;老师的作业要求觉得大了吗?不知道毕业设计该怎么办?网页功能的数量是否太多?没有合适的类型或系统?等等。这里根据疫情当下&#xff0c;你想解决的问…