数据分析思维(五):分析方法——假设检验分析方法

news2024/12/24 10:01:25

 数据分析并非只是简单的数据分析工具三板斧——Excel、SQL、Python,更重要的是数据分析思维。没有数据分析思维和业务知识,就算拿到一堆数据,也不知道如何下手。

推荐书本《数据分析思维——分析方法和业务知识》,本文内容就是提取这本书的主体思维,以提高自身的数据分析素养。

先来点鸡汤:学会把书读薄,就要学会总结,撰写学习博客的过程就是加深印象的过程,也是持续提高自身素质的有效方法。冲冲冲!

此前篇章:

数据分析思维(一):业务指标(数据分析并非只是简单三板斧)

数据分析思维(二):分析方法——5W2H分析方法、逻辑树分析方法、行业分析方法

数据分析思维(三):分析方法——多维度拆解分析方法

数据分析思维(四):分析方法——对比分析方法、A/B测试


假设检验分析方法

1.1 什么是假设检验分析方法?

假设检验分析方法的底层逻辑就是逻辑推理。假设检验分析方法是一种用数据来决策的过程,主要有3个步骤构成:提出假设 → 收集证据 → 得出结论

1.2 假设检验分析方法有什么用?

主要有两个方面的作用:

  • 提高逻辑思维能力
  • 分析问题发生的原因(归因分析)

1.3 如何使用假设检验分析方法?

有一个问题,我们在提出假设的时候,容易根据以往经验做出假设,导致无意识地排除了一些重要的假设。

那么,在进行数据分析时,如何客观地提出假设呢?


可以从用户、产品、竞品这3个维度提出假设,检查假设是否有遗漏。

(1)假设用户维度有问题

可以从用户来源渠道维度来拆解分析,或者画出用户使用产品的流程图进行分析,找出原因。

(2)假设产品维度有问题

研究这段时间的产品是否符合用户的需求。

(3)假设竞品维度有问题

可以看竞品是否搞相关活动,用户流失到竞争对手那去了。


还可以从4P营销理论出发来提出假设。什么是4P理论?

4P营销理论,又称“市场营销组合”或“营销四大要素”,主要是从公司角度出发研究产品的。

  • P1:产品(Product):指企业为满足消费者需求而提供的商品或服务。涵盖了产品的设计、品质、功能、品牌、包装、样式等要素。

  • P2:价格(Price)价格是指消费者愿意为产品或服务支付的金额(用户购买产品时的价格)。包括基本价格、折扣价格、付款期限、各种定价方法和定价技巧等。

  • 渠道(Place):渠道是指产品从生产商到消费者手中的流通路径。

  • 促销(Promotion):促销是指企业通过广告、公关、销售推广、社交媒体等手段,旨在提高品牌知名度、推动销售和塑造品牌形象,以促进销售增长。

为了寻找销售业绩下滑原因,可以利用4P营销理论,从4个维度提出假设:


4P营销理论是从公司角度出发研究产品的。

我们还可以从用户角度出发研究产品,即从用户使用产品的业务流程来检查我们提出的假设是否有遗漏。

例如:网上店铺最近给新会员的折扣券的领取率降低了,原因是什么呢?

我们按照用户使用产品的业务流程,提出假设,流程与假设如下:


讲一个使用案例(假设检验分析方法):如何解读报表

解读报表里的数据波动是数据分析的基本功。假如老板给你一个app一周日活跃率的表格,问你:从数据中看到了什么问题?你觉得背后原因是什么?

对于这类问题,我们需要先进行数据可视化(因为只看表格数据很难得出什么)。可视化图如下:

接下来怎么分析?

乍一看,你可能会说:发现了一个问题,周六数据下降了。

但是,你这个结论是没有足够证据支撑的。之前的讲对比分析方法的文章里讲过,没有对比就没有好坏。与这周的数据比,确实周六数据下降了,但是有没有可能,本来每次到周六,数据就是必定会下降的呢?

因此你需要问老板要更长周期的数据,包含多个星期数据,以便进行对比分析。

整体来看,本周周六数据确实下降了。

那么,下降背后的原因是什么呢?这时候假设检验分析方法就用得上了。

第一步,提出假设,可以用到前面讲的的方法:

还可以弄个分析图,对于收集证据这部分,我们需要根据不同的问题假设去寻找不同的数据进行验证假设,最终得出结论。


1.4 注意事项

(1)假设不能是主观想出来的,要依靠证据证明。

(2)假设检验是一个需要不断重复的过程。得出一个结论后,分析并没有停止,要多问几个问什么,不断重复假设分析(假设2、假设3、假设4.......),直到找到问题根源。

(3)开始分析前,可以先做一个假设检验分析图,将思路串联起来。

(4)不要只进行假设检验分析,数据分析是一个复杂的过程。必要时,结合业务流程、对比分析等分析方法进行假设分析。

1.5 小结

 # 文章仅供个人学习。后续还会继续更新。冲! 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2264658.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

解读DiffusionNER: Boundary Diffusion for Named Entity Recognition

content 摘要1. 图1图21. 上方:扩散过程与实体边界2. 下方:网络结构(Sentence Encoder Entity Decoder)3. 关键思想小结 摘要 主要内容分为四个部分: 模型定位与基本原理: 提出了DiffusionNER模型将命名…

【QSS样式表 - ⑥】:QPushButton控件样式

文章目录 QPushBUtton控件样式QSS示例 QPushBUtton控件样式 常用子控件 常用伪状态 QSS示例 代码: QPushButton {background-color: #99B5D1;color: white;font-weigth: bold;border-radius: 20px; }QPushButton:hover {background-color: red; }QPushButton:p…

数字经济下的 AR 眼镜

目录 1. 📂 AR 眼镜发展历史 1.1 AR 眼镜相关概念 1.2 市面主流 XR 眼镜 1.3 AR 眼镜大事记 1.4 国内外 XR 眼镜 1.5 国内 AR 眼镜四小龙 2. 🔱 关键技术 2.1 AR 眼镜近眼显示原理 2.2 AR 眼镜关键技术 2.3 AR 眼镜技术难点 3. &#x1f4a…

smb和nfs双栈协议共享目录

1 简介 NFS和SAMBA协议都是文件共享,Linux客户端常用于NFS协议访问远程共享目录,Windows客户端常用于SAMBA协议访问远程共享目录。 2 环境 合计使用三台服务器,服务器都位于同一个子网(10.0.0.0/19)、同一个安全组…

Day13 用Excel表体验梯度下降法

Day13 用Excel表体验梯度下降法 用所学公式创建Excel表 用Excel表体验梯度下降法 详见本Day文章顶部附带资源里的Excel表《梯度下降法》,可以对照表里的单元格公式进行理解,还可以多尝试几次不同的学习率 η \eta η来感受,只需要更改学习率…

Python获取系统负载并打印折线图

#! /opt/py36/bin/python import psutil import matplotlib.pyplot as plt import time# 创建一个空列表,用于存储负载数据 load_data []# 循环收集负载数据 while True:# 获取当前系统负载load_avg psutil.getloadavg()# 将平均负载添加到load_data列表中load_da…

RCE 命令执行漏洞 过滤模式 基本的过滤问题 联合ctf题目进行实践

前言 知道RCE 命令执行分为 代码执行 和 命令执行 原理 : 就是用户的输入被当做命令或者代码执行了 从而造成了危害 代码执行 除了eval php代码执行漏洞的函数还有 eval()、a ssert()、 preg_replace()、 create_function()、 array_map()、 call_user_func(…

Leetcode打卡:考场就坐

执行结果:通过 题目: 855 考场就坐 在考场里,有 n 个座位排成一行,编号为 0 到 n - 1。 当学生进入考场后,他必须坐在离最近的人最远的座位上。如果有多个这样的座位,他会坐在编号最小的座位上。(另外&am…

数据结构(哈希表(上)纯概念版)

前言 在软件开发和计算机科学中,数据结构的选择直接影响到程序的性能和效率。不同的数据结构适用于不同的场景,合理地选择合适的数据结构是高效编程的关键之一。哈希表(哈希表(Hash Table)作为一种高效的键值对存储结…

【机器学习与数据挖掘实战】案例06:基于Apriori算法的餐饮企业菜品关联分析

【作者主页】Francek Chen 【专栏介绍】 ⌈ ⌈ ⌈机器学习与数据挖掘实战 ⌋ ⌋ ⌋ 机器学习是人工智能的一个分支,专注于让计算机系统通过数据学习和改进。它利用统计和计算方法,使模型能够从数据中自动提取特征并做出预测或决策。数据挖掘则是从大型数据集中发现模式、关联…

深入解析 Spring WebFlux:原理与应用

优质博文:IT-BLOG-CN WebFlux 是 Spring Framework 5 引入的一种响应式编程框架,和Spring MVC同级,旨在处理高并发和低延迟的非阻塞应用。这是一个支持反应式编程模型的新Web框架体系。 顺便一提,Spring Cloud Gateway在实现上是…

C语言基础——指针(4)

一. 字符指针变量 字符指针变量的使用和整型指针变量的使用方法相似,以下是其基本使用方法的例子: (1)字符指针变量还有一种使用方法: const char* p "abcd" 需…

『 Linux 』高级IO (一)

文章目录 内容回顾及铺垫五种IO模型不同类型IO的区别非阻塞IOfcntl( ) 多路转接 - select( )select( ) 的基本使用 - SelectServer服务器 内容回顾及铺垫 在博客『 Linux 』基础IO/文件IO (万字)中介绍了对IO的认识; IO实际上为Input/Output,输入输出; 以网络协议栈的视角来看,…

Spark-Streaming集成Kafka

Spark Streaming集成Kafka是生产上最多的方式,其中集成Kafka 0.10是较为简单的,即:Kafka分区和Spark分区之间是1:1的对应关系,以及对偏移量和元数据的访问。与高版本的Kafka Consumer API 集成时做了一些调整,下面我们…

「下载」智慧城市包括哪些方面:大数据公共服务平台、城市运行指挥中心、城市综合治理平台、城市体检综合运营平台解决方案

在当今信息化高速发展的时代,智慧城市已成为全球城市发展的新趋势。系列全面而创新的智慧城市解决方案,旨在助力城市实现智慧化转型,提升城市管理效率,增强市民生活质量。 智慧城市最新解决方案,标准规范顶层设计指南、…

ChatGPT生成接口文档实践案例(二)

不难发现,两个方案都出色地完成了接口文档的生成,但笔者更喜欢Response 2的表达,因为其描述更加全面。 还可以让ChatGPT生成符合OpenAPI 3.0规范的接口文档,以便于项目相关成员阅读,如图5-13所示。 为什么要生成OpenAP…

【解决】Linux更新系统内核后Nvidia-smi has failed...

问题概述 由于服务器(操作系统为 RedHat 9)宕机,重启后,系统内核自动更新了,然后输入 nvidia-smi 发现报了下面的异常: NVIDIA-SMI has failed because it couldnt communicate with the NVIDIA driver. Make sure that the late…

Docker Compose 安装 Harbor

我使用的系统是rocky Linux 9 1. 准备环境 确保你的系统已经安装了以下工具: DockerDocker ComposeOpenSSL(用于生成证书)#如果不需要通过https连接的可以不设置 1.1 安装 Docker 如果尚未安装 Docker,可以参考以下命令安装&…

PCIe_Host驱动分析_设备枚举

往期内容 本文章相关专栏往期内容,PCI/PCIe子系统专栏: 嵌入式系统的内存访问和总线通信机制解析、PCI/PCIe引入 深入解析非桥PCI设备的访问和配置方法 PCI桥设备的访问方法、软件角度讲解PCIe设备的硬件结构 深入解析PCIe设备事务层与配置过程 PCIe的三…

【CVE-2024-53375】TP-Link Archer系列路由器认证操作系统命令注入(内附远离和代码利用)

CVE-2024-53375 TP-Link Archer系列路由器认证操作系统命令注入 受影响的设备 使用 HomeShield 功能的 TP-Link 设备容易受到此漏洞的影响。这包括 TP-Link Archer 系列的多款路由器。 经过测试 Archer AXE75(EU)_V1_1.2.2 Build 20240827(发布日期 2024 年 11 月 4 日)…