数据分析方法-五大理论、分析框架、应用、数据分析作用

news2024/11/16 23:59:44

1、统计学理论

1.1 大数定量

定义:
指大量重复某一实验时,最后的频率会无限接近于事件的概率
数据的样本量越大,我们预测和计算的概率就越准确
数据的样本量越小,我们预测和计算的概率就越可能失效
举例:
某产品用户还只有几百人,就用一个模型来预测用户的流失。数据量太小导致用上面模型都很难预测准确
样本量不足时,得出的预测结果是无序的,混乱的
解决方法:

  • 主客观结合:深入业务,从用户的视角思考问题,广泛收集信息,不仅仅从数据中得出结论
  • 想办法提升数据量级:想办法提升公司的业务和数据建设

结论:
对小样本数据得出的结论保持客观的怀疑和观察。并尽可能地在大样本量下进行分析

1.2 罗卡定律

定义:
凡两个物体接触,必会产生转移现象
凡有接触,必留痕迹
之前用于犯罪现场,指犯罪分子一旦来过现场,必会留下痕迹。现在主要用于针对用户行为的埋点和分析

结论:
在分析时,不要忘记尽可能的获取数据、挖掘更多的数据,从蛛丝马迹中找出数据背后的隐藏价值

1.3 幸存者偏差

飞机机翼事件
举例:
总体100万数据,你只取10万数据进行分析,分析出的结果也会更加偏向这10万数据的特征
结论:
各种分析的对象,能取全量尽可能取全量
不能取全量则要选择最能代表总体特征的要不
看别人的分析结果时,也要关注他是如何取样的

1.4 辛普森悖论

定义:
指的是两组分别讨论都满足某一性质的数据,一旦合并计算,会得出完全相反的结论
举例:
在这里插入图片描述
原因:虽然两组数据的总人数相同,但在不同类别上的人数分配上不均匀

在这里插入图片描述
这里的点击/曝光 的比例上升,不是因为点击上升了,而是因为曝光下降的更快

结论:
不要在不同的权重下,更不要跨量级比较数据。否则很可能得出离谱结论
要得出正确的结论,首先要保证的是分析的数据在同一量级下

1.4 帕累托最优

一种资源分配的理想状态
在这里插入图片描述
认为仅通过调整分配方式,不增加资源就能提升生产效率
在实际中,常被用来分配渠道预算和业绩奖金

总结

  • 大数定律:时刻对小样本数据得出的结论保持客观的怀疑和观察。并尽可能地在大样本量下进行分析
  • 罗卡定律:用户的一切行为都会留下数据,要尽可能地拿来分析,这样才能找到数据背后隐藏的价值
  • 幸存者偏差:分析时要提取检测取样偏差,所分析的样布要越能代表总体越好
  • 辛普森悖论:一定要确保数据在同一量级和权重下,再进行分析
  • 帕累托最优:就算不投入资源,也总有优化现状的方法

2、分析框架

2.1 一个原则:MECE法则

要求拆解出的各个部分都满足:相互独立、完全穷尽

2.2 方法

2.2.1 时间流程法:

  • 经典AARRR模型(获取、激活、留存、收益、传播)
  • PDCA(计划、执行、检测、处理)
  • 精益创业模型

2.2.2 模型框架法

SWOT法(内部优势、劣势、外部机会、外部威胁)

2.2.3 量化公式法

在这里插入图片描述

2.2.4 穷尽要素法

3、量化问题为数据

属性:描述分析对象有哪些特征
绝对值:衡量一件事最后的结果
转化率:衡量一个环节的完成度

4、经典场景的应用

业务诊断:针对现在发生的问题找原因,对应是什么?为什么?
业务增长:需要给出系统量化的业务增长策略,对应怎么做?做多少?

4.1 业务诊断

基于现有的业务模式,进行优化
举例:
8月份某音乐APP的会员收入,相较于7月份下跌了。
在这里插入图片描述
灵活组和各种方法
在这里插入图片描述
基于业务拆解,先有时间流程法拆解出必要的流程环节:曝光,注册,付费三个环节。
新老用户在付费动机上是完全不同的。新会员更多的是体验一下,新会员需要投放拉新才能获得;老会员一般是有需求或者体验好才付费的。而老会员天然活跃在APP上。所以后续分析过程中,两者最好区分出

串联指标,量化业务公式。对于新用户,会员收入=。。。。

不断循环,拆解、量化、取数、分析的整套流程

4.2 业务增长

重新设计业务模式

5 数据分析的作用

数据分析解决的问题:是什么?为什么?怎么做?做多少?

是什么?
用数据去量化企业当前的经营现状或者业务事实
在这里插入图片描述
为什么?
看数据-分析原因

怎么做?
在这里插入图片描述
沟通时,确认问题:
在这里插入图片描述
统计口径!
收集数据:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/83036.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

keepalived 主备使用

keepalived 主备使用 本篇主要介绍一下 keepalived 的基本的 主备使用 1.概述 什么是 keepalived呢,它是一个集群管理中 保证集群高可用的软件,防止单点故障,keepalived是以VRRP协议为实现基础的,VRRP全称Virtual Router Redundancy Protocol,即虚拟路冗…

CH36X系列芯片Linux系统使用教程

一、概述 CH365是一个连接PCI总线的通用接口芯片,CH367/CH368是连接PCI-Express总线的通用接口芯片。支持I/O端口映射、存储器映射、扩展ROM以及中断,提供主动并口、SPI、I2C、GPIO等硬件接口。基于如上芯片可将PCI/PCIe总线转换为简便易用的类似于ISA总…

R语言使用Rasch模型分析学生答题能力

最近我们被客户要求撰写关于IRT的研究报告,包括一些图形和统计输出。几个月以来,我一直对序数回归与项目响应理论(IRT)之间的关系感兴趣。 在这篇文章中,我重点介绍Rasch分析。 最近,我花了点时间尝试理解…

今天面了个阿里拿 38K 出来的,让我见识到了基础的天花板

前言 人人都有大厂梦,对于程序员来说,BAT 为首的一线互联网公司肯定是自己的心仪对象,毕竟能到这些大厂工作,不仅薪资高待遇好,而且能力技术都能够得到提升,最关键的是还能够给自己镀上一层金,…

【数集项目之 MCDF】(二) 从输入端 slave_FIFO

由于slave_FIFO调用了子模块同步FIFO SCFIFO.v,因此首先简单介绍同步FIFO的设计。 第一节 同步FIFOSCFIFO设计 同步FIFO实体是一组存储单元,因此需要先用数组方式来实现 reg [DATA_WIDTH - 1 : 0] fifo_buffer[DATA_DEPTH - 1 : 0]; 其中在参数中进行…

【随机分形搜索算法】一种新的全局数值优化的适应度-距离平衡随机分形搜索算法FDB-SFS附matlab代码

✅作者简介:热爱科研的Matlab仿真开发者,修心和技术同步精进,matlab项目合作可私信。 🍎个人主页:Matlab科研工作室 🍊个人信条:格物致知。 更多Matlab仿真内容点击👇 智能优化算法 …

模型精度再被提升,统一跨任务小样本学习算法 UPT 给出解法!

近日,阿里云机器学习平台PAI与华东师范大学高明教授团队、达摩院机器智能技术NLP团队合作在自然语言处理顶级会议EMNLP2022上发表统一多NLP任务的预训练增强小样本学习算法UPT(Unified Prompt Tuning)。这是一种面向多种NLP任务的小样本学习算…

【HMS Core】运动健康服务上传平台的健康数据,能否获取到上传设备的SN码或者唯一设备码信息

问题描述 上传平台的健康数据,能否获取到上传设备的SN码或者唯一设备码信息 解决方案 DeviceInfo中包含华为设备唯一标识,您可以通过DeviceInfo进行查看。 DeviceInfo Android API:https://developer.huawei.com/consumer/cn/doc/developm…

价值年薪50W的软件测试进阶学习路线,终于让我从阿里P8手里抠出来了

作为一个男人我感觉必须得做点什么来证明一下自己,现在我又回来了,准备把自己的节操准备补一下。另外给各位未来的自动化测试工程师和测试开发工程师说一句,别的我不清楚,学习编程请从一而终 咱们学习编程就挺难的,有…

Matplotlib学习笔记(第二章 2.14 图像教程)

2.1.4 图像教程 使用Matplotlib绘制图像的简短教程。 启动命令 首先,让我们开始IPython。它是对标准Python提示符的最优秀的增强,它与Matplotlib结合得特别好。直接在shell上启动lPython,或者使用Jupyter笔记本(其中IPython作为运行的内核…

为什么 Android 要采用 Binder 作为 IPC 机制?

前言 Android 系统为了安全、稳定性、内存管理等原因,Android 应用和系统服务都是运行在独立的进程中的,但系统服务与应用进程之间,应用进程A与应用进程B之间需要通信和数据共享的。因此,Android 系统需要提供一套能够高效、安全…

js 踩了正则表达式的大坑!lastIndex属性

参考文章 踩坑情景 今天一来,被测试测出了一个问题,在使用vantUI的移动端项目中,我虽然对用户输入的值做了去除首尾空格的操作,但却忘记对用户输入的空值进行错误提示,fine,我选择给表单添加rules规则&am…

[附源码]JAVA毕业设计远程教学系统录屏(系统+LW)

[附源码]JAVA毕业设计远程教学系统录屏(系统LW) 项目运行 环境项配置: Jdk1.8 Tomcat8.5 Mysql HBuilderX(Webstorm也行) Eclispe(IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持)。 项目技术…

40个高质量SSM毕设项目分享【源码+论文】

文章目录前言 题目1 : 基于SSM的房屋出租出售系统 <br /> 题目2 : 基于SSM的房屋租赁系统 <br /> 题目3 : 基于SSM的个人健康信息管理系统 <br /> 题目4 : 基于SSM的共享充电宝管理系统 <br /> 题目5 : 基于SSM的即动运动网站 <br />前言 &…

【C语言数据结构(基础篇)】第二站:顺序表

目录 一、线性表 二、顺序表的实现&#xff08;概念以及静态顺序表&#xff09; 1.创建三个工程文件 2.顺序表的概念 3.顺序表的定义 4.初始化顺序表 5.静态顺序表的尾插 三、顺序表的实现&#xff08;升级为动态顺序表&#xff09; 1.动态顺序表的定义 2.动态顺序表的…

艾美捷NCTC-135培养基化学性质和基本配方

艾美捷NCTC-135培养基背景&#xff1a; NCTC培养基&#xff0c;由马里兰州贝塞斯达国家癌症研究所&#xff08;NCI&#xff09;生物实验室组织培养科开发&#xff0c;用于建立和维持L929小鼠细胞株。 艾美捷NCTC-135培养基化学性质&#xff1a; 外观&#xff1a;白色至浅粉色…

[附源码]Python计算机毕业设计Django超市商品管理

项目运行 环境配置&#xff1a; Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术&#xff1a; django python Vue 等等组成&#xff0c;B/S模式 pychram管理等等。 环境需要 1.运行环境&#xff1a;最好是python3.7.7&#xff0c;…

Android -- 每日一问:谈谈MVC、MVP和MVVM模式,你有在自己的项目中使用过吗?

经典回答 MVC 模式 全名是Model–View–Controller&#xff0c;是模型(model)&#xff0d;视图(view)&#xff0d;控制器(controller)的缩写&#xff0c;一种软件设计典范&#xff0c;用一种业务逻辑、数据、界面显示分离的方法组织代码&#xff0c;在改进和个性化定制界面及用…

[附源码]Python计算机毕业设计SSM基于的高速收费系统(程序+LW)

项目运行 环境配置&#xff1a; Jdk1.8 Tomcat7.0 Mysql HBuilderX&#xff08;Webstorm也行&#xff09; Eclispe&#xff08;IntelliJ IDEA,Eclispe,MyEclispe,Sts都支持&#xff09;。 项目技术&#xff1a; SSM mybatis Maven Vue 等等组成&#xff0c;B/S模式 M…

防火墙双机热备配置实验

目录 一、实验拓扑 二、配置云 三、配置防火墙 四、分配FW的接口地址与安全区域 五、按图示进行配置 六、双机热备的配置 七、配置NAT 八、模拟双机热备的切换 一、实验拓扑 看上去挺复杂的其实这个实验还是比较简单的&#xff0c;Client1配置为IP 10.3.0.10 网关10.3.…