辛普森悖论

news2024/11/28 22:37:22

感谢原作者!原文传送门

以下是摘录:

1、什么是辛普森悖论?

辛普森悖论是 1951 年由 E.H. 辛普森提出的,简单来讲就是在分组比较中都占优势的一方,有的时候在总评中反而是失势的一方。指局部的结论和整体的结论完全相反。

举个栗子:
在这里插入图片描述
解读:女性员工表现,一组好于二组;男性员工表现,一组好于二组。然而,从总体上来说,一组差于二组。

2、为什么会出现辛普森悖论?

从以上例子可以看出,一组和二组的性别比重差异大,即分组样本不均衡。一组的主要成员男性的表现(30%)低于二组主要成员女性的表现(70%)。

我们通常会讲到“质量”这个词,而且是一起出现,但实际上,“质”与“量”是两个不同的方面,我们在考虑质的时候,一定要注意量的影响,我们如果把这两者揉成一个“质”,就会出现辛普森悖论。

延申:①从绩效考评角度看,由于样本不均衡,二组因有更多声音甜美温柔耐心的女员工而拥有性别优势;一组已经输在了起跑线,不是输给了能力,而是输在了性别劣势。②从统计学上来讲,一组和二组不具有可比性,当我们设计对照组和实验组的时候,要确保非控制变量(性别)是均衡的,统计归因(控制变量)才有效。

3、在工作中的指导意义

【栗子1】公司的一位数据分析同事的竞品分析报告里提到:“我们客户的平均客单价是 100元钱,竞争对手的只有 50 元,我们的客户比对方的高端多了。所以我们产品要走高端路线”这些结论可信吗?还真不一定。

【栗子2】某游戏公司做了款游戏,有 Android 和 iOS 版本。一个数据分析师看完用户的付费数据后,发现整体上 iOS 付费率比较高。他就直接告诉老板说,“我们 iOS的用户付费率要高于Android的用户付费率,我们应该集中资源开发iOS客户端!”这个结论可信么?还真不一定。

因为很有可能出现这样一种情况:Android最大的优势(男性用户)没有比过iOS最大的优势(女性用户),这是决定最终整体走向的关键。

4、总体与局部,我们信哪个?

只要细分的用户群体足够大,有统计学意义上的显著性,那一定是以细分结论为准,因为真理都是需要抽丝剥茧,藏在细节处。
但是如果细分的群体太小,比如上面的例子中,细分以后各组的用户数都很小,不具统计学意义,那细分的结论就不可信了。

所以还是那句话,无论是整体还是细分,在看“质”的同时,一定要兼顾“量”的影响,这是理解辛普森悖论最重要的一点。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/367612.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

HashMap~

HashMap: HashMap是面试中经常被问到的一个内容,以下两个经常被问到的问题, Question1:底层数据结构,1.7和1.8有何不同? 答:1.7数组+链表,1.8数组+(链表|红…

k8s使用外部ca证书

PKI证书和要求Kubernetes 需要 PKI 证书才能进行基于 TLS 的身份验证。如果你是使用 kubeadm 安装的 Kubernetes, 则会自动生成集群所需的证书。你还可以生成自己的证书。 例如,不将私钥存储在 API 服务器上,可以让私钥更加安全。此页面说明了…

C++ 模板

1. 泛型编程实现一个通用的交换函数,使用函数重载虽然可以实现,但是有以 下几个不好的地方:1. 重载的函数仅仅是类型不同,代码复用率比较低,只要有新类型出现时,就需要用户自己增加对应的函数2. 代码的可维…

深度剖析数据在内存中的存储(下)(适合初学者)

上篇讲解了整形在内存中的存储方式,这篇文章就来继续讲解浮点数在内存中的存储方式。 上篇地址: (5条消息) 深度剖析数据在内存中的存储(上)_陈大大陈的博客-CSDN博客 目录: 3.浮点型在内存中的存储 3.1.浮点数的…

【Windows Server 2019】发布服务器 | 远程桌面服务的安装与配置 Ⅱ——配置RemoteAPP和访问

目录4. 配置RemoteAPP4.2 设置要发布的APP4.1 如何找到访问链接5. 访问发布的RemoteAPP关联博文4. 配置RemoteAPP 4.2 设置要发布的APP (1)返回【Server Manager】,在左侧的菜单栏中找到【Remote Desktop Services】。 (2&#…

jupyter notebook小技巧

1、.ipynb 文件转word文档 将 jupyter notebook(.ipynb 文件)转换为 word 文件(.docx)的最简单方法是使用 pandoc。 首先安装pip install pandoc, 安装后,在将 Jupyter notebook文件目录cmd 然后输入打开…

ChatGPT 的盈利潜力:我使用语言模型赚取第一笔钱的个人旅程

使用 Fiverr、Python ChatGPT 和数据科学赚钱的指南。众所周知,ChatGPT 是 12 月发生的互联网突破性事件,几乎每个人都跳过了使用 AI 赚钱的潮流。在本文中,我将分享我是如何使用 ChatGPT 赚到第一笔钱的。本文包括以下主题:回到基…

深入理解Golang 中的Context包

context.Context是Go语言中独特的设计,在其他编程语言中我们很少见到类似的概念。context.Context深度支持Golang的高并发。 1.Goroutine 和channel。 在理解context包之前,应该首先熟悉Goroutine和Channel,能加深对context的理解。 1.1 Goro…

苹果设计可变色Apple Watch表带,智能穿戴玩法多

苹果最新技术专利显示,苹果正在为 Apple Watch 设计一款可变色的表带,可以根据佩戴者所穿着的服装、所在的环境等自动改变颜色。据介绍,这款表带里的灯丝具有电致变色功能,可以通过施加不同的电压,来实现显示多种颜色或…

C++之类与对象(上)

目录 一、类的定义 二.类的访问限定及封装 1.访问限定 2.封装 三.类的作用域和实例化 2.类的实例化 四.类的对象大小的计算 1.类成员存储方式 2.结构体内存对齐规则 五.类成员函数的this指针 1.this指针的引出 2.this指针的特性 3.C语言和C实现Stack的对比 一、类的定义 class …

Linux的kdump分析

文章目录一 系统环境二 下载和安装kerner-debuginfo三 启动crash四 crash常用命令一 系统环境 进行kdump分析的主机是CentOS-7.9系统。 [rootcanway ~]# cat /etc/redhat-release CentOS Linux release 7.9.2009 (Core) [rootcanway ~]# uname -r 3.10.0-1160.el7.x86_64检查…

智慧新零售网络解决方案,助力新零售企业数智化转型

随着数字化时代的不断发展,新零售连锁业务模式“线上线下”融合发展,数据、设备在逐渐增加,门店数量也会随着企业规模的扩大而增加,但由于传统网络架构不稳定、延时、容量小影响服务质量(QoS)、分支设备数量…

【java】Spring Cloud --Spring Cloud Alibaba 教程

文章目录Spring Cloud Alibaba是什么Spring Cloud AlibabaSpring Cloud Alibaba 组件Spring Cloud Alibaba 的应用场景Spring Cloud 两代实现组件对比Spring Cloud Alibaba 版本依赖Spring Cloud Alibaba 组件版本关系Spring Cloud Alibaba NacosNacos 的特性服务发现服务健康监…

写博客有哪些好用的工具和软件?

写博客有哪些好用的工具和软件? 在各种平台上写文章,要有一个好用的编辑器,使用简单方便、不用花很多时间排版、能预览效果等。此外,文章还需要配图片、动图和视频等,所以需要好用的截图软件、视频录制和剪辑软件。 …

ME1M 报表Layout调整

众所周知,SAP的许多报表都可以选择以ALV的格式输出,ALV格式界面友好,业务人员可以按照自己的需求去调整报表输出格式,同时也方便导出到本地文件。大多数报表的选择界面上都有一个字段scope of list, 将其改成ALV: 偏偏…

该学会是自己找bug了(vs调试技巧)

前言 🎈个人主页:🎈 :✨✨✨初阶牛✨✨✨ 🐻推荐专栏: 🍔🍟🌯 c语言初阶 🔑个人信条: 🌵知行合一 🍉本篇简介:>:介绍c语言初阶的最后一篇.有关调试的重要性. 金句分享…

Linux基本介绍与常用操作指令

参考链接: Linux面试必备20个常用命令_无 羡ღ的博客-CSDN博客_linux常用命令 1. Linux简介 Linux是一个支持多用户、多任务、多线程和多CPU的操作系统,特点是免费、稳定、高效, 一般运行在大型服务器上。 1.1 常用目录简介 /:根目…

【storybook】你需要一款能在独立环境下开发组件并生成可视化控件文档的框架吗?(一)

storybook介绍入门说说用法prop-types.stories.jsx介绍 你肯定用过ant-design或者elemenUI中的一款UI组件库, 你肯定打开过它们的官网, 你是否好奇过,页面上展示的案例, 你为啥可以操作,还能查看源码供你CV?它们是…

Docker之路(6.docker容器数据卷、具名挂载匿名挂载、权限挂载)

1. 什么是容器数据卷 如果数据都在容器中,那么容器删除后,数据就会丢失! 所以希望容器的数据能够存到本地 容器之间可以又一个数据共享的技术! Docker容器中产生的数据,可以同步到本地,这就是卷技术。 就是…

Nacos Ignore the empty nacos configuration and get it based on dataId

1.配置错误 dataId问题 启动日志: 使用properties格式的文件: Ignore the empty nacos configuration and get it based on dataId[xxx-server] & group[DEFAULT_GROUP] Ignore the empty nacos configuration and get it based on dataId[xxx-s…