蒙蒂霍尔悖论

news2024/11/24 11:56:22

贝叶斯与频率主义对蒙蒂霍尔问题的解

在定义概率时,通常有两种思想流派:贝叶斯主义和频率主义。前者将概率视为我们对事件发生的信念程度,而后者则将其视为事件发生的相对频率。这篇文章介绍了使用贝叶斯和频率主义方法来解决著名的蒙蒂霍尔问题。

alt

蒙蒂霍尔问题的插图

蒙蒂霍尔问题

我第一次偶然发现这个概率谜题是在电影21。这个谜题起源于一个古老的美国游戏节目Let's Make a Deal,并以主持人Monty Hall的名字命名。

基于维基百科,这在1990年给Marilyn vos Savant的“Ask Marilyn”专栏的一封信中广为人知:

假设你正在参加一个游戏节目,你可以选择三扇门:一扇门后面是一辆汽车;在其他人后面,是山羊。你选择一扇门,说1号,主持人,谁知道门后面是什么,打开另一扇门,说3号,里面有一只山羊。然后他对你说:“你想选择2号门吗?转换选择对您有利吗?

玛丽莲建议你应该坚持切换,因为这会使你赢得赛车的机会从 1/3 增加到 2/3。这个答案遭到了巨大的批评,因为人们直觉上倾向于认为,由于只剩下两扇门,那么两扇门后面的汽车的概率是 1/2。因此,无论您选择切换门,几率都是一样的。

在这篇博文中,我将演示如何使用贝叶斯或频率主义方法来回答这个悖论。

像贝叶斯一样思考

贝叶斯学派对概率采取主观方法,并以贝叶斯定理为基础。它基本上是由以下公式定义的条件概率概念。

简而言之,结果概率也称为后验概率是使用三个组成部分得出的:可能性、先验概率和观察证据的概率(0 到 1 之间的值)。

alt

使用贝叶斯定理来解释为什么不同的人对相似经验证据的评价不同。

贝叶斯定理

在Monty Hall问题的背景下,我们有兴趣比较切换或坚持我们最初选择的门之间的概率,因为主机选择打开一扇后面有山羊的门。

使用上面提出的示例问题,假设门 3 已被揭示为山羊,汽车将在门 1(我们最初的选择)或门 2(如果我们选择切换)后面。

alt

为了解决这个问题,让我们应用贝叶斯定理公式并比较

P(门1 = 车| 打开=门3)

P(门2 = 车| 打开=门3)

贝叶斯定理在蒙蒂霍尔问题中的应用

先验概率 P(A)

让我们从最简单的计算概率开始,先验概率。这是指在游戏开始时,在门 1 打开之前,汽车在门 2 和门 3 后面的初始预期概率。

假设汽车是随机分配的,每扇门都有平等的机会让汽车落后。因此,P(门1 = 汽车)和 P(门 2 = 车)的概率相等为 1/3。

可能性 P(B|A)

接下来,我们将计算主持人为各自的假设打开门 3 的可能性。

第1个假设,如果汽车在门 1 后面,主持人可以打开门 2 或门 3 以露出一只山羊。因此:

P(打开 = 门 3 | 门 1 = 汽车) = 1/2

另一方面,如果汽车在门 2 后面,主持人别无选择,只能打开门 3,因为它是唯一的一扇门后有山羊的门。因此,对于第二个假设,

P(打开 = 门 3 | 门 2 = 汽车) = 1

联合概率 P(B|A) X P(A)

在已知可能性和先验概率值的情况下,我们可以计算出两个假设的公式的分子值。

P(打开 = 门 3 | 门 1 = 汽车) X P(门 1 = 汽车) = 1/2 X 1/3 = 1/6

P(打开 = 门 3 | 门 2 = 汽车) X P(门 1 = 汽车) = 1 X 1/3 = 1/3

观察到的证据概率 P(B)

我们可以通过简单地将联合概率相加来得出观察到的证据的概率。此值表示主持人在参赛者选择门 3 的情况下选择打开门 1 的概率。

P(打开 = 门 3) = 1/6 + 1/3 = 1/2

后验概率 P(A|B)

最后,我们可以通过将上述所有派生值输入公式来求解后验概率。

P(门 1 = 汽车 | 打开 = 门 3) = (1/6) / (1/2) = 1/3

P(门 2 = 汽车 | 打开 = 门 3) = (1/3) / (1/2) = 2/3

后验概率值告诉我们,主持人在门 1 后面有山羊,坚持选择门 3,那么赢得汽车的几率是 1/3。相反,如果我们选择接受切换到门 2 的提议,我们的机会就会翻倍到 2/3。

因此,贝叶斯方法支持Marilyn vos Savant的建议,即如果可以选择,请始终进行切换。

像频率主义者一样思考

与贝叶斯方法相反,顾名思义,频率主义者根据采样频率来确定概率。例如,如果我们想知道在抛硬币中获得“正面”的概率,我们可以掷硬币进行x次试验,并根据“正面”发生的频率分布确定概率。

正如伯努利大数定律所声称的那样,事件发生的长期频率将收敛于其理论概率。因此,为了解决Monty Hall问题,我们可能会在大量的试验中运行游戏节目谜题的模拟,并比较坚持我们最初选择的决定和改变选择的决定之间的赢得汽车的频率。

对于这个项目,我使用python编程语言执行了蒙特卡罗模拟。蒙蒂霍尔游戏被模拟了相当多的重复,并记录了各自策略的获胜几率。模拟唯一需要的包是随机包。首先,我创建了三个空列表来存储每个示例模拟的结果。

初始化空的数组存放模拟过程中的数

chance_of_winning_ifswitch_list = []
#放弃最初选择,改选另外的门

chance_of_winning_ifdonotswitch_list = []
#坚持最初选择的门

percentage_diff_list = []
相差的百分比

接下来,使用“for-loops”设置模拟。

在每个模拟循环中,汽车和山羊的位置被随机分配,并选择随机门作为参赛者的初始选择。鉴于游戏主持人总是会用山羊打开另一扇门,只有当最初选择的门碰巧后面有汽车奖品时,切换的决定才会适得其反。

换句话说,如果选择不切换选择,获胜的概率相当于当初选择带车门的概率。因此,包含一个“if-else”条件语句来检查最初选择的门是否有汽车。

如果所选门后面没有汽车,我们分配一个值 1 来表示选择切换选项时的获胜事件。如果所选门后面有汽车,我们分配一个值 0 来表示选择不切换选择时的获胜事件。

为了确定每种策略的获胜频率,获胜的几率是根据Monty Hall游戏的1,000个模拟回合的样本计算的。

此抽样重复 10,000 次,以确定每种策略的获胜百分比分布。设置随机种子值以确保结果的可重复性。

# Repeat 10000 trials with 1000 samples per trial

for i in range(10000):    
    results_list = []    

    for i in range(1000):        
        door_list = ["car""goat""goat"]                 
        random.shuffle(door_list)        
        chosen_door_number = random.sample(range(3), 1)        
        chosen_door = door_list[chosen_door_number[0]]        
        
        if chosen_door != "car":            
            results_list.append(1)        
        else:
            results_list.append(0)
    
    # Compute winning percentage if choose to switch  
    chance_of_winning_ifswitch = sum(results_list)/len(results_list)*100              
    
    # Compute winning percentage if choose not to switch
    chance_of_winning_ifdonotswitch = 100 - chance_of_winning_ifswitch                    
    
    # Compute difference in winning percentage between the two strategies             
    percentage_diff = chance_of_winning_ifswitch - chance_of_winning_ifdonotswitch  
             
    # Append the results to respective lists                
    chance_of_winning_ifswitch_list.append(chance_of_winning_ifswitch)                             
    chance_of_winning_ifdonotswitch_list.append(chance_of_winning_ifdonotswitch)    
    percentage_diff_list.append(percentage_diff)

下图说明了基于我们的模拟结果的两种策略的获胜赔率分布。蓝色直方图表示策略切换的分布,而黄色直方图表示策略坚持初始选择的分布。

alt

根据中心极限定理,当样本量较大时,样本均值的分布将近似于高斯分布或正态分布。正如我们从大量模拟试验中预期的那样,我们观察到一条钟形曲线,该曲线表征了正态分布。

两个直方图的 x 轴清楚地表明了两种策略之间的获胜几率差异。

如果你选择切换,62-72%的机会开着车回家,而如果你选择不切换,则有28-38%的机会。

为两种策略计算的 95% 置信区间进一步支持了这一点。在 95,10 次试验抽样获胜赔率的 000% 内,如果您切换,获胜的频率在 66.646% 和 66.705% 之间,而坚持相同的门选择将在 33.295% 和 33.354% 之间。

由于 95% 置信区间不重叠,我们可以推断两种策略之间的胜率存在统计上的显著差异。

事实上,如第三个直方图橙色所示,我们有 95% 的信心选择切换会使我们的获胜几率增加 33.293 至 33.410%。因此,频率主义的方法也支持玛丽莲·沃斯·萨凡特的建议,即如果可以选择,请始终进行切换。

结论

这篇博文展示了使用贝叶斯和频率主义方法来解决蒙蒂霍尔问题。通过上面的例子,我们可以看到推导概率值的不同方法。

虽然这两种方法不同,但在蒙蒂霍尔问题的背景下,推导出的概率彼此相似。结果清楚地表明,无论你是赞同贝叶斯范式还是频率范式,改变你的选择总是一个更明智的选择,以增加赢得汽车的机会。

模拟、分析和可视化都是使用 Python 进行的。

# Import required packages

import random
import numpy as np
import scipy.stats
import matplotlib.pyplot as plt
import pandas as pd

####----Create Monty Hall Game Simulation----####

# Create empty lists to store simulation results output
chance_of_winning_ifswitch_list = []
chance_of_winning_ifdonotswitch_list = []
percentage_diff_list = []

# Set a seed value for reproducibility
random.seed(1234)

# Create simulation using for-loops
# Repeat 10000 trials with 1000 samples per trial
for i in range(10000):
    results_list = []
    
    for i in range(1000):
        door_list = ["car""goat""goat"]
        random.shuffle(door_list)
    
        chosen_door_number = random.sample(range(3), 1)
        chosen_door = door_list[chosen_door_number[0]]
    
        if chosen_door != "car":
            results_list.append(1)
        else:
            results_list.append(0)
    
  
    chance_of_winning_ifswitch = sum(results_list)/len(results_list)*100              # Compute winning percentage if choose to switch
    chance_of_winning_ifdonotswitch = 100 - chance_of_winning_ifswitch                # Compute winning percentage if choose not to switch
    percentage_diff = chance_of_winning_ifswitch - chance_of_winning_ifdonotswitch    # Compute difference in winning percentage between the two strategies
    
    # Append the results to respective lists
    chance_of_winning_ifswitch_list.append(chance_of_winning_ifswitch)                
    chance_of_winning_ifdonotswitch_list.append(chance_of_winning_ifdonotswitch)
    percentage_diff_list.append(percentage_diff)


####----Analysis of the simulation results----####

# Create a function to calculate 95% confidence intervals
def mean_confidence_interval(data, confidence=0.95):
    a = 1.0 * np.array(data)
    n = len(a)
    m, se = np.mean(a), scipy.stats.sem(a)
    h = se * scipy.stats.t.ppf((1 + confidence) / 2., n-1)
    return m, m-h, m+h

# Compute 95% confidence intervals of chance of winning if choose to switch
mean_confidence_interval(chance_of_winning_ifswitch_list)

# Compute 95% confidence intervals of chance of winning if choose not to switch
mean_confidence_interval(chance_of_winning_ifdonotswitch_list)

# Compute 95% confidence intervals of difference in chances of winning between the two strategies
mean_confidence_interval(percentage_diff_list)

####----Simple visualisation of the simulation results----####

fig = plt.figure(figsize = (15,8))
ax1, ax2, ax3 = fig.subplots(3, 1)

# Title and caption of plot
fig.suptitle("Comparison of winning odds between strategies", fontsize = 20, fontweight = "bold")
fig.text(.99, .010, "Visualisation:@nxrunning", ha='right', fontsize = 15)

# Subplot number 1
ax1.set_title("Distribution of winning percentage if choose not to switch", loc = "left", fontweight = "bold")
ax1.hist(chance_of_winning_ifswitch_list, alpha = 1, color = "#023047", edgecolor = "white", bins = (30))
ax1.set_ylabel("Frequency")
ax1.set_xlabel("Odds of winning (%)", fontsize = 13)
ax1.annotate("95% Confidence Interval:\n[66.646, 66.705]", xy = (70, 500), fontsize = 13)

# Subplot number 2
ax2.set_title("Distribution of winning percentage if choose not to switch", loc = "left", fontweight = "bold")
ax2.hist(chance_of_winning_ifdonotswitch_list, alpha = 1, color = "#ffb703", edgecolor = "white", bins = (30))
ax2.set_xlabel("Odds of winning (%)", fontsize = 13)
ax2.set_ylabel("Frequency")
ax2.annotate("95% Confidence Interval:\n[33.295, 33.354]", xy = (36.7, 500), fontsize = 13)

# Subplot number 3
ax3.set_title("Distribution of differences in odds of winning between the two strategies", loc = "left", fontweight = "bold")
ax3.hist(percentage_diff_list, alpha = 1, color = "#fb8500", edgecolor = "white", bins = (30))
ax3.set_ylabel("Frequency")
ax3.set_xlabel("Odds of winning (%)", fontsize = 13)
ax3.annotate("95% Confidence Interval:\n[33.293, 33.410]", xy = (40, 500), fontsize = 13)
fig.tight_layout()

# Removing top and right borders
ax1.spines['top'].set_visible(False)
ax1.spines['right'].set_visible(False)
ax2.spines['top'].set_visible(False)
ax2.spines['right'].set_visible(False)
ax3.spines['top'].set_visible(False)
ax3.spines['right'].set_visible(False)

# Adjust space between title and subplots
plt.subplots_adjust(top=0.90)

# Save plot
fig.savefig('Montyhallproblemsimulation.png', dpi=500)

完整的代码可以在这里找到。

本文由 mdnice 多平台发布

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/478930.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C++每日一练:小艺照镜子(详解分治法)

文章目录 前言一、题目二、解题1.分析 总结 前言 大过节的,不想去看人后脑勺,就做点题来玩。挑了小艺照镜子,百分通过~ 提示:以下是本篇文章正文内容,下面案例可供参考 一、题目 题目名称: 小艺照镜子 …

【论文解读】(如何微调BERT?) How to Fine-Tune BERT for Text Classification?

文章目录 论文信息1. 论文内容2. 论文结论2.1 微调流程2.2 微调策略(Fine-Tuning Strategies)2.3 Further Pretrain 3. 论文实验介绍3.1 实验数据集介绍3.2 实验超参数3.3 Fine-Tuning策略探索3.3.1 处理长文本3.3.2 不同层的特征探索3.3.3 学习率探索(灾难性遗忘探…

Baumer工业相机堡盟相机如何使用ROI感兴趣区域功能( PARTIAL SCAN ROI功能的优点和行业应用)(C#)

项目场景 Baumer工业相机堡盟相机是一种高性能、高质量的工业相机,可用于各种应用场景,如物体检测、计数和识别、运动分析和图像处理。 Baumer的万兆网相机拥有出色的图像处理性能,可以实时传输高分辨率图像。此外,该相机还具…

利用 ChatGPT4 回复的 markdown 文本生成 ppt

本篇博文不涉及账号以及基础网络知识,大伙可以自动搜索。 比如我最近要分享一篇关于 TCP 的分享,那么我可以设置如下 Prompt 我最近要做一篇关于 tcp 入门的 ppt 分享,帮我列出大纲以及需要注意的事项? 接下来就是 ChatGPT4 给…

RocketMQ的学习历程(3)----RocketMQ部署(docker版)

RocketMQ部署(docker版) 1. 部署开始前的准备 一台linux机器。(我这里使用的是阿里云的一个centos7的服务器)docker环境以及相关的简单知识。一些计算机网络的简单知识。(可以帮你透彻了解为什么这么部署) docker部署十分简单快捷…

JAVA85-135

JAVA85-135 字符集详解解码与编码方法 字符流FileWriter 拷贝文件夹字节缓冲流拷贝文件(一次读写一个字节)字节缓冲流拷贝文件(一次读写一个字节数组) 字符缓冲流控制软件运行次数 序列化流反序列化流/对象操作输入流打印流字节打…

macOS Monterey 12.6.5 (21G531) OC 0.9.1 / Cl 5151 / PE 三分区原版黑苹果镜像

苹果近期发布了 macOS Big Sur 11.7.6 和 macOS Monterey 12.6.5 更新,本次更新重点修复了标记为 CVE-2023-28206 的漏洞,在 macOS 13.3.1 更新中已修复,推荐大家安装升级。 镜像下载: macOS Monterey 12.6.5 (21G531) 三分区原版…

【面试】嵌入式C语言题目整理

【面试】嵌入式C语言题目整理 描述内存四区。 内存四区分为:代码区、静态区、堆区、栈区 代码区就是用来存放代码的。 静态区用来存放全局变量、静态变量、常量(字符串常量、const修饰的全局变量)。 堆区中的内存是由程序员自己申请和释放的&…

《高性能MySQL》读书笔记

《高性能MySQL》 第一章 MySQL架构与历史第二章 MySQL基准测试第三章 服务器性能剖析第四章 Schema与数据类型优化第五章 创建高性能的索引第六章 查询性能优化第七章 MySQL高级特性第八章 优化服务器设置第九章 操作系统与硬件优化第十章 复制第十一章 可扩展的MySQL第十二章 …

sed进阶之多行命令

shell脚本编程系列 前面使用sed编辑器的基础命令时,所有的命令都是针对单行数据执行操作的。在sed编辑器读取数据流时,它会根据换行符的位置将数据分成行。sed编辑器会根据定义好的脚本命令,一次处理一行数据,然后移到下一行重复这…

numpy稀疏矩阵拼接

今天我发现numpy中的array拼接时dense矩阵和sparse矩阵拼接使用的形式是不一样的,测试如下 普通矩阵拼接 import numpy as npaa np.random.randn(4,3) bb np.ones((4,3)) ccnp.c_[aa,bb] cc.shape结果如下 sparse矩阵拼接 from scipy.sparse import *row [1,1,…

DC-7通关详解

信息收集 漏洞发现 web提示我们说弱口令可能不会奏效 那么我们就先不考虑弱口令 searchsploit搜payload打打看,无果 看别人的wp知道了是通过web左下角的这个玩意去github搜 在这个仓库用户唯一的仓库中看config.php 发现账号密码 尝试后台和ssh登录 ssh登录成功 提权 当前…

一款免安装、多平台兼容的 拾色器(Color Picker)

文章目录 场景需求场景需求 Chrome Google DevTools 中的 拾色器 用法其他浏览器 场景需求 场景 我是一个前端开发人员,我写好的界面给老板过目。老板说有个地方颜色需要调整,然后发我一张图片指了指说就用这个位置这样的红色,我看挺合适。…

数字化时代 | 服务数字化创新和转型全景视图

本文我全面介绍一下数字化时代,服务将往何处去,将如何设计和推进数字化创新和转型。 Figure 1 服务创新和转型全景视图 如上图所示,在我CRM3.0理论体系中,服务创新和转型涉及到四个层面的内容: 服务定位和目标&#…

Python数据分析script必备知识(三)

Python数据分析script必备知识(三) 1.单个文件,双个文件,三个文件的读取方式 新建1.txt文件,2.txt文件,3.txt文件,效果如下 执行代码 """ 单文件,双文件,三文件的读取方式Python的读写 file.read() ———— 一次性读取整个文件内容,推荐使用re…

【信息安全案例】——系统软件安全(学习笔记)

📖 前言:操作系统是管理系统资源、控制程序执行、提供良好人机界面和各种服务的一种系统软件,是连接计算机硬件与上层软件和用户之间的桥梁。因此,操作系统是其他系统软件、应用软件运行的基础,操作系统的安全性对于保…

React框架课时二认识项目的结构目录一

1react项目的目录的内容信息 ├── README.md 使用方法的文档 ├── node_modules 所有的依赖安装的目录 ├── package-lock.json 锁定安装时的包的版本号,保证团队的依赖能保证一致。 ├── package.json ├── public 静态公共目录 └── src 开发用的源代码目录 2 图…

英伟达Jetson NX,AI配置。安装SDK Components

目录 0.前言 1.准备 2.安装 3.检验 4.总结 0.前言 五一了,劳动节劳个动。推荐一首歌《花房姑娘》。 1.准备 接上篇博客英伟达Jetson NX套件刷机 算是完整配置英伟达这个Jetson AI。说来也是强,把GPU的能力用在了算力上,CUDA可以的。 查看…

SqlServer数据库中文乱码问题解决方法

这个问题在网上找了很多资料都没找到真正解决问题的办法,最终去了官网,终于找到问题的答案了,整理出来做个记录。 问题描述: 项目中遇到一个问题,sqlserver中的数据是ok的,结果保存到mysql中是乱码&#…

PostgreSQL数据库

0 安装 我使用的操作系统为Ubuntu。 安装命令: sudo apt-get update sudo apt-get install postgresql postgresql-client 进入postgres: sudo -i -u postgres psql 退出命令: \q PostgreSQL启动服务等: sudo /etc/init.d/postgr…