博弈论中静态博弈经典场景案例

news2024/11/29 9:51:43

博弈论中静态博弈经典场景案例

1、齐威王田忌赛马

    田忌赛马是中国家喻户晓的故事,故事讲述的是齐国大将田忌的谋士孙膑如何运用计谋帮助田忌在与齐威王赛马时以弱胜强的故事,这个故事其实本质也是一个博弈的过程。
    齐威王要和田忌赛马,赛马规则如下:
    故事中说齐威王经常要田忌与他赛马,赛马规则如下:每次双方各出3匹马,一对一比3场,每一场输方输一千斤铜给赢方。齐威王和田忌的3匹马按实力都可以分上、中、下三等,但齐威王的上、中、下3匹马分别比田忌的上、中、下3匹马略胜一筹,因为总是同等次的马进行比赛,因此田忌每次都连输3场。那这不是纯纯欺负人嘛,但实际上田忌的上马虽然不如齐威王的上马,但比齐威王的中马和下马都要好,而田忌的中马比齐威王的下马要好一些,因此孙膑看不下去田忌当冤大头,就给田忌出主意,让田忌用自己的下马对抗齐威王的上马,上马对抗齐威王的中马,中马对抗齐威王的下马,这样对于田忌而言就是二胜一负,能赚上个一千铜。
    将这个故事抽象成博弈,则博弈方自然是齐威王和田忌,博弈策略是己方马匹的出战顺序(注意双方都是一次性定下三场比赛的出战顺序,而非一场一场进行),那根据排列组合的知识就知道,每一方都有3!=6种策略选择,比如“上中下”、“中上下”等等;双方同时进行决策(静态博弈);赢一千铜记为1,输一千铜记为-1。如此就可以发现,因为双方均有6种策略可选,则可能得结果为6x6=36种,我们将双方的得益用矩阵表示,如此得到得益矩阵(payoff matrix),具体如下。其中,前一位数字表示齐威王的得益,后一位数字表示田忌的得益。

在这里插入图片描述

结合表格,我们思考一下该博弈的特点:
    首先,无论对齐威王还是田忌,博弈中的六种可选择策略本身相互之间并没有优劣之分。对齐威王来说,每一种策略对应六种结果,包括一种得益为3,四种得益为1,一种得益为-1 ,究竟最终得哪种结果,主要看对方策略与己方策略的对应情况,而不是己方策略本身。同样地,田忌也是如此。
    其次,各博弈方千万不能让对方知道或猜中自己的策略,因为一旦自己的策略被对方猜中,对方就可以针对性选择策略,己方必输无疑。这也意味着,如果重复多次得进行该博弈,任何一方的策略选择不能一成不变,变动不能有规律性,必须以随机的方式选择策略。

2、囚徒的困境

    “囚徒的困境”是博弈问题中相当经典的基本模型,该问题非常简单,却能很好地反映博弈问题的根本特征,也是有效解释众多经济现象的基本模型。下面介绍一下谢老师书中改编的版本:
    警察抓住两个合伙犯罪的罪犯,但缺乏足够证据指证他们的罪行。如果其中至少一人供认犯罪,就能确认罪名成立。为了得到所需的口供,警察将两名罪犯分别关押以防止串供或结成攻守同盟,并给他们同样的选择机会:如果两人都拒不认罪,则他们会被以较轻的妨碍公务罪各判1年徒刑;如果两人中有一人坦白认罪,则坦白者从轻处理,立即释放,另一人则将重判8年徒刑;如果两人同时坦白认罪,则他们将被各判5年监禁。
    本博弈的博弈方是两个罪犯,分别称“囚徒1”、“囚徒2”。本博弈两个博弈方的可选择策略均为“不坦白”和“坦白”两种。因为两个囚徒被隔离开,其中任何一人选择策略时都不可能知道另一人的选择是什么,因此不管他们决策的时间是否真正相同,我们都可以认为他们是同时决策的。
如果分别用-1、-5和-8表示罪犯被判刑1年、5年和8年的得益,用0表示罪犯被立即释放的得益,则可以用下图所示的得益矩阵将这个博弈表示出来。其中,前一个数字为囚徒1的得益,后一个数字为囚徒2的得益。
在这里插入图片描述

    根据个体理性行为准则,两个博弈方的目标都是实现自身的最大利益。首先可以肯定的是,在这个博弈中,两博弈方各自的利益不仅取决于他们自己选择的策略,也取决于对方的策略选择。每个博弈方选择自己的策略时,即使无法知道另一方的实际选择,也必须考虑另一方有两种可能的选择,而且另一方的选择对自己的利益影响很大。

  • 对于囚徒1:

    (1) 在囚徒2选择“坦白”的情况下,囚徒1的得益分别为-5(“坦白”)、-8(“不坦白”),因此该情况下,囚徒1的最优策略即上策(dominant strategy)为“坦白”;
    (2) 在囚徒2选择“不坦白”的情况下,囚徒1的得益分别为0(“坦白”)、-1(“不坦白”),因此该情况下,囚徒1的最优策略即上策(dominant strategy)也为“坦白”。

因此可以发现,虽然囚徒1的得益与囚徒2的策略有关,但不论囚徒2的策略如何,囚徒1的最优选择均是“坦白”!

  • 囚徒2也类似:

    (1)在囚徒1选择“坦白”的情况下,囚徒2的得益分别为-5(“坦白”)、-8(“不坦白”),因此该情况下,囚徒2的最优策略即上策(dominant strategy)为“坦白”;
    (2)在囚徒1选择“不坦白”的情况下,囚徒2的得益分别为0(“坦白”)、-1(“不坦白”),因此该情况下,囚徒2的最优策略即上策(dominant strategy)也为“坦白”。

所以,该博弈的最终结果必然是两博弈方都选择“坦白”,双方得益均为-5,即都被判5年徒刑。
但是!!!
    需要注意的是,在这个博弈中,无论是对两个囚徒总体(囚徒1和囚徒2的得益之和)来讲,还是对他们各自来讲,最佳的结果都不是同时“坦白”(-5,-5),而是都“不坦白”(-1,-1)。但是,由于两个囚徒不能串通,并且各人都追求自己的最大利益而不会顾及同伙的利益,因此只能实现对他们都不理想的结果,这也是该博弈被称为“囚徒的困境”的原因。当然,囚徒的困境对社会利益来说是理想的,因为罪犯都受到了应有的惩罚。但从博弈中两个决策者的立场上说则很不理想,因为既没有实现两人总体的最大利益,也没有真正实现自身的个体最大利益。

3、双寡头削价竞争

    双寡头削价竞争本质上也是囚徒的困境,其实囚徒的困境在社会经济中有很大的普遍性,在市场竞争的各个领域、政治、军事和法律等各种领域的问题中,都存在类似囚徒的困境现象。双寡头价格战就是其中一个典型案例。
    通过降价争夺市场是市场竞争中十分普遍的行为,但价格竞争并不一定是成功的策略,因此一个厂商降价往往会导致其他厂商也降价或者采取其他商业行为,而导致利润率以及销量的降低。这里用一个简单的双寡头两种价格的价格竞争模型来说明这个问题。
    设寡头1和寡头2是双寡头市场的两个寡头,它们原来用同一种较高的价格(“高价”)销售相同的产品。如果两个寡头不满足各自原来的市场份额和利润,就可能想通过降价争夺更大市场份额和更多利润。但自己降价可能引起对手的报复,目的并不一定能达到。假设两寡头同时“高价”各可以获得100万元利润;如果某个寡头单独降价,即单独采用“低价”,可以获得150万元利润,此时另一寡头因为市场份额被蚕食,利润将下降到20万元;如果另一寡头也降价,则两寡头都将只能得到70万元利润。得益矩阵如下图所示,前一个数字为寡头1的得益,后一个数字为寡头2的得益:
在这里插入图片描述

  • 对于寡头1:
    (1)当寡头2选择“高价”时,寡头1的得益分别为100(高价)、150(低价),因此该情况下,寡头1的最优策略为“低价”;
    (2)当寡头2选择“低价”时,寡头1的得益分别为20(高价)、70(低价),因此该情况下,寡头的最优策略为“低价”。

    可以发现,与囚徒的困境相似,虽然寡头1的得益与寡头2的策略有关,但不论寡头2的策略如何,寡头1的最优选择均是“低价”!寡头2也是如此,因此该博弈的最终结果必然是两博弈方都选择“低价”,双方得益均为70,这是两博弈方按照个体理性原则决策的必然结果 。
    虽然这个结果对两寡头来说都不理想,但因为两寡头都必须防备对方利用自己的合作精神(即认为自己会和对方合作,均保持高价)谋取利益,所以双方都不可能坚持采用“高价”,各得100万元利润的结果是无法实现的。
    囚徒困境式矛盾的存在,一定程度上否定了传统经济理论关于市场经济“看不见的手”总能把个人利己行为变为对集体、社会有利行为的论断,也说明了政府的组织协调在社会经济活动中是必需的,放任自流并不会导致全社会的最大福利。

4、猜硬币

    猜硬币是生活中最常见的游戏,具体来讲:一人用手盖住一枚硬币,由另一方猜是正面朝上还是反面朝上,猜对则猜者赢1元,盖硬币者输1元;否则,猜者输1元,盖硬币者赢1元。如果赢1元得益为1,输1元得益为-1,则得益矩阵如下,前一个数字为盖硬币方得益,后一个数字为猜硬币方的得益:
在这里插入图片描述
    其实,可以发现猜硬币博弈是个**“零和博弈”**,即不管结果是什么,总得益始终为0,直白点就是“不是你死,就是我亡”。田忌赛马其实也是一个零和博弈,不是齐威王输就田忌输。
    这就意味着,猜硬币博弈中没有哪个策略组合的双方策略相互是对对方策略的最佳对策,因此该博弈没有哪个策略组合双方同时愿意接受,因为我们无法像囚徒博弈一样,预测该博弈的结果。

5、夫妻之争

    与猜硬币没有最佳对策不同的是,“夫妻之争"博弈中存在两个最佳对策。一对夫妻得到两张时装表演票和同一时间的两张足球赛票。妻子更想去看时装表演而丈夫更想看足球,但又不愿或不能分头行动,双方争执不下,决定投票表决。若投票结果同选时装则去看时装表演,同选足球就去看足球比赛,如选择不一样则哪都不去。
    再假设若丈夫与妻子同看时装表演,妻子得益2单位,丈夫得益1单位;若丈夫与妻子都看足球赛丈夫得益3单位,妻子得益1单位;若因为双方选择不同什么都没看成,则双方得益均为0。得益矩阵如下图:
在这里插入图片描述

  • 对于妻子而言:
    当丈夫选择“时装”时,妻子的得益分别为2(时装)、0(足球),该情况下,妻子的最优策略为“时装”;
    当丈夫选择“足球”时,妻子的得益分别为0(时装)、1(足球),该情况下,妻子的最优策略为“足球”。
  • 对于丈夫而言:
    当妻子选择“时装”时,丈夫的得益分别为1(时装)、0(足球),该情况下,丈夫的最优策略为“时装”;
    当妻子选择“足球”时,丈夫的得益分别为0(时装)、3(足球),该情况下,丈夫的最优策略为“足球”。

    所以,其实该博弈有两个最佳对策(时装,时装)、(足球,足球),任意一个均具有合理性,因此也无法准确预测该博弈的结果。
    在经济活动中有许多与夫妻之争相似的博弈问题,制式问题就是典型的例子。电器和电子设备往往有不同的原理或相关技术标准,我们称之为不同的制式。如果生产相关电器或电子设备的厂商采用相同的制式,产品之间就能相互匹配,零配件也可能相互通用,这对于推广各自的产品和在生产经营中进行合作很有帮助。设有两个厂商同时计划引进彩电生产线,而彩电有A、B两种制式,这时候两个厂商之间就有一个选择制式的博弈问题。
在这里插入图片描述

    与之类似的,还有猎鹿博弈(stag-hunting)。两个人同时发现1头鹿和2只兔子,如果两个人合力抓鹿,可以抓住这头价值10单位的鹿平分,兔子就抓不到了;如果两个人都抓兔子,各可以抓到1只价值3单位的兔子,鹿会跑掉;如果一个人选择抓兔子,而另一个人选择抓鹿,抓兔子的能抓到1只兔子,抓鹿的人什么也抓不到。再假设两个人来不及商量,必须在瞬间作出决策,这就是一个典型的静态博弈问题。这个博弈的利益关系下图所示:
在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1052191.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

LongLoRA:不需要大量计算资源的情况下增强了预训练语言模型的上下文能力

麻省理工学院和香港中文大学推出了LongLoRA,这是一种革命性的微调方法,可以在不需要大量计算资源的情况下提高大量预训练语言模型的上下文能力。 LongLoRA是一种新方法,它使改进大型语言计算机程序变得更容易,成本更低。训练LLM往…

2023-09-30 LeetCode每日一题(全部开花的最早一天)

2023-03-29每日一题 一、题目编号 2136. 全部开花的最早一天二、题目链接 点击跳转到题目位置 三、题目描述 你有 n 枚花的种子。每枚种子必须先种下,才能开始生长、开花。播种需要时间,种子的生长也是如此。给你两个下标从 0 开始的整数数组 plant…

【每日一题】全部开花的最早一天

文章目录 Tag题目来源题目解读解题思路方法一:贪心排序 写在最后 Tag 【贪心】【排序】【数组】【2023-09-30】 题目来源 2136. 全部开花的最早一天 题目解读 每一朵花需要先种下种子才会生长、开花。种种子需要花一些时间,生长也需要一些时间。每天只…

26973-2011 空气源热泵辅助的太阳能热水系统 储水箱容积大于0.6m3 技术规范

声明 本文是学习GB-T 26973-2011 空气源热泵辅助的太阳能热水系统 储水箱容积大于0.6m3 技术规范. 而整理的学习笔记,分享出来希望更多人受益,如果存在侵权请及时联系我们 1 范围 本标准规定了空气源热泵辅助的太阳能热水系统的定义、符号和单位、组成与分类、设计要求、技术…

excel筛选后求和

需要对excel先筛选,后对“完成数量”进行求和。初始表格如下: 一、选中表内任意单元格,按ctrlshiftL,开启筛选 二、根据“部门”筛选,比如选择“一班” 筛选完毕后,选中上图单元格,然后按alt后&…

PyQt/PySide ImportError: DLL load failed while importing Shiboken,PyQt库和python

最近在测试PySide项目&#xff0c;在新环境下报错了&#xff1a;ImportError: DLL load failed while importing Shiboken: 找不到指定的程序。 Traceback (most recent call last):File "D:/xxx.py", line 10, in <module>from PySide6.QtWidgets import QAp…

excel中将一个sheet表根据条件分成多个sheet表

有如下excel表&#xff0c;要求&#xff1a;按月份将每月的情况放在一个sheet中。 目测有6个月&#xff0c;就应该有6个sheet&#xff0c;每个sheet中体现本月的情况。 一、首先增加一个辅助列&#xff0c;月份&#xff0c;使用month函数即可。 填充此列所有。然后复制【月份】…

基于微信小程序的网络安全科普题库答题系统设计与实现(源码+lw+部署文档+讲解等)

文章目录 前言系统主要功能&#xff1a;具体实现截图论文参考详细视频演示为什么选择我自己的网站自己的小程序&#xff08;小蔡coding&#xff09;有保障的售后福利 代码参考源码获取 前言 &#x1f497;博主介绍&#xff1a;✌全网粉丝10W,CSDN特邀作者、博客专家、CSDN新星计…

数据集笔记:旧金山共享单车OD数据

数据地址&#xff1a;System Data | Bay Wheels | Lyft

嵌入式学习笔记(38)什么是PWM

PWM&#xff08;pulse width modulation 脉宽调制&#xff09; (2)PWM波形是一个周期性波形&#xff0c;周期为T&#xff0c;在每个周期内波形是完全相同的。每个周期由一个高电平和低电平组成。 (3)PWM波形有2个重要参数&#xff1a;一个是周期T&#xff0c;另一个是占空比d…

第十四届蓝桥杯大赛软件赛决赛 C/C++ 大学 B 组 试题 D: 合并数列

[蓝桥杯 2023 国 B] 合并数列 【问题描述】 小明发现有很多方案可以把一个很大的正整数拆成若干正整数的和。他采取了其中两种方案&#xff0c;分别将他们列为两个数组 { a 1 , a 2 , ⋯ a n } \{a_1, a_2, \cdots a_n\} {a1​,a2​,⋯an​} 和 { b 1 , b 2 , ⋯ b m } \{b…

springboot项目中定时任务注解@Scheduled未按cron表达式执行

springboot项目中定时任务注解Scheduled未按cron表达式执行 背景问题复现原因分析解决方法其他原因 背景 在将一个类注入到ioc后&#xff0c;其中定义了几个定时任务&#xff0c;分别是每隔十秒执行一次&#xff0c;但实际情况却是半小时才执行一次&#xff0c;故开始分析原因&…

【成功解决】ERROR: cuda failure (unknow error) in error_util.h:91

点击目录可跳转 起因原因解决办法 起因 安装cudnn时&#xff0c;想进行验证操作&#xff0c;进入官方提供的$HOME/cudnn_samples_v8/mnistCUDNN/后&#xff0c;运行./mnistCUDNN时&#xff0c;报了标题的错误。如下图&#xff1a; 顺便提一下&#xff0c;我是不知道为什么报错…

UE5屏幕适配

一、本程序设计发布在手机上&#xff0c;首先确定屏幕的设计分辨率&#xff0c;这里我们选择iphone6s&#xff0c;750x1334。 二、设置DPI Scale为1.0的比例&#xff0c;点击齿轮标志 因为我们这个程序是手机竖屏使用的&#xff0c;所以DPI Scale Rule选择Shortest Side&#…

容器网络概述

容器就是 Container&#xff0c;而 Container 的另一个意思是集装箱。其实容器的思想就是要变成软件交付的集装箱。集装箱的特点&#xff0c;一是打包&#xff0c;二是标准。 封闭的环境主要使用了两种技术&#xff0c;一种是看起来是隔离的技术&#xff0c;称为 namespace&am…

Pycharm中右键运行python程序时出现Run ‘pytest in XXX.py

新版本pycharm2022&#xff0c;调试程序的时候&#xff0c;无法进入__main__&#xff0c;最后发现是选择debug模式是pytest。 主要原因是有个函数名为test。 右键运行代码时和正常运行不一致&#xff0c;只执行单一函数test。右键菜单出现以下画面&#xff1a;“ Debug Pytho…

leetCode 279.完全平方数 动态规划 + 完全背包

给你一个整数 n &#xff0c;返回 和为 n 的完全平方数的最少数量 。完全平方数 是一个整数&#xff0c;其值等于另一个整数的平方&#xff1b;换句话说&#xff0c;其值等于一个整数自乘的积。例如&#xff0c;1、4、9 和 16 都是完全平方数&#xff0c;而 3 和 11 不是。 示…

队列的实现——单链表

队列&#xff1a;只允许在一端进行插入数据操作&#xff0c;在另一端进行删除数据操作的特殊线性表&#xff0c;队列具有先进先出FIFO(First In First Out) 入队列&#xff1a;进行插入操作的一端称为队尾 出队列&#xff1a;进行删除操作的一端称为队头 那么我们应该用顺序变…

No156.精选前端面试题,享受每天的挑战和学习

🤍 前端开发工程师(主业)、技术博主(副业)、已过CET6 🍨 阿珊和她的猫_CSDN个人主页 🕠 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 🍚 蓝桥云课签约作者、已在蓝桥云课上架的前后端实战课程《Vue.js 和 Egg.js 开发企业级健康管理项目》、《带你从入…

Spring Boot:利用JPA进行数据库的增改

目录 JPA介绍Service接口Service和Autowired示例代码 Dao数据库操作层Repository示例代码 控制器文件示例代码-增加增加成功示例代码-修改修改成功 JPA介绍 JPA&#xff08;Javaa Persistence API)一种用于持久化 Java 对象到关系型数据库的标准规范。它提供了一种统一的方式来…