1、简述
博弈论是数学的一个分支,专注于分析此类博弈。博弈论可以分为两个主要分支学科:经典博弈论和组合博弈论。经典博弈论研究玩家同时移动、下注或制定策略的游戏。
从数学意义上讲,游戏是指玩家根据定义的规则做出理性决策,试图获得某种回报的情况。博弈论是数学的一个分支,主要研究这类博弈的分析。博弈论可以分为两个主要的子学科:经典博弈论和组合博弈论。
经典博弈论研究玩家同时移动、下注或制定策略的游戏。因此,玩家经常发现自己对游戏的某些方面一无所知。由于缺乏信息,这些游戏的玩家更有可能依赖预测和机会。例子包括扑克或石头、纸、剪刀。
另一方面,组合博弈论是对两人游戏的研究,其中每个玩家在整个游戏过程中对游戏的各个方面都有完整的了解。这些游戏通常是轮流进行的,通常不涉及偶然因素。例子包括国际象棋或跳棋。此外,如果所有玩家从每个位置都有相同的可能动作,那么组合游戏就被认为是公正的。否则,这场比赛就被称为有偏向的。
博弈论可以帮助我们找到竞争情况下的最佳决策,或合作情况下最公平的决定。每个参与者的结果取决于他们的决定和其他玩家的决定。 它在商业、军事、体育、金融、个人生活、游戏等方面都很有用。 让我们看一个例子,看看博弈论如何帮助我们找到最佳决策。
2、纳什均衡
纳什均衡是美国数学家约翰·纳什(1928-2015)最早提出的一个概念。如果没有玩家在考虑所有其他玩家的策略后有动机改变其个人游戏策略,则称非合作游戏处于纳什均衡。囚徒困境是纳什均衡的一个经典例子。提醒一下,囚犯困境是指两名囚犯被判为共犯的情况。囚犯们被单独监禁,因此他们之间没有交流的方法。然后向他们每人提交以下建议:
i.如果两人都供认不讳,他们将各自入狱8年。
ii。如果其中只有一人认罪,他将被释放,而另一人将在监狱中度过10年。
iii.如果两人都不认罪,他们将各自入狱一年。
当两个犯人都认罪时,这个游戏处于纳什均衡。为什么?因为在这种情况下,两名囚犯都不会因为改变策略而获益。如果囚犯1改变策略,保持沉默,那么他将被判处比认罪更长的监禁,而囚犯2将能够逍遥法外。囚犯2也应该按照同样的逻辑来维持他的策略。尽管对整个群体来说,最好的策略是双方都保持沉默,但囚犯个人最好认罪,因为他们事先无法知道另一名囚犯的策略,而在其他囚犯认罪时保持沉默将导致10年监禁。
纳什均衡可以应用于各种现实生活中的情况。例如,它解释了我们过度捕捞海洋的原因:尽管过度捕捞显然对整个生态系统不利,但对单个公司来说,停止捕捞是不好的,因为这样一来,该公司将停止盈利,而其他公司将继续捕鱼,从而继续盈利。纳什均衡也可以应用于经济、战争、政治和无数其他领域。
3、囚徒困境
除了上述两种分类之外,游戏还可以用多种方式进行分类。其中最明显的是根据玩家数量对游戏进行分类。通常将游戏描述为n人游戏,其中n是大于或等于1的整数,表示参与特定游戏所需的玩家数量。
玩家移动(或不移动)的顺序是对游戏进行分类的另一种简单方法。在同时进行的游戏中,所有玩家都在同一时间移动。相反,在顺序游戏中,在任何给定时间只有一名玩家可以移动。有些游戏可能不一定属于这两类。
游戏也可以根据可能的总奖金进行分类。常和游戏或零和游戏是指无论玩家采取什么行动,总可能奖金的总和都保持不变的游戏;也就是说,一些玩家获得的奖金之和必须等于其他玩家的损失之和。例如,在扑克中,玩家为了一笔固定的钱而竞争。每个玩家的决定不会影响可用的奖金。然而,在可变金额游戏中,可用的总奖金可能会根据支付者的行为而变化。
变和对策可以进一步分为以下子群:合作对策和非合作对策。合作游戏的玩家可以订立具有约束力的协议,如可执行的合同,而非合作游戏的参与者不得订立任何具有约束力的安排。例如,假设有两个人,一个卖家和一个买家,希望完成一笔商业交易。当他们试图协商价格时,这些人正在参与一场非合作游戏。如果买方签署了一份合同,同意支付特定的价格,那么这就变成了一场合作游戏。
囚犯的困境是一个可变和游戏的例子。
凯西和达纳因入室盗窃被捕。他们分在不同的房间,无法串供。
凯西被告知:
如果你们都不说话,你们都会因非法侵入罪被监禁1 个月。
如果你指控 Dana:你无罪释放,Dana 会被判 10 个月。
如果 Dana 指控你:你被判10 个月,Dana 无罪释放 。
如果你们都互相指责,你们都会被判6 个月的刑期。
你建议凯西做什么?
所以也许凯西和达纳都应该保持沉默?这样他们每人只有1个月的监禁。
但这种结果是不可控的。 因为任何一方都可以做出“我自由,你监禁10 个月”的决定。 那么该怎么办?
我们可以从下表中看到,可能的矩阵。
达纳 | |||
保持沉默 | 责怪凯西 | ||
凯西 | 保持沉默 | -1 , -1 | -10 , 0 |
责备达纳 | 0 , -10 | -6 , -6 |
凯西若保持沉默,就有可能被判入狱10个月, 所以比较可能的是他们每人被判处6个月的刑期。