【博弈论3——二人博弈的纳什均衡】

news2025/1/8 5:35:35

1.俾斯麦海之战

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

2. 零和博弈的定义

零和博弈(Zero-Sum Game)是一种博弈论的基本概念,指的是在博弈过程中,博弈参与者之间的收益和损失之和总是一个常数,特别是总和为零。即博弈一方的收益必然等于另一方的损失,不存在共赢或多赢的情况。换句话说,在零和博弈中,博弈双方的利益是对立的,博弈的结果是一方得利必定伴随着另一方的损失,整个博弈的总体价值是恒定不变的。
在这里插入图片描述

3. 纯策略纳什均衡

假设零和博弈 G = { S 1 , S 2 ; A } G=\{S_1,S_2;A\} G={S1,S2;A},其中 S 1 = { A 1 , A 2 . A 3 } S_1=\{A_1,A_2.A_3\} S1={A1,A2.A3}, S 2 = { B 1 , B 2 . B 3 } S_2=\{B_1,B_2.B_3\} S2={B1,B2.B3},
A = [ 6 − 1 0 3 1 2 − 3 0 − 1 ] A=\begin{bmatrix} 6 & -1 & 0 \\ 3 & 1 & 2 \\ -3 & 0 & -1 \end{bmatrix} A= 633110021
各局中人应如何选择自己的策略,保证自己在博弈中取得有利的地位。
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

4.博弈论中的最小最大定理

在这里插入图片描述
对于任意一个两个玩家A和B之间的完全信息、零和、有限策略集的博弈,存在一个数V和玩家A的一个策略σ*,使得无论对手B采取何种策略,通过执行σ*,A所能获得的最小收益至少是V。同时,存在玩家B的一个策略τ*,使得当B执行τ*时,即使面对A的最优策略,其给A带来的最大损失也不超过V。

换句话说,A的最小期望得益(即最大损失)等于B的最大期望损失(即最小得益),这个相同的数值就是游戏的值V。A的最优策略是在所有可能的策略中找到那个能够抵御对手任何反击的策略,以确保最坏情况下的最好结果;而B则反过来尝试最大化A的最坏结果,即最小化自己的最大损失。

博弈在纯策略意义下的纳什均衡可以不唯一,博弈的值是唯一的。

5. 混合策略纳什均衡

假设零和博弈 G = { S 1 , S 2 ; A } G=\{S_1,S_2;A\} G={S1,S2;A},
其中 S 1 = { A 1 , A 2 , . . . A m } S_1=\{A_1,A_2,...A_m\} S1={A1,A2,...Am},选择每个策略的概率为 X = { x 1 , x 2 , . . . , x m } X=\{x_1,x_2,...,x_m\} X={x1,x2,...,xm};
S 2 = { B 1 , B 2 , . . . , B n } S_2=\{B_1,B_2,...,B_n\} S2={B1,B2,...,Bn},选择每个策略的概率为 Y = { y 1 , y 2 , . . . , y n } Y=\{y_1,y_2,...,y_n\} Y={y1,y2,...,yn}
A = ( a i j ) m × n A=(a_{ij})_{m\times n} A=(aij)m×n
在这里插入图片描述
对于给定的博弈G,
局中人1的所有混合策略构成的集合 S 1 ∗ = { X } S_1^*=\{X\} S1={X}
局中人2的所有混合策略构成的集合 S 2 ∗ = { Y } S_2^*=\{Y\} S2={Y}
期望为 G ∗ = { S 1 ∗ , S 2 ∗ ; E } G^*=\{S_1^*,S_2^*;E\} G={S1,S2;E},为博弈G的混合扩充。

目标
在这里插入图片描述
任何一个给定的二人零和博弈G一定存在混合策略意义下的纳什均衡

6.一个例子

在这里插入图片描述

7.非零和博弈的定义

  • 各方的收益或损失的总和不是零值。
  • 局中人之间不再是完全对立
  • 一个局中人的所得并不一定意味着其他局中人要同样数量的损失
  • 博弈参与方之间可能存在某种共同利益,可以“双赢”或“多赢”

7.1 求解二人非零和博弈混合策略纳什均衡的一般方法

在这里插入图片描述

7.2 反复剔除严格劣策略

在“局中人是理性的”假设前提下,如果一个人的策略集合中存在严格劣策略,理性的他永远不会选择严格劣策略。反复剔除严格劣策略适用于零和博弈与非零和博弈。

  1. 对于局中人1的b策略严格劣与策略d,所以策略b可以删除。
    在这里插入图片描述
  2. 最后可以得到
    在这里插入图片描述

8.奇数定理及其应用

奇数定理:几乎所有的有限策略的博弈都有奇数个纳什均衡,包括纯策略纳什均衡混合策略纳什均衡

简单来说,根据奇数定理,如果一个博弈有两个纯策略纳什均衡,则必定存在至少一个额外的纳什均衡,这导致了纳什均衡的总数是奇数。纳什均衡是指在一个博弈中,没有一个参与者可以通过单独改变自己的策略来改善其结果的稳定策略组合。

需要注意的是,“几乎所有的”这一描述表明并非所有博弈都严格遵循这个规律,但大部分有限博弈确实表现出这样的特性。这个定理对于理解和分析博弈论中的复杂交互行为有着重要意义。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1559303.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Chatgpt掘金之旅—有爱AI商业实战篇(二)

演示站点: https://ai.uaai.cn 对话模块 官方论坛: www.jingyuai.com 京娱AI 一、前言: 成为一名商业作者是一个蕴含着无限可能的职业选择。在当下数字化的时代,作家们有着众多的平台可以展示和推广自己的作品。无论您是对写书、文…

hcip综合实验2

目录 实验拓扑: 实验要求: 实验思路: 实验步骤: 1.配置设备接口IP 2.通过配置缺省路由让公网互通 3.配置ppp 1.R1和R5间的ppp的PAP认证; 2.R2与R5之间的ppp的CHAP认证; 3. R3与R5之间的HDLC封装; 4.构建R1、…

mysql安装遇到的问题

最近mysql安装遇到了许多问题 这个界面是下载器界面,reconfigure是重新配置这个版本,要新安装要点add 进入这个界面选择对应的版本下载

向量点积的推导

1、余弦定理 2、二维点积 三、三维点积 用到第一个余弦定理

9.处理消息边界

网络编程中消息的长度是不太确定的,read方法读取字节数据到ByteBuffer中,ByteBuffer会有一个固定容量,单次超出容量的部分字节数据将会在下一次的ByteBuffer中,这样消息就会按照字节截断,出现消息边界问题。 Http 2.0 …

UE4_碰撞_碰撞蓝图节点——Line Trace For Objects(对象的线条检测)

一、Line Trace For Objects(对象的线条检测):沿给定线条执行碰撞检测并返回遭遇的首个命中,这只会找到由Object types指定类型的对象。注意他与Line Trace By Channel(由通道检测线条)的区别,一个通过Obje…

解决AD使用交互式BOM插件时,插入make点导致显示异常的问题

记得上次写了一篇关于使用这个插件时出现这个问题的解决方法,具体可查看:AD使用交互式BOM插件时应该注意到的一个问题_ad的bom插件-CSDN博客 当时的解决办法就是删除后再运行脚本生成,这些天经过多次实验,发现是当时那个封装有问…

ES的RestClient相关操作

ES的RestClient相关操作 Elasticsearch使用Java操作。 本文仅介绍CURD索引库和文档!!! Elasticsearch基础:https://blog.csdn.net/weixin_46533577/article/details/137207222 Elasticsearch Clients官网:https://ww…

实例、构造函数、原型、原型对象、prototype、__proto__、原型链……

学习原型链和原型对象,不需要说太多话,只需要给你看看几张图,你自然就懂了。 prototype 表示原型对象__proto__ 表示原型 实例、构造函数和原型对象 以 error 举例 图中的 error 表示 axios 抛出的一个错误对象(实例&#xff0…

Makefile:动态库的编译链接与使用(六)

1、动态链接库 动态链接库:不会把代码编译到二进制文件中,而是运行时才去加载,所以只需要维护一个地址 动态:运行时才去加载,即所谓的动态加载连接:指库文件和二进制程序分离,用某种特殊的手段…

字符串的遍历,统计,反转.java

题目:键盘输入字符串,统计字符串所包含的大小写字母个数,及数字个数 分析:键盘输入字符串需next()方法,利用fot循环遍历每个字符,返回字符串上的字符用charAt(index&…

图论-最短路

一、不存在负权边-dijkstra算法 dijkstra算法适用于这样一类问题: 从起点 start 到所有其他节点的最短路径。 其实求解最短路径最暴力的方法就是使用bfs广搜一下,但是要一次求得所有点的最短距离我们不可能循环n次,这样复杂度太高&#xf…

Mac air 个人免费版VMWare Fusion安装及配置教程

Mac air 安装免费版VMWare Fusion教程及问题解决 1、下载VMWare Fusion2、下载wins镜像文件3、开始配置4、出现的问题及解决方法4.1 如何跳过启动时的网络连接4.2 启动后,无法连接网络怎么办4.3 怎么实现将文件拖拽到虚拟机中 当你手上是一台Mac电脑,却需…

薪酬、人数上不封顶,这家互联网大厂正在疯抢超级毕业生

ChatGPT狂飙160天,世界已经不是之前的样子。 新建了人工智能中文站https://ai.weoknow.com 每天给大家更新可用的国内可用chatGPT资源 发布在https://it.weoknow.com 更多资源欢迎关注 又是一年一度校园春招季。在生成式 AI 一路狂飙的时代浪潮下,人工…

Linux: 进程地址空间究竟是什么?进程地址空间存在意义何在?

Linux: 进程地址空间究竟是什么? 一、内存究竟是什么?分为哪些?二、内存是真实物理空间?三、进程地址空间(虚拟地址)3.1 为何同一个变量地址相同,保存的数据却不同? 四、为什么需要地…

ssm012医院住院管理系统+vue

医院住院管理关系 摘 要 随着时代的发展,医疗设备愈来愈完善,医院也变成人们生活中必不可少的场所。如今,已经2021年了,虽然医院的数量和设备愈加完善,但是老龄人口也越来越多。在如此大的人口压力下,医院…

3.31总结

这两天对于java知识的学习又收获了一些新的东西,如内部类、抽象类、接口、权限修饰符、代码块、final. final final多用于方法、类、变量的修饰 方法:表示该方法是最终方法,不能被重写 类:表明该类是最终类,不能被…

latex伪代码一些记录

参考一 参考二 参考三 使用minipage 最终调整好的效果: $ \begin{document} \begin{center} \begin{minipage}{15.92cm} \renewcommand{\thealgorithm}{1} \begin{CJK}{GBK}{song} \begin{algorithm}[H]\caption{ \text{算法1:xxx}}\begin{algorith…

Linux 基础IO [缓冲区文件系统]

💓博主CSDN主页:麻辣韭菜💓   ⏩专栏分类:Linux知识分享⏪   🚚代码仓库:Linux代码练习🚚   🌹关注我🫵带你学习更多Linux知识   🔝 目录 前言 一.Linux下一切皆文件 二.缓冲…

调试技巧安全预编译头文件(C++基础)

调试 调试可以选择条件调试和操作调试: 条件调试来选择条件进入断点设置,操作调试来使达到断点条件后完成某些操作(一般是output窗口输出)。 在这里就只输出了小于6的条件。 安全 降低崩溃、内存泄露、非法访问等问题。 应该转…