纳什均衡:博弈论中的运作方式、示例以及囚徒困境

news2024/12/26 20:51:13

文章目录

  • 一、说明
  • 二、什么是纳什均衡?
    • 2.1 基本概念
    • 2.2 关键要点
  • 三、理解纳什均衡
  • 四、纳什均衡与主导策略
  • 五、纳什均衡的例子
  • 六、囚徒困境
  • 七、如何原理和应用
    • 7.1 博弈论中的纳什均衡是什么?
    • 7.2 如何找到纳什均衡?
    • 7.3 为什么纳什均衡很重要?
    • 7.4 如何计算纳什均衡?
    • 7.5 纳什均衡的局限性是什么?
  • 八、后记

关键词:Nash Equilibrium、Dominant Strategy

一、说明

   博弈论者使用纳什均衡来分析多个决策者战略互动的结果。在战略互动中,每个决策者的结果取决于其他人的决策以及他们自己的决策。纳什思想背后的简单见解是,如果孤立地分析多个决策者的决策,就无法预测他们的选择。相反,我们必须问每个玩家在考虑到玩家对其他人的期望后会怎么做。纳什均衡要求玩家的选择是一致的:没有玩家希望在其他人做出决定的情况下撤销自己的决定。

二、什么是纳什均衡?

2.1 基本概念

   在博弈论中,纳什均衡是非合作博弈中最常用的解决方案概念。纳什均衡是指没有玩家可以通过改变自己的策略(保持其他玩家的策略不变)来获利的情况。[1]纳什均衡的概念可以追溯到古诺时代,他在 1838 年将其应用于寡头垄断竞争模型。[2]

   纳什均衡表现为一种“饱和态”,如果每个玩家都选择了一种策略 (基于游戏中迄今为止发生的事情的行动计划),并且在其他玩家保持不变的情况下,没有人可以通过改变自己的策略来增加自己的预期收益。表现为“势均力敌”的状态。
   纳什均衡是博弈论中的一个概念,指博弈达到最优结果。这是一种不鼓励个体玩家偏离其初始策略的状态。玩家知道对手的策略,但仍然不会偏离他们最初选择的策略,因为这仍然是每个玩家的最佳策略。

   总体而言,假设其他玩家的策略保持不变,个人无法从改变行动中获得增量收益。然而,一场游戏可能有多个纳什均衡,也可能根本没有。

2.2 关键要点

  • 纳什均衡是博弈论中的一个决策定理,该定理指出玩家可以通过不偏离其初始策略来实现期望的结果。
  • 在纳什均衡中,每个玩家的策略在考虑其他玩家的决策时都是最优的。每个玩家都会获胜,因为每个人都会得到他们想要的结果。
  • 囚徒困境是一个常见的博弈论例子,它充分展示了纳什均衡的效果。
  • 纳什均衡通常与主导策略一起讨论,主导策略指出,无论对手使用何种策略,行为者选择的策略将在所有可能使用的策略中产生更好的结果。
  • 纳什均衡并不总是意味着选择最优策略。
    1

三、理解纳什均衡

   纳什均衡以其发明者美国数学家约翰·纳什的名字命名。它被认为是博弈论中最重要的概念之一,它试图从数学和逻辑上确定游戏参与者应采取的行动,以确保自己获得最佳结果。

   纳什均衡之所以被认为是博弈论中如此重要的概念,是因为它的适用性。纳什均衡可以纳入从经济学到社会科学等广泛的学科。

   为了快速找到纳什均衡或查看它是否存在,请向其他玩家透露每个玩家的策略。如果没有人改变他们的策略,那么纳什均衡就被证明了。

四、纳什均衡与主导策略

   纳什均衡经常与占优策略进行比较,两者都是博弈论中的策略。纳什均衡指出,参与者的最佳策略是在了解对手策略的情况下坚持其初始策略,并且所有参与者都保持相同的策略。

   主导策略断言,无论对手使用何种策略,行为者选择的策略将在所有可能使用的策略中产生更好的结果。

   所有博弈论模型只有当参与的玩家都是“理性主体”时才有效,这意味着他们渴望特定的结果,试图选择最优结果,在决策中考虑不确定性,并在选择上采取现实态度。
   这两个术语相似但略有不同。纳什均衡表明,如果任何一个玩家改变策略而其他所有玩家都保持策略,则不会有任何收获。主导策略断言,无论其他玩家选择了什么策略,玩家都会选择一种能够带来最佳结果的策略。主导策略可以包含在纳什均衡中,而纳什均衡可能不是游戏中的最佳策略。

五、纳什均衡的例子

   想象一下汤姆和萨姆之间的游戏。在这个简单的游戏中,两位玩家都可以选择策略 A,获得 1 美元,或者策略 B,损失 1 美元。从逻辑上讲,两位玩家都会选择策略 A,并获得 1 美元的收益。

   如果您向 Tom 透露 Sam 的策略,反之亦然,您会发现没有玩家偏离原始选择。了解其他玩家的举动意义不大,也不会改变任何一方的行为。结果 A 代表纳什均衡。

纳什均衡示例
在这里插入图片描述

六、囚徒困境

   囚徒困境是博弈论中分析的一种常见情况,可以运用纳什均衡。在这个博弈中,两名罪犯被捕,各自被单独监禁,无法与对方交流。检察官没有证据定罪这对罪犯,所以他们给每个囚犯一个机会,要么背叛对方,作证对方犯了罪,要么合作,保持沉默。

   如果两名囚犯互相背叛,则每人将被判处五年监禁。如果 A 背叛 B,但 B 保持沉默,则囚犯 A 将被释放,囚犯 B 将被判处十年监禁,反之亦然。如果双方都保持沉默,则每人将被判处一年监禁。

   在这个例子中,纳什均衡是两个参与者互相背叛。尽管相互合作会带来更好的结果,但如果一个囚犯选择相互合作而另一个囚犯不选择,那么其中一个囚犯的结果会更糟。

七、如何原理和应用

7.1 博弈论中的纳什均衡是什么?

   博弈论中的纳什均衡是指玩家在考虑到对手的策略后,将继续执行自己选择的策略,而没有偏离该策略的动机。

7.2 如何找到纳什均衡?

   要在游戏中找到纳什均衡,就必须模拟出每种可能的情况以确定结果,然后选择最佳策略。在双人游戏中,这将考虑两个玩家可以选择的可能策略。如果两个玩家都不了解所有信息并改变策略,则会出现纳什均衡。

7.3 为什么纳什均衡很重要?

   纳什均衡很重要,因为它可以帮助玩家根据自己的决策和其他相关方的决策确定最佳收益。纳什均衡可以应用于生活的方方面面,从商业策略到卖房,从战争到社会科学等等。

7.4 如何计算纳什均衡?

   没有特定的公式来计算纳什均衡。可以通过对给定游戏中的不同场景进行建模来确定每个策略的收益以及哪种策略是最佳选择。

7.5 纳什均衡的局限性是什么?

   纳什均衡的主要限制是它要求玩家了解对手的策略。只有当玩家了解对手的策略并选择继续使用当前策略时,纳什均衡才会发生。

   在大多数情况下,例如在战争中(无论是军事战争还是竞价战争),个人很少知道对手的策略或他们想要的结果。与主导策略不同,纳什均衡并不总是导致最优结果。它只是意味着个人根据他们掌握的信息选择最佳策略。

   此外,在与相同对手进行的多场游戏中,纳什均衡并没有考虑过去的行为,而过去的行为往往可以预测未来的行为。

八、后记

   纳什均衡是博弈论的一个组成部分,它断言玩家在了解对手的策略的情况下会继续使用他们选择的策略,因为他们没有改变路线的动机。纳什均衡可以应用于各种现实生活中的情况,根据你的决定以及对对手决定的了解来确定在某种情况下的最佳收益是什么。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1807208.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

python 判断点和线段相交

python 判断点和线段相交 import numpy as np import cv2 import numpy as npdef point_to_line_distance(points, line_segments):# line_segments [[549, 303], [580, 303]]# points [565, 304]x0, y0, x1, y1line_segments[0][0], line_segments[0][1], line_segments[1]…

手把手带你做一个自己的网络调试助手(1) - TCP服务器准备

程序设计流程图 TCP 服务器 ui界面搭建 Tcp服务器建立连接 - listen() connect() 1.在构造函数中进行如下初始化: 通过 QNetworkInterface 类的 allAddresses 这一API 获得可用IP地址(包括IPv4 和 IPv6) 然后通过QHostAddress类的 protocol 这一AP…

前端-a-date-picker如何设置禁选时间段

想要做到如图所示的效果&#xff0c;代码如下&#xff1a; 第一个是只能选择某一天&#xff0c;第二个是只能选择某一个时间段 <a-date-pickerv-model:value"record.onTimeStr":show-time"{ format: HH:mm }"valueFormat"YYYY-MM-DD HH:mm:ss&qu…

【算法小记】深度学习——时间序列数据分析 Time series Data Analysis

在本篇博客中将简单介绍常见的几种循环神经网络和一维卷积神经网络&#xff0c;并使用一些简答的数据进行拟合分析。本文相对适合刚入门的同学&#xff0c;同时也作为自己过去一段时间学习的总结和记录&#xff0c;现在神经网络框架已经非常完善的支持了很多常见和有效的深度学…

【学永远不嫌晚】Linux操作系统,linux教程,动力节点linux,老杜linux

碎碎念 总是遇到一些恶心的事情 看最新教程 老师安装的是 vm17 pro&#xff0c;想着也去安装&#xff0c;搜了一大堆&#xff0c;都指向官网下载。 https://support.broadcom.com/group/ecx/productdownloads?subfamilyVMwareWorkstationPro 安装显示没有 entitlement&#…

“GPT-4o深度解析:技术演进、能力评估与个人体验综述“

文章目录 每日一句正能量前言对比分析模型架构性能应用场景用户体验技术创新社区和生态系统总结 技术能力语言生成能力语言理解能力技术实现总结 个人感受关于GPT-4o的假设性观点&#xff1a;关于当前语言模型的一般性观点&#xff1a; 后记 每日一句正能量 又回到了原点&#…

2024年CKA模拟系统制作 | step-by-step | 1、基础环境准备

目录 一、软件环境 二、虚拟网络环境准备 1、编辑虚拟网络 2、网络设置 三、新建虚拟主机 1、新建目录 2、新建虚拟主机 四、系统安装 1、装载系统镜像 2、开启虚拟机 3、选择语言 4、键盘选择 5、网络配置 6、代理设置 7、设置软件源 8、存储设置 9、名称设置 …

记一次postgresql拼接函数string_agg() 和row_number() 使用

PG两个函数使用需求和简单介绍 需求背景介绍第一个需求背景是这样的需求升级一下接下来讲讲STRING_AGG()基本语法排序 然后我们再说说ROW_NUMBER()基本语法使用 row_number() over (partition by) 进行分组统计使用 row_num限定每组数量 需求背景介绍 第一个需求背景是这样的 …

6、组件通信详解(父子、兄弟、祖孙)

一、父传子 1、props 用法&#xff1a; &#xff08;1&#xff09;父组件用 props绑定数据&#xff0c;表示为 v-bind:props"数据" &#xff08;v-bind:简写为 : &#xff0c;props可以任意命名&#xff09; &#xff08;2&#xff09;子组件用 defineProps([props&…

curl 92 HTTP/2 stream 5 was not closed cleanly: CANCEL

source ~/.bash_profile flutter clean Command exited with code 128: git fetch --tags Standard error: 错误&#xff1a;RPC 失败。curl 92 HTTP/2 stream 5 was not closed cleanly: CANCEL (err 8) 错误&#xff1a;预期仍然需要 2737 个字节的正文 fetch-pack: unexpec…

力扣167. 两数之和 II - 输入有序数组

Problem: 167. 两数之和 II - 输入有序数组 文章目录 题目描述思路复杂度Code 题目描述 思路 1.定义左、右指针left、right分别指向数组索引为0和索引为nums.length - 1&#xff0c;定义结果数组int[] res new int[2]用于存储索引; 2.查找&#xff1a;当判断numbers[left] nu…

质量小议38 -- 60岁退休的由来

总是要有个标准&#xff0c;质量更是如些。 标准不是固定不变的&#xff0c;与时俱进。 关键词&#xff1a;当时的人均寿命&#xff1b;渐进式 60岁退休。 22大学毕业开始工作&#xff08;当然可能会更早&#xff09;&#xff0c;到60岁退休&#xff0c;要工作38年。 …

linux:如何硬盘分区扩容

文章目录 1. 前言2. 硬盘分区2.1 查看硬盘2.2 分区2.3 格式化 3. 硬盘分区扩容3.1 创建物理卷3.2 扩展到卷组&#xff08;volume group&#xff09;3.3 合并到待拓展分区3.4 使扩展生效 4 .参考 1. 前言 本文介绍如何将剩余的空间扩展到已有的硬盘分区中。 安装虚拟机的教程&…

【传知代码】BLIP - VLP任务的新框架(论文复现)

前言&#xff1a;在当今人工智能与机器学习领域&#xff0c;视觉-语言预训练&#xff08;Vision-and-Language Pre-training, VLP&#xff09;任务正逐渐崭露头角&#xff0c;其对于推动跨模态智能系统的进步起着至关重要的作用。在这些系统中&#xff0c;图像与文本不再是孤立…

vue -ant -design 卡片是布局 实现动态计算 当前的 左右间距 实现居中

是这样的一个样式 我们使用display :flex 布局的时候 我们全部剧中 display: flex;align-items: center;justify-content: center; 如果是上述的代码来说的话 总是最后的一个也是会居中的 这样就比较丑 我们好像就没有什么好的办法了 我们这自己写的 肯定没有组件牛 如果有…

【Redis学习笔记04】Jedis客户端(上)

Java客户端操作Redis Java生态丰富&#xff0c;自定义的客户端非常多&#xff0c;常见的有Jedis、Lettuce、以及Spring整合后的RedisTemplate&#xff0c;但是对于初学者而言&#xff0c;从Jedis开始入门学习是非常容易上手的&#xff0c;因为Jedis中的API与原生Redis命令高度…

基于栅格占据概率和距离场的机器人覆盖轨迹模拟

基于栅格占据概率和距离场的机器人覆盖轨迹模拟 简介 辐射场模型实现 理论基础 指数函数建模 我们使用指数函数来表示机器人在某个栅格上停留时间对覆盖概率的影响: p ( t ) 1 − e − λ t p(t) 1 - e^{-\lambda t} p(t)1−e−λt 其中 λ \lambda λ 是控制增长速率…

java线程相关知识点

Java多线程涉及以下几个关键点 1.线程生命周期&#xff1a;理解线程从创建到销毁的各个阶段&#xff0c;包括新建、运行、阻塞、等待、计时等待和终止。 2.线程同步&#xff1a;掌握如何使用synchronized关键字和Lock接口来同步代码&#xff0c;防止数据竞争和死锁。 3.线程间通…

vivado HW_DEVICE

硬件设备 描述 在Vivado Design Suite的硬件管理器功能中&#xff0c;每个硬件目标都可以 具有一个或多个Xilinx FPGA设备进行编程或用于调试目的。这个 hw_device对象是通过hw_server打开的hw_target上的物理部分。这个 current_hw_device命令指定或返回当前设备。 相关对象 硬…

Linux系统编程(十二)线程同步、锁、条件变量、信号量

线程同步&#xff1a; 协同步调&#xff0c;对公共区域数据按序访问。防止数据混乱&#xff0c;产生与时间有关的错误。数据混乱的原因 一、互斥锁/互斥量mutex 1. 建议锁&#xff08;协同锁&#xff09;&#xff1a; 公共数据进行保护。所有线程【应该】在访问公共数据前先拿…