一、博弈论概述

news2024/10/7 16:26:33

 知人者智,自知者明;胜人者力,自胜者强;小胜者术,大胜者德。

一、什么是“博弈”

(一)博弈的定义

博:博览全局;弈:对弈棋局,最后做到谋定而动。

博弈的标准定义是指在一定的游戏规则约束下基于直接相互作用的环境条件,各参与人依据所掌握的信息,选择各自的策略(行动 )以实现利益最大化的过程。

直接相互作用,是指决策者之间做出的决定会相互影响,你做出的决定会影响他,他的决定又会反过来直接影响你。

信息,博弈时经常会产生信息不对称,每个人只能根据自己所掌握的信息做出最优决策。

博弈,必须学会换位思考!

博弈,只需领先一步,高人一筹!(不用思考到太深,太远)

博弈就是你中有我,我中有你。由于直接相互作用 (互动) ,每个博弈参与者的得益不仅取决于自己的策略 (行动) ,还取决于其他参与者的策略 (行动) 。博弈的核心在于整体思维基础上的理性换位思考,用他人的得益去推测他人的策略 (行动) ,从而选择最有利于自己的策略 (行动)。

(二)罗森赛蜈蚣博弈

蜈蚣博弈规则如下:有1,2两个同学面前放一个纸箱,字母A表示合作,字母D表示不合作,1,2两个同学轮流做出合作/不合作的决策。纸箱里一开始有50元,在这个游戏中,选择不合作的人所获得金额,始终是另一方4倍。流程如下:

第一次,让同学1做选择,选择不合作(D),同学1获得40元,同学2获得10元,游戏结束。同学1选择合作(A),则箱子里的钱会增加一倍,即由50元变为100元,游戏继续,来到第二轮;

第二次,轮到同学2做选择,选择不合作(D),同学2获得80元,同学1获得10元,游戏结束。同学2选择合作(A),则箱子里的钱会增加一倍,由100元变为200,游戏继续,来到第三轮;

。。。。。

第五次,如果双方持续合作,最后该游戏也要在总金额为800元,也就是最初50元金额16倍时结束,此时同学1得到640元,同学2得到160元。

蜈蚣博弈对应的现实问题有:炒股、买房

如上图解所示,如果游戏玩到最后一步(第5步),同学1一定会选择不合作而结束游戏(就算不想结束,根据游戏规则,也不得不结束),如此一来,同学2就会在倒数第二步(第4步)时选择不合作,因为这样可以让自己获得320元收益,而不是玩到最后只得到160元收益。

问题在于,同学1也会像同学2那样运用倒推法,预测到同学2会在第4步选择不合作,就会在第3步选择不合作,以此增加自己收益,让自己获得160元收益,而不是80元收益。

同样,同学2也会预测到同学1会如是预测,就会再抢先一步,在第2步时选择不合作。如是持续倒推、递归,同学1最佳选择就是在第1步时就选择不合作,提前结束整个游戏。

蜈蚣博弈典型特征是:合作双赢,不合作单赢。一个参与者选择是否合作前提是看对方是否合作:如果对方合作,最佳策略是合作;如果对方不合作,最佳策略是不合作。

另一个参与者想法也是如此,如果预期你接下来会合作,他就会选择合作;反之,就会选择不合作。

也就是说,对任意一个参与者而言,理论最佳策略是,在对方选择不合作之前提前选择不合作。根据倒推法,对蜈蚣博弈任意一个参与者而言,理性做法都是,一开始就选择不合作。

经过统计,在每个环节结束的人的数量分布如下:

二、发展简史

(一)古诺模型

参加博弈的双方以各自在同一时间内相互独立的产量作为决策的变量,是一个产量竞争模型。

(二)伯川德模型

该模型与古诺模型的不同之 处在于,企业把其产品的价格而不是产量作为竞争手段和决策变量,通过制定一个最优的销售价格来实现利润最大化。

(三)斯塔克尔伯格模型

该模型分析的是这么一种市场竞争:企业A先决定一个产量,然后企业B可以观察到这个产量,并根据所观察到的产量来决定它自己的产量。

(四)理论的诞生与发展

1、20世纪40年代的社会变化:寡头的竞争,垄断的竞争,资本主义发展到一定地步导致的社会变化

2、约翰·冯·诺依曼的卓越贡献:1944年冯·诺依曼和摩根斯坦发表《博弈论和经济行为》

3、约翰·福布斯·纳什的发扬光大,1994年获得诺贝尔奖

4、后来的发展

  • 其一个对纳什均衡的弱化 (或一般化)
  • 其二是对纳什均衡的精炼 (或筛选》。
  • 其三是对博弈论的基本假设的研究。
  • 其四是对博弈论的应用研究。

三、术语解读

(一)常见术语

1、参与人 (players) : 理性选择的主体。

2、信息 (information) : 参与者有关博弈的知识。“知己知彼,百战不殆。

3、行动 (action) : 参与者能够选择的变量。

4、策略 (strategies) : 参与者在行动之前所准备好的一套完整的行动方案 (预案)。具有(1)完整性(2)多样性(3)不可观察性。

5、损益(payoff):参与者的得与失。

6、结局(outcome):所有参与者选择各自策略后的结果。

7、均衡( equilibrium):所有参与者的最优策略组合。

8、博弈的规则(rules of the game):参与者、行动和结果合起来称为博弈的规则。

9、博论 (game theory) :是一种研究人们怎么做策略(行动) 选择及其最后的均衡结果会是什么的理论。

(二)博弈的分类

1、合作博弈和非合作博弈

合作博弈:指参与者能够达成一种具有约束力的协议,在协议范围内选择有利于双方的策略。

非合作博弈:指参与者无法达成这样一种协议。非合作博弈不一定是竞争的关系。

2、静态博弈和动态博弈

静态博弈:指在博弈中,参与者同时选择,或虽非同时选择,但是在逻辑时间上是同时的。如剪刀石头布

动态博弈:指在博弈中,参与者的行动有先后顺序,且后行动者能够观察到先行动者的行动。如下棋

3 、完全信息博弈与不完全信息博弈

完全信息博弈:指在博弈中,每个参与者对其他参与者的类型、策略空间及损益函数都有准确的信息。

不完全信息博弈:总有一些信息不是所有参与者都知道的。

4、零和博弈和非零和博弈

零和博挛:指博弈前的损益总和与博弈后的损益总和相等。

非零和博弈:指博弈后的损益大于(小于)博弈前的损益总和。(正和或负和)。

不玩负和游戏,少玩零和游戏,多玩正和游戏。

5、博弈的组合

静态动态
完全信息

完全信息静态博弈

纳什均衡

纳什(1950,1951)

完全信息动态博弈

子博弈精炼纳什均衡

泽尔腾(1965)

不完全信息

不完全信息静态博弈

贝叶斯纳什均衡

海萨尼(1967-1968)

不完全信息动态博弈

精炼贝叶斯纳什均衡

泽尔腾(1975)

Kreps和Wilson(1982)

Fudenberg和Tirole(1991)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1033644.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

文件包含漏洞的 00截断

isset()函数若变量不存在则返回 FALSE;若变量存在且其值为NULL,也返回 FALSE。若变量存在且值不为NULL,则返回 TURE %00是被服务器解码为0x00发挥了截断作用。核心是chr(0)字符 00截断上传原理 - 知乎 协议参考地址&…

科研之路(2023.9.21)

惰轮 麦轮 https://mp.weixin.qq.com/s/sjb3O91auADKN7iDsut0jA 理解底盘代码

FL Studio 21内置鼓机FPC怎么用 常用编曲鼓点怎么排列

FL Studio 21内置鼓机FPC怎么用?FPC是一款模拟硬件打击垫建模的鼓机,使用方法和硬件打击垫很像,但是多出了修改采样等更加细节的功能。常用鼓点怎么排列?电子音乐中常见的鼓点有4/4拍鼓组和Trap类型鼓组。 FL Studio Win-安装包&a…

【ODPS 新品发布第 2 期】实时数仓 Hologres:推出计算组实例/支持 JSON 数据/向量计算+大模型等新能力

云布道师 阿里云 ODPS 系列产品以 MaxCompute、DataWorks、Hologres 为核心,致力于解决用户多元化数据的计算需求问题,实现存储、调度、元数据管理上的一体化架构融合,支撑交通、金融、科研、等多场景数据的高效处理,是目前国内最…

S7通信协议的挑高点

目录 1. S7协议之布尔操作 2. S7协议之PDU读取 3 S7协议之多组读取 在电气学习的路上,西门子PLC应该是每个人的启蒙PLC,从早期的S7-300/400PLC搭建Profibus-DP网络开始接触,到后来的S7-200Smart PLC,再到现在的S7-1200/1500 PLC…

leetcode 10. 正则表达式匹配

2023.9.20 感觉是目前做过dp题里最难的一题了... 本题首要的就是需要理解题意,翻了评论区我才发现之前一直理解的题意是错的。 我原来理解的 “ *匹配0次” 是指:*直接消失,不会影响到前面的字符。 但是*和前一个字符其实是连体的&#xff0…

学习路之PHP--lumen安装配置

一、下载lumen源码 composer create-project --prefer-dist laravel/lumen blog 安装lumen-generator composer require flipbox/lumen-generator 二、配置 bootstrap\app.php 97行 $app->register(Flipbox\LumenGenerator\LumenGeneratorServiceProvider::class);三、生成…

MQ - 24 RabbitMQ集群架构设计与实现

文章目录 导图集群构建节点发现元数据存储数据可靠性镜像队列仲裁队列安全控制传输加密身份认证资源鉴权可观测性总结导图 集群构建 集群构建由节点发现和元数据存储两部分组成。RabbitMQ 也是一样的实现思路。 节点发现 在节点发现方面,RabbitMQ 通过插件化的方式支持了多…

Centos下载配置Maven

Linux下安装配置Maven 注意:没配置JDK的先把JDK给配置了,JDK环境变量名为JAVA_HOME 1、安装wget命令 如果需要通过使用wget命令,直接通过网络下载maven安装包时,需要在linux系统中安装wget命令。 yum -y install wget2、下载m…

基于SpringBoot的企业客户管理系统的设计与实现【附PPT|万字文档(LW)和搭建文档】

主要功能 后台登录: 可注册员工:工号、密码、姓名、身份证、手机、邮箱 员工: ①首页、个人中心、修改密码、个人信息 ②客户信息管理、项目信息管理、项目收益管理等 后台登录: 管理员: ①首页、个人中心、修改密码、…

【Flowable】Flowable自动生成的数据库表的含义

一、Flowable简介 Flowable是一个开源的工作流引擎,它的主要目标是提供一个灵活、可扩展、可靠的流程管理系统。Flowable通过提供一组API和工具,使组织能够自动化和管理其业务流程。 二、Flowable中的数据库 Flowable使用数据库来存储和管理其运行时的…

qt matlab 混合编程

1.环境的说明 matlab 2021a qt 5.12.10 qt creator 4.13.1 opencv 4.3.0 eigen-3.4.0/eigen-3.4.0 2.matlab 中导出dill 以aberr_analy1的导出dill举例 命令行中输入:deploytool 2. 选择LIbrarycompiler 3type 选择c 4,选择相应的 5. 点击package 选择保存的路径…

“新KG”视点 | 漆桂林——知识图谱和大语言模型的共存之道

OpenKG 大模型专辑 导读 知识图谱和大型语言模型都是用来表示和处理知识的手段。大模型补足了理解语言的能力,知识图谱则丰富了表示知识的方式,两者的深度结合必将为人工智能提供更为全面、可靠、可控的知识处理方法。在这一背景下,OpenKG组织…

psd-tools

安装 使用 PSD document layers Exporting data to PIL Exporting data to Numpy psd_tools.api.layers PixelLayer TypeLayer 参考资料 psd-tools/psd-tools psd-tools psd-tools/usage 使用psd-tools更改文本层的文本 psd_tools设置文本 https://blog.csdn.net/qq_4010957…

位移贴图的实现原理

在以前的文章中介绍过GLTF编辑器 , 编辑器可以对模型的各种材质纹理进行编辑修改,但是有一些新手用户可能对这些材质纹理不太了解,所以我收集了一些资料对这些材质纹理做一下详细的介绍,今天这篇文章主要是介绍位移贴图。 1、什么…

Leetcode 386. 字典序排数

文章目录 题目代码&#xff08;9.22 首刷看解析&#xff09; 题目 Leetcode 386. 字典序排数 代码&#xff08;9.22 首刷看解析&#xff09; 迭代DFS class Solution { public:vector<int> lexicalOrder(int n) {vector<int> ret(n);int number 1;for(int i 0…

vue下载Excel文件

前端vue实现导出Excel文件 用到的是 上代码 var wb XLSX.utils.table_to_book(document.querySelector(#my-table));//关联dom节点 这个是表格绑定的id名称var wbout XLSX.write(wb, {bookType: xlsx,bookSST: true,type: array})try {FileSaver.saveAs(new Blob([wbout], {…

【C++】STL详解(七)—— stack和queue的使用及模拟实现

​ ​&#x1f4dd;个人主页&#xff1a;Sherry的成长之路 &#x1f3e0;学习社区&#xff1a;Sherry的成长之路&#xff08;个人社区&#xff09; &#x1f4d6;专栏链接&#xff1a;C学习 &#x1f3af;长路漫漫浩浩&#xff0c;万事皆有期待 上一篇博客&#xff1a;【C】STL…

IDEA断点常用5种方式——条件断点(循环)、回退、表达式执行、中断(不执行后续代码)、指定异常(常用寻找空指针位置)

1、条件断点 主要用于循环体内&#xff0c;指定循环的数据加入条件。 2、断点回退 用于回退看之前的参数。 3、表达式执行 获取值或者给值重新赋值。 长表达式可以使用线上的JSON转为实体类&#xff0c;进行模拟数据。也可以根据不同环境给变量重新赋值。 4、强制中断…

JVM高级性能调试

标准的JVM是配置为了高吞吐量&#xff0c;吞吐量是为了科学计算和后台运行使用&#xff0c;而互联网商业应用&#xff0c;更多是为追求更短的响应时间&#xff0c;更低的延迟Latency&#xff08;说白了就是更快速度&#xff09;&#xff0c;当用户打开网页没有快速响应&#xf…