运筹说 第134期 | 矩阵对策的解法

news2025/3/31 3:44:02

上一期我们了解了矩阵对策的基本理论,包含矩阵对策的纯策略、矩阵对策的混合策略和矩阵对策的基本定理。

接下来小编将为大家介绍矩阵对策的解法,包括图解法方程组法线性规划法三种经典方法。

01 图解法

本节首先介绍矩阵对策的图解法,在学习矩阵对策的基本理论时,我们掌握了如何构造线性规划问题来解决矩阵对策的混合策略问题,相应地,可以将求解线性规划问题的图解法迁移到矩阵对策的求解之中。

图解法是通过图示局中人的期望收益,寻找期望收益的最小或最大,最后求出纳什均衡的方法,其思想是最大最小定理6的图形应用。这种方法不仅为赢得矩阵为2×n 或m×2阶的对策问题提供了一个简单直观的解法,而且通过这种方法可以使我们从几何上理解对策论的思想,总结如下:

图解法的适用范围

(1)赢得矩阵为2×nm×2阶的对策问题

(2)混合策略(至少有一人策略只为2个策略)

图解法的决策原则为在最不利的情形下选择最有利的策略。

局中人1的最有利策略表示为:

局中人2的最有利策略表示为:

定理六

设(x*,y*)是矩阵对策G的解,v=VG则根据互补松弛性,有

(1)xi*>0,则

(2)若yj*>0,则

(3)若,则xi*=0

(4)若,则yj*=0

结合第132期学过的定理6,通过两个例题来详细说明如何使用图解法进行求解。

例题展示

例1:用图解法求解矩阵对策G={S1,S2;A},其中

解:设局中人I的混合策略为(x,1-x)Tx∈[0,1]。如下图所示,过数轴上坐标为0和1的两点分别作两条垂线I-I和II-II。垂线上的纵坐标分别表示局中人I采取纯策略α1和α2时,局中人II采取各纯策略时的赢得值。

当局中人I选择每一策略(x,1-x)T后,他的最少可能的收入为由β1,β2,β3所确定的3条直线在x处的纵坐标中之最小者决定。所以,对局中人I来说,他的最优选择是确定x,使3个纵坐标中的最小者尽可能的大。从图上来看,就是使得x=OA,这时,B点的纵坐标即为对策的值。为求x和对策的值VG,可联立过B点的两条由β2和β3确定的直线的方程:     

解得x=3/11,VG=49/11。所以,局中人I的最优策略为x*=(3/11,8/11)T。从图上还可看出,局中人II的最优混合策略只由β2和β3组成。

事实上,若设y*=(y1*,y2*,y3*)T为局中人II的最优混合策略,则由

注:此处“1” 并不是一个数字,而是局中人 II 所有可选策略的集合的代表。 它的作用是确保局中人 II 在任何策略组合下,局中人 I 在最优策略下的收益都不会被破坏。 这符合极小极大原理,确保了均衡点的收益计算是对所有可能策略均成立的)

根据定理6,必有y1*=0。又因x1*=3/11>0,x2*=8/11>0,再根据定理6,可由

求得y2*=9/11,y3*=2/11。所以,局中人II的最优混合策略为y*=[0,9/11,2/11]T。

例题展示

例2:用图解法求解矩阵对策G={S1,S2;A},其中

解:设局中人II的混合策略为(y,1-y)Ty∈[0,1]。由下图可知,对任一y∈[0,1],直线α1,α2,α3的纵坐标是局中人II采取混合策略(y,1-y)T时的支付。

根据从最不利当中选择最有利的原则,局中人II的最优策略就是确定y,使得三个纵坐标中的最大者尽可能的小,从图上看,就是要选择y,使得A1≤yA2,这时,对策的值为6。由方程组

 解A1=1/5,A2=4/9,故局中人II的最优混合策略是y*=(y,1-y)T,其中1/5≤y≤4/9,局中人I的最优策略显然只能是(0,1,0)T,即取纯策略α2。

02 方程组法

方程组法主要是通过构造并化简求解的方法来解决矩阵对策问题,由定理4(见132期)可知,求矩阵对策解(x*y*)的问题等价于求解如下两个不等式组1和不等式组2;

不等式组1:

 不等式组2:

又由定理5(见132期)和定理6可知,如果最优策略中的xi*yj*均不为零,则可将上述两不等式组的求解问题转化为下面的两个方程组的求解问题。

方程组1:

方程组2:

(1)如果上述方程组1和方程组2存在非负解x*y*便求得了对策的一个解

(2)如果这两个方程不存在非负解,可视具体情况,将上式中的某些等式改成不等式,继续尝试求解,直至求得对策的解。(注意,这种情况可用线性规划法进行求解)。

例题展示

例3:A、B玩游戏:有3张牌,分别为高、中、低,由A任抽一张,由B猜。

B只能猜高或低,若所抽牌恰好是高或低,B猜对,A输3元,否则B输2元。

若A所抽牌为中,则当B猜低时,B赢2元,猜高时,由A再从剩下的两张牌中任抽一张让B猜,若B猜对时,B赢1元,猜错时B输3元。

将此问题归结成对策问题,列出A的赢得矩阵,并求出各自的最优解和对策值。

解:A有4个策略:①抽高;②抽中,需再次抽牌时抽高;③抽中,需再次抽牌时抽低;④抽低。

B有3个策略:①猜高,需再次猜时猜高;②猜高,再次猜时猜低;③猜低。

列出对A的赢得矩阵如下表所示   

事先假定均不为零,列出方程

解得x*=(1/2,0,0,1/2),y*=(1/4,1/4,1/2),v=-1/2

方程组法由于事先假定xi*和yj*均不为零,故当最优策略的某些分量实际为零时,方程组1和方程组2可能无解,因此,这种方法在实际应用中有一定的局限性。但对于2×2的矩阵,当局中人I的赢得矩阵

不存在鞍点时,容易证明:各局中人的最优混合策略中的xi*yj*均大于零。于是,由定理6,得到下述方程组

一定有严格的非负解(也就是两个局中人的最优策略):

通过上述推理,我们可以得到求解矩阵对策的公式,针对一些2×2的矩阵对策问题可以直接套用公式进行快速求解。

面对矩阵对策题目,首先要判断是否有纯策略意义下的最优解,其次是要根据优超原则去化简。(优超原则是指在矩阵对策中,若某策略在所有情况下收益都不低于另一策略,即矩阵A中第行元素均不小于第j 行对应元素,则称局中人II的纯策略αi超优于αj,则可删除被优超的策略以简化分析。)

例题展示

例4:用图解法求解矩阵对策G={S1,S2;A},其中

解:首先可利用矩阵对策的优超原则对矩阵A进行化简。为此,应用优超原则依次简化得到矩阵A1A2A3:     

易知A3没有鞍点,由定理6,可以求出两个方程组

非负解为:

于是,以矩阵A为赢得矩阵的对策的一个解就是

03 线性规划法

上面学习了两个特殊的求解方法,下面我们一起来学习一个具有一般性的求解矩阵对策的方法——线性规划法,用这种方法可以求解任一矩阵对策。

由定理5可知,求解矩阵对策可等价地转化为求解互为对偶的线性规划问题(P)和(D,(P)和(D)表示如下:

又由定理7可以假设,此处我们做归一化处理,将(P)和(D)进一步简化,将原问题中的策略变量xi 和yj 缩放到与对策值wv无关的比例,使新变量 xi′ 和yj' 满足线性规划的标准形式,变为新的问题 (P′)和 (D′)。

根据上式,对原问题(P)和(D)约束两边同时除以w和vw>0,v>0),则问题(P)和(D)等价于线性规划问题(P')和(D'):

P')和(D')是互为对偶的线性规划,这样就可以利用单纯形法或对偶单纯形方法求解,由最优混合策略下w=v=VG的结论,得原对策问题的值为

对策的解为

求解步骤可总结如下:

(1)确定问题无鞍点,是混合策略;

(2)为了使,基于定理7构造,A+T→A'(≥0);

(3)由A'构造(P')和(D');

(4)求解(D'),得,由互补松弛定理求解(P'),得

(5)求原对策问题的解和值。

下面通过例5来进一步实践线性规划求解方法。

例题展示

例5:利用线性规划方法求解下述矩阵对策,其赢得矩阵为

如此,求解问题可化成两个互为对偶的线性规划问题

将(D)转换为如下标准形式:

我们可以使用单纯性表法来求解这个线性规划问题,最终单纯形表如下表所示:

最后得到上述线性规划的解为

 则最优对策的值为

最优对策的解为

以上就是矩阵对策的解法的全部内容了,通过本期学习,大家是否学会了这三种矩阵对策的经典求解方法呢?下一期小编将带大家学习其他类型的对策,敬请关注!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2323931.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

3. 轴指令(omron 机器自动化控制器)——>MC_CamOut

机器自动化控制器——第三章 轴指令 15 MC_CamOut变量▶输入变量▶输出变量▶输入输出变量 功能说明▶时序图▶指令的中止▶重启运动指令▶多重启动运动指令▶异常 MC_CamOut 结束通过输入参数指定的轴的凸轮动作 指令名称FB/FUN图形表现ST表现MC_CamOut解除凸轮动作FBMC_Cam…

TF32 与 FP32 的区别

TF32(Tensor Float 32)与FP32(单精度浮点数)是两种用于深度学习和高性能计算的浮点格式,其核心区别体现在精度、性能优化和应用场景上。以下是两者的详细对比分析: 一、位宽与结构差异 FP32的位宽结构 FP32…

【大模型】视觉语言模型:Qwen2.5-VL的使用

官方github地址:https://github.com/QwenLM/Qwen2.5-VL 目录 Qwen家族的最新成员:Qwen2.5-VL 主要增强功能 模型架构更新 快速开始 使用Transformers聊天 Docker Qwen家族的最新成员:Qwen2.5-VL 主要增强功能 强大的文档解析功能&am…

测试用例与需求脱节的修复方案

测试用例与需求脱节的问题可通过明确需求定义、加强需求追踪、建立有效沟通机制进行修复。其中,加强需求追踪尤为关键,能确保测试用例与实际需求的精确匹配,避免资源浪费和测试效果不佳。据行业研究,约70%的软件缺陷源于需求管理不…

【Unity】 鼠标拖动物体移动速度跟不上鼠标,会掉落

错误示范: 一开始把移动的代码写到update里去了,发现物体老是掉(总之移动非常不流畅,体验感很差) void Update(){Ray ray Camera.main.ScreenPointToRay(Input.mousePosition);if (Physics.Raycast(ray, out RaycastHit hit, M…

VLAN 高级特性

VLAN Access 类型端口:只能属于 1 个 VLAN,发出数据时只能根据 PVID 剥离一个 VLAN Tag 入方向:针对没有 tag 的数据包打上 PVID 的 tag出方向:将 tag 为本接口 PVID 的数据包去掉 tag,发出数据。(只有在与…

学习中学习的小tips(主要是学习苍穹外卖的一些学习)

目录 架构的细分 使用实体类来接收配置文件中的值 webMvcConfig类: jwt令牌 管理端的拦截器: JwtProperties: JwtTokenAdminInterceptor : 对密码加密操作 Redis: 分页查询 整体思想 为什么动态 SQL 推荐传实体…

【极速版 -- 大模型入门到进阶】LORA:大模型轻量级微调

文章目录 🌊 有没有低成本的方法微调大模型?🌊 LoRA 的核心思想🌊 LoRA 的初始化和 r r r 的值设定🌊 LoRA 实战:LoraConfig参数详解 论文指路:LORA: LOW-RANK ADAPTATION OF LARGE LANGUAGE M…

线程同步——读写锁

Linux——线程同步 读写锁 目录 一、基本概念 1.1 读写锁的基本概念 1.2 读写锁的优点 1.3 读写锁的实现 1.4 代码实现 一、基本概念 线程同步中的读写锁(Read-Write Lock),也常被称为共享-独占锁(Shared-Exclusive Lock&a…

邪性!Anaconda安装避坑细节Windows11

#工作记录 最近不断重置系统和重装Anaconda,配置的要累死,经几十次意料之外的配置状况打击之后,最后发现是要在在Anaconda安装时,一定要选“仅为我安装”这个选项,而不要选“为所有用户安装”这个选项。 选“仅为我安…

【大模型】激活函数之SwiGLU详解

文章目录 1. Swish基本定义主要特点代码实现 2. GLU (Gated Linear Unit)基本定义主要特点代码实现 3. SwiGLU基本定义主要特点代码实现 参考资料 SWiGLU是大模型常用的激活函数,是2020年谷歌提出的激活函数,它结合了Swish和GLU两者的特点。SwiGLU激活函…

AOA与TOA混合定位,MATLAB例程,三维空间下的运动轨迹,滤波使用EKF,附下载链接

本文介绍一个MATLAB代码,实现基于 到达角(AOA) 和 到达时间(TOA) 的混合定位算法,结合 扩展卡尔曼滤波(EKF) 对三维运动目标的轨迹进行滤波优化。代码通过模拟动态目标与基站网络&am…

【211】线上教学系统

--基于SSM线上教学平添 主要实现的功能有: 管理员 : 首页、个人中心、学员管理、资料类型管理、学习资料管理、交流论坛、我的收藏管理、试卷管理、留言板管理、试题管理、系统管理、考试管理。 学员 : 首页、个人中心、我的收藏管理、留言板管理、考试管理。 前台…

从混乱思绪到清晰表达:记录想法如何改变你的学习人生

关键要点 • 记录想法似乎是发现自己想法并将其组织成可传播形式的最佳理由,研究表明写作和教学能增强学习和理解。 • 证据倾向于支持写作有助于澄清思想,而教学通过“教授效应”深化知识。 • 教学和分享被认为是最有效的学习方法,这与记录…

电机控制常见面试问题(二十)

文章目录 一.整流电路绕组接法二.电机为什么需要转速器三.电机转矩产生原理四.电机控制中载波频率大小的确定五.开关周期 Tpwm 一.整流电路绕组接法 为了引出直流的输出,一定要在整流变压器的二次侧引出零线,所以二次侧绕组必须接成星形 一次绕组必须要…

小爱控制via电视浏览器搜索图片-Homeassistant重制上一个自动化

制作自动化详情 为了完成图片搜,暂定指令找找{描述} 在执行脚本的adb地方输入以下指令,百度 因安全不让在图片地址直接搜转用bing >- >am start -n mark.via.gp/mark.via.Shell -a android.intent.action.VIEW -d https://cn.bing.com/images/…

unity一个图片的物体,会有透明的效果

如图 想要去掉这个透明效果 选择一个高层级的layer即可。

docker网桥问题导致ldap组件安装失败分析解决

使用pass_install_x86_64_0124版部署k8s底座、kem; 问题:一台kem节点部署ldap组件失败 解决:恢复问题主机的docker0网卡,重新部署kem相关组件 二、问题详情 现象描述 ansible部署kem组件 TASK [kem : start ldap] **********…

【Python】pillow库学习笔记1-Image类

《Python语言程序设计基础 》第3版,嵩天 黄天羽 杨雅婷著,P293 1.pillow库概述 Pillow 库是Python图像处理重要的第三方库。 Pillow库是PIL (Python image library) 库的一个扩展,需要通过pip工具安装。安装PIL库需要注意,安装…

智能网联交通加速落地,光路科技TSN技术助推车路云一体化发展

今日,为期两天的第二十七届高速公路信息化大会在青岛国际会展中心(红岛馆)圆满落幕。本次大会以“数智转型安全”为主题,聚焦高速公路数字化转型、车路云协同以及新一代信息技术的融合应用。会议汇聚了交通行业的专家学者、企业代…