【三方演化博弈】模型构建与模型求解

news2024/12/23 18:34:43

  • 一、背景介绍
  • 二、收益矩阵计算
    • 2.1 博弈主体策略
    • 2.2 概率
    • 2.3 具体公式
    • 2.4 计算过程
      • (1)企业
      • (2)政府
      • (3)环境NGO
  • 三、期望与复制动态方程
    • 3.1 企业平均期望
    • 3.2 政府平均期望
    • 3.3 环境NGO平均期望
    • 3.4 三方演化博弈的均衡点及稳定性分析
  • 四、均衡点及稳定性分析
    • 4.1 构建雅克比矩阵
    • 4.2 均衡点
    • 4.3 雅可比矩阵的特征值
    • 4.4 判断均衡点的稳定性
  • 五、总结

一、背景介绍

接下来以这篇文献为例,介绍一下包括三方演化博弈模型的构建以及代码的撰写。

在这里插入图片描述
知网论文:低碳经济下环境NGO参与企业碳减排的演化博弈分析

二、收益矩阵计算

2.1 博弈主体策略

企业:采取K1,不采取K2
政府:调控M1,不调控M2
环境NGO:监督N1,不监督N2

2.2 概率

企业:采取x,不采取1-x
政府:调控y,不调控1-y
环境NGO:监督z,不监督1-z

2.3 具体公式

企业收益=收入+补贴-成本
政府收益=收入-补贴-成本
环境NGO=收入+补贴-成本

2.4 计算过程

(1)企业

1、采取K1:低碳生产
E1:企业采取低碳生产获得的收益
C1:企业采取低碳生产所支付的低碳设备及技术等成本
S1:政府调控时对采取低碳生产的企业给予的补贴

2.不采取K2:传统生产
E2:企业采取传统生产获得的收益
C2:企业按照传统生产所付出的成本
G1:政府调控时对采取传统生产的企业实施的罚款
G2:环境NGO实行监督策略时使传统生产的企业遭受的损失

(2)政府

E3:企业低碳生产给政府带来的潜在收益
C4:政府在企业传统生产时需付出高能耗带来的环境污染治理成本

1、调控M1:耗费人力等监督成本

C3政府采取调控策略时付出的人力、物力、财力等成本

2、不调控M2:对企业不干预

(3)环境NGO

1、监督N1:对企业监督
C5:环境NGo对企业进行监督产生的监督成本
S2:环境NGo实行监督策略获得来自政府的资助
S3:环境NGo实行监督策略获得来自公众的资助

2、不监督N2:对企业监督

根据上述的变量可以得到下面的收益矩阵:

首先,由于有3个主体,每个主体有两种做法,因此最多有2^3种情况。
其次,根据2.3的公式计算三个主体的不同收益

企业收益政府收益环境NGO
K1,M1,N1 (企业采取,政府调控,NGO监督)E1+S1-C1E3-C3-S1-S2S3+S2-C5
K1,M1,N2 (企业采取,政府调控,NGO不监督)E1+S1-C1E3-C3-S10
K1,M2,N1 (企业采取,政府不调控,NGO监督)E1-C1E3-S2S3+S2-C5
K1,M2,N2 (企业采取,政府不调控,NGO不监督)E1-C1E30
K2,M1,N1 (企业不采取,政府调控,NGO监督)E2-C2-G1-G2-C3-C4-S2+G1S3+S2-C5
K2,M1,N2 (企业不采取,政府调控,NGO不监督)E2-C2-G1-C3-C4+G10
K2,M2,N1 (企业不采取,政府不调控,NGO监督)E2-C2-G2-C4-S2S3+S2-C5
K2,M2,N2 (企业不采取,政府不调控,NGO不监督)E2-C2-C40

三、期望与复制动态方程

3.1 企业平均期望

设企业采用“采取”策略的期望收益为V11,采用“不采取”策略的期望收益为V12,平均期望收益为V1,则有:

V 11 = E (采取) = ∑ 企业采取时的收益值 × 政府应对策略概率 × 环境 N G O 应对策略 = ( E 1 + S 1 − C 1 ) × y × z + ( E 1 + S 1 − C 1 ) × y × ( 1 − z ) + ( E 1 − C 1 ) × ( 1 − y ) × z + ( E 1 − C 1 ) × ( 1 − y ) × ( 1 − z ) V_{11} =E(采取)\\= \sum_{} 企业采取时的收益值 \times 政府应对策略概率 \times 环境NGO应对策略 \\=(E1+S1-C1)\times y \times z +(E1+S1-C1 )\times y \times (1-z)+\\( E1-C1 )\times (1-y)\times z+(E1-C1)\times(1-y)\times(1-z) V11=E(采取)=企业采取时的收益值×政府应对策略概率×环境NGO应对策略=(E1+S1C1)×y×z+(E1+S1C1)×y×(1z)+(E1C1)×(1y)×z+(E1C1)×(1y)×(1z)

V 12 = E (不采取) = ∑ 企业不采取时的收益值 × 政府应对策略概率 × 环境 N G O 应对策略 = ( E 2 − C 2 − G 1 − G 2 ) × y × z + ( E 2 − C 2 − G 1 ) × y × ( 1 − z ) + ( E 2 − C 2 − G 2 ) × ( 1 − y ) × z + ( E 2 − C 2 ) × ( 1 − y ) × ( 1 − z ) V_{12} =E(不采取)\\= \sum_{} 企业不采取时的收益值 \times 政府应对策略概率 \times 环境NGO应对策略 \\=(E2-C2-G1-G2)\times y \times z +(E2-C2-G1)\times y \times (1-z)+\\( E2-C2-G2 )\times (1-y)\times z+(E2-C2)\times(1-y)\times(1-z) V12=E(不采取)=企业不采取时的收益值×政府应对策略概率×环境NGO应对策略=(E2C2G1G2)×y×z+(E2C2G1)×y×(1z)+(E2C2G2)×(1y)×z+(E2C2)×(1y)×(1z)

V 1 = E (企业) = 企业采取对应概率 × E (采取) + 企业不采取对应概率 × E (不采取) V_{1} =E(企业)\\= 企业采取对应概率 \times E(采取) + 企业不采取对应概率\times E(不采取) V1=E(企业)=企业采取对应概率×E(采取)+企业不采取对应概率×E(不采取)

F ( x ) = d x d t = x ( V 11 − V 1 ) = x [ V 11 − x V 11 − ( 1 − x ) V 12 ] = x ( 1 − x ) ( V 11 − V 12 ) F(x)=\frac{dx}{dt} \quad=x(V_{11}-V_1) \\=x[V_{11}-xV_{11}-(1-x)V_{12}]=x(1-x)(V_{11}-V_{12}) Fx=dtdx=x(V11V1)=x[V11xV11(1x)V12]=x(1x)(V11V12)


F(x)是复制动态方程,有一个比较固定的公式是x(V11-V1)

下面讲一下这个固定公式:x(V11-V1)是怎么来的:

这是复制动态方程的一种固定表达形式,用于描述连续时间情形下种群群体状态的变化。

首先,如何描述种群群体状态?以种群中不同个体的数量或者不同个体占总体的比例来表示。具体来说,以这个式子(dx/dt = x(V11-V1) )为例,x指的是企业选择“采取”策略的概率(演化博弈论中x指的是企业这个“种群”中选择“采取”策略的个体占总体的比例)。

其次,如何描述种群群体状态的变化?用连续两代之间种群中个体数量(或者占总体的比例)的变化来描述,也就是复制动态方程。在这个例子中,x代表企业种群中这一代选择“采取”策略的个体所占比例,dx/dt代表企业种群中下一代选择“采取”策略的个体所占比例。所以原式就很好理解,dx/dt就是x乘上一个变化率(V11-V1),描述了这一代到下一代群体状态的变化。这个变化率在演化博弈论中是用超额收益(就是选择某一纯策略的个体相比总体的收益之差)来定义的。容易理解,变化率为正,即选择“采取”策略的企业获得的收益大于所有企业获得的平均收益时,其他原先选择“不采取”策略的企业会转而选择“采取”策略,这将导致下一代选择“采取”策略的企业数量增加(或占所有企业的比例上升)。这其实就是“演化”的含义。最终随着和其他博弈主体的不断互动,x会趋于一个稳定值不再变化(如果该博弈能够达到稳定)。

关于复制动态方程的思想,复制动态和生态学思想的联系,其他的复制动态方程形式,我建议参考乔根·W·威布尔的《演化博弈论》(格致出版社、上海人民出版社,当代经济学系列丛书)中3-4章节的内容。


3.2 政府平均期望

政府选择“调控”策略的期望收益为 V21 、选择“不调控”策略的期望收益为 V22 ,平均期 望收益为 V2

V 21 = E (采取) = ∑ 政府采取时的收益值 × 企业应对策略概率 × 环境 N G O 应对策略 = ( E 3 − C 3 − S 1 − S 2 ) × x × z + ( E 3 − C 3 − S 1 ) × x × ( 1 − z ) + ( − C 3 − C 4 − S 2 + G 1 ) × ( 1 − x ) × z + ( − C 3 − C 4 + G 1 ) × ( 1 − x ) × ( 1 − z ) V_{21} =E(采取)\\= \sum_{} 政府采取时的收益值 \times 企业应对策略概率 \times 环境NGO应对策略 \\=(E3-C3-S1-S2)\times x \times z +(E3-C3-S1 )\times x \times (1-z)+\\( -C3-C4-S2+G1 )\times (1-x)\times z+( -C3-C4+G1)\times(1-x)\times(1-z) V21=E(采取)=政府采取时的收益值×企业应对策略概率×环境NGO应对策略=(E3C3S1S2)×x×z+(E3C3S1)×x×(1z)+(C3C4S2+G1)×(1x)×z+(C3C4+G1)×(1x)×(1z)

V 22 = E (不采取) = ∑ 政府不采取时的收益值 × 企业应对策略概率 × 环境 N G O 应对策略 = ( E 3 − S 2 ) × x × z + ( E 3 ) × x × ( 1 − z ) + ( − C 4 − S 2 ) × ( 1 − x ) × z + ( − C 4 ) × ( 1 − x ) × ( 1 − z ) V_{22} =E(不采取)\\= \sum_{} 政府不采取时的收益值 \times 企业应对策略概率 \times 环境NGO应对策略 \\=(E3-S2)\times x \times z +(E3)\times x \times (1-z)+\\( -C4-S2 )\times (1-x)\times z+(-C4)\times(1-x)\times(1-z) V22=E(不采取)=政府不采取时的收益值×企业应对策略概率×环境NGO应对策略=(E3S2)×x×z+(E3)×x×(1z)+(C4S2)×(1x)×z+(C4)×(1x)×(1z)

V 2 = E (政府) = 政府采取对应概率 × E (采取) + 政府不采取对应概率 × E (不采取) = y V 21 + ( 1 − y ) V 22 V_{2} =E(政府)\\= 政府采取对应概率 \times E(采取) + 政府不采取对应概率\times E(不采取)\\=yV_{21}+(1-y)V_{22} V2=E(政府)=政府采取对应概率×E(采取)+政府不采取对应概率×E(不采取)=yV21+(1y)V22

F ( x ) = d y d t = y ( V 21 − V 2 ) F(x)=\frac{dy}{dt} \quad=y(V_{21}-V_2) Fx=dtdy=y(V21V2)

3.3 环境NGO平均期望

环境NGO选择“监督”策略的期望收益为 V31 、选择“不监督”策略的期望收益为V32 ,平均期 望收益为V3

V 31 = E (采取) = ∑ 环境 N G O 采取时的收益值 × 政府应对策略概率 × 企业应对策略 = ( S 3 + S 2 − C 5 ) × y × x + ( S 3 + S 2 − C 5 ) × y × ( 1 − x ) + ( S 3 + S 2 − C 5 ) × ( 1 − y ) × x + ( S 3 + S 2 − C 5 ) × ( 1 − y ) × ( 1 − x ) V_{31} =E(采取)\\= \sum_{} 环境NGO采取时的收益值 \times 政府应对策略概率 \times 企业应对策略 \\=(S3+S2-C5 )\times y \times x +(S3+S2-C5 )\times y \times (1-x)+\\(S3+S2-C5 )\times (1-y)\times x+(S3+S2-C5)\times(1-y)\times(1-x) V31=E(采取)=环境NGO采取时的收益值×政府应对策略概率×企业应对策略=(S3+S2C5)×y×x+(S3+S2C5)×y×(1x)+(S3+S2C5)×(1y)×x+(S3+S2C5)×(1y)×(1x)

V 32 = E (不采取) = ∑ 环境 N G O 不采取时的收益值 × 政府应对策略概率 × 企业应对策略 = 0 V_{32} =E(不采取)\\= \sum_{} 环境NGO不采取时的收益值 \times 政府应对策略概率 \times 企业应对策略 \\=0 V32=E(不采取)=环境NGO不采取时的收益值×政府应对策略概率×企业应对策略=0

V 3 = E (环境 N G O ) = 环境 N G O 采取对应概率 × E (采取) + 环境 N G O 不采取对应概率 × E (不采取) = z V 31 + ( 1 − z ) V 32 V_{3} =E( 环境NGO)\\= 环境NGO采取对应概率 \times E(采取) + 环境NGO不采取对应概率\times E(不采取)\\=zV_{31}+(1-z)V_{32} V3=E(环境NGO=环境NGO采取对应概率×E(采取)+环境NGO不采取对应概率×E(不采取)=zV31+(1z)V32

F ( x ) = d z d t = z ( V 31 − V 3 ) = z ( 1 − z ) ( S 2 + S 3 − C 5 ) F(x)=\frac{dz}{dt} \quad=z(V_{31}-V_3) \\=z(1-z)(S2+S3-C5) Fx=dtdz=z(V31V3)=z(1z)(S2+S3C5)

3.4 三方演化博弈的均衡点及稳定性分析

在这里插入图片描述

四、均衡点及稳定性分析

4.1 构建雅克比矩阵

在这里插入图片描述

4.2 均衡点

条件:F(x)=0 , F(y)=0 , F(z)=0 ,
得到对应的xyz的组合

4.3 雅可比矩阵的特征值

将求得的均衡点代入雅克比矩阵
求此时矩阵对应的特征值

4.4 判断均衡点的稳定性

当特征值均为负数时,那么均衡点是稳定的均衡点。

MATLAB计算三方演化博弈均衡点出现错误?

在这里插入图片描述
具体可以参考上面的链接和这篇文章。

五、总结

写一篇关于演化博弈相关的矩阵如下:

引言+文献综述
1、确立三个主体及策略
2、确立策略概率
3、计算收益矩阵
4、计算期望与复制动态方程
5、绘制相位图(部分文献做省略处理)
6、构建雅克比矩阵
7、计算均衡点
8、计算此时雅克比矩阵对应的特征值
9、判断均衡点的稳定性
10、仿真分析

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2141021.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

旋转链表问题(python3)

旋转链表 问题描述解题思路代码实现 问题描述 给你一个链表的头节点 head &#xff0c;旋转链表&#xff0c;将链表每个节点向右移动 k 个位置。 输入&#xff1a;head [1,2,3,4,5], k 2 输出&#xff1a;[4,5,1,2,3] 链表中节点的数目在范围 [0, 500] 内-100 < Node.va…

robomimic基础教程(一)——基本概念

robosuite和robomimic都是由ARISE Initiative开发的开源工具&#xff0c;旨在推进机器人学习和机器人操作领域的研究。 一、基本概念 robomimic是一个用于机器人示范学习的框架。它提供了在机器人操作领域收集的大量示范数据集&#xff0c;以及用于从这些数据集中学习的离线学…

828华为云征文|华为云Flexus云服务器X实例之openEuler系统下打造EnBizCard个人电子名片

828华为云征文&#xff5c;华为云Flexus云服务器X实例之openEuler系统下打造EnBizCard个人电子名片 一、Flexus云服务器X实例介绍1.1 Flexus云服务器X实例简介1.2 Flexus云服务器X实例特点1.3 Flexus云服务器X实例使用场景 一、EnBizCard介绍2.1 EnBizCard简介2.2 EnBizCard特点…

CSS调整背景

一、设置背景颜色 通过 background-color 属性指定&#xff0c;值可以是十六进制 #ffffff&#xff0c;也可以是rgb(0, 255, 255)&#xff0c;或是颜色名称 "red" div {background-color: red; /* 通过颜色名称设置 */background-color: #ff0000; /* 通过十六进制设…

数据结构和算法之线性结构

原文出处:数据结构和算法之线性结构 关注码农爱刷题&#xff0c;看更多技术文章&#xff01;&#xff01;&#xff01; 线性结构是一种逻辑结构&#xff0c;是我们编程开发工作应用最广泛的数据结构之一。线性结构是包含n个相同性质数据元素的有限序列。它的基本特征是&…

求和(2)

题目描述 输入两个正整数 l,r&#xff0c;编程计算 l(l1)(l2)...(r−1)r 的结果并输出。 输入格式 一行两个整数 l 和 r 输出格式 一个整数&#xff0c;根据题意计算后的结果 样例数据 样例输入#1 1 5样例输出#1 15样例输入#2 8 10样例输出#2 27数据范围 对于100%的…

刷题DAY38

原样输出 题目&#xff1a;给定一个数n&#xff0c;请原样输出 输入&#xff1a;输入只有一个数&#xff0c;可能为小数&#xff0c;也可能为整数&#xff0c;-1000000<n<1000000 输出&#xff1a;原样输出 输入&#xff1a;1.123 输出&#xff1a;1.123 import ja…

鸿蒙媒体开发系列01——资源分类访问

如果你也对鸿蒙开发感兴趣&#xff0c;加入“Harmony自习室”吧&#xff01;扫描下方名片&#xff0c;关注公众号&#xff0c;公众号更新更快&#xff0c;同时也有更多学习资料和技术讨论群。 1、概述 应用开发过程中&#xff0c;经常需要用到颜色、字体、间距、图片等资源&am…

代码随想录刷题day34丨 62.不同路径 ,63. 不同路径 II

代码随想录刷题day34丨 62.不同路径 &#xff0c;63. 不同路径 II 1.题目 1.1不同路径 题目链接&#xff1a;62. 不同路径 - 力扣&#xff08;LeetCode&#xff09; 视频讲解&#xff1a;动态规划中如何初始化很重要&#xff01;| LeetCode&#xff1a;62.不同路径_哔哩哔哩…

【Linux】-基本指令(上)

&#x1f511;&#x1f511;博客主页&#xff1a;阿客不是客 &#x1f353;&#x1f353;系列专栏&#xff1a;深入代码世界&#xff0c;了解掌握 Linux 欢迎来到泊舟小课堂 &#x1f618;博客制作不易欢迎各位&#x1f44d;点赞⭐收藏➕关注 与Windows环境不同&#xff0c;我们…

ASCII字符和中文字符的显示

目录 前言 ASCII字符的点阵显示 获取点阵 描点 main 中文字符的点阵显示 指定编码格式 汉字区位码 汉字点阵显示实验 打开汉字库文件 编写显示汉字的函数 使用 lcd_put_chinese 函数 前言 板子为韦东山老师的imx6ull板&#xff0c;要在LCD上实现字符的显示&#xf…

idea集成和使用Git指南

前言 Git是一个分布式的版本控制工具&#xff0c;可以管理我们开发过程中的源代码文件&#xff0c;而idea是Java的集成开发环境&#xff0c;在idea中配置Git&#xff0c;可以提高我们的团队开发效率。因此在idea中集成Git并使用Git管理我们的源代码是必要的 第一步&#xff1a;…

多线程的高手——海王(浅谈线程概念)

听到大海的声音了吗 让我想想炉石里面能被成为海王的卡牌 我个人感觉 就是拿着三叉戟的甲壳元素 可是这牌被删了我心痛 背景知识 还是地址空间那点破事&#xff01; OS进行内存管理&#xff0c;不是以字节为单位的&#xff0c;而是以内存块为单位的&#xff01; 默认是4k…

Halo 开发者指南——项目运行、构建

准备工作 环境要求 OpenJDK 17 LTSNode.js 20 LTSpnpm 9IntelliJ IDEAGitDocker&#xff08;可选&#xff09; 名词解释 工作目录 指 Halo 所依赖的工作目录&#xff0c;在 Halo 运行的时候会在系统当前用户目录下产生一个 halo-next 的文件夹&#xff0c;绝对路径为 ~/ha…

学习图解算法 使用C语言

图解算法 使用C语言 也就是通过C语言实现各种算法 链接&#xff1a;百度云盘 提取码&#xff1a;1001

【CMake】使用CMake在Visual Stdudio构建一个最简单的项目

一、准备工作 首先&#xff0c;确保在 V i s u a l S t u d i o Visual\ Studio Visual Studio上安装了 C C C桌面开发&#xff0c;如果没有安装&#xff0c;打开 V i s u a l S t u d i o I n s t a l l e r Visual\ Studio\ Installer Visual Studio Installer就可以修改…

【JAVA干货店】带你玩转数组与递归

&#x1f308;个人主页: Aileen_0v0 &#x1f525;热门专栏: 华为鸿蒙系统学习|计算机网络|数据结构与算法 ​&#x1f4ab;个人格言:“没有罗马,那就自己创造罗马~” 文章目录 递归利用递归求斐波那契数列数组入门 递归 自己调用自己 StackOverflowError:栈溢出错误,出现的原…

滑动窗口(3)_最大连续1的数组个数III

个人主页&#xff1a;C忠实粉丝 欢迎 点赞&#x1f44d; 收藏✨ 留言✉ 加关注&#x1f493;本文由 C忠实粉丝 原创 滑动窗口(3)_最大连续1的数组个数III 收录于专栏【经典算法练习】 本专栏旨在分享学习算法的一点学习笔记&#xff0c;欢迎大家在评论区交流讨论&#x1f48c; …

CTFHub技能树-信息泄露-HG泄漏

目录 漏洞产生原因 解题过程 当开发人员使用 Mercurial 进行版本控制&#xff0c;对站点自动部署。如果配置不当,可能会将.hg 文件夹直接部署到线上环境。这就引起了 hg 泄露漏洞。 漏洞产生原因 Mercurial(hg)是一种分布式版本控制系统&#xff0c;它与Git类似也可以用于管…

【Java】线程状态:线程生命周期的六个阶段

欢迎浏览高耳机的博客 希望我们彼此都有更好的收获 感谢三连支持&#xff01; 在Java中&#xff0c;线程可以处于多种状态&#xff0c;这些状态描述了线程的生命周期。了解这些状态及其转换条件对于编写高效且无错误的多线程应用程序至关重要。本文将总结Java线程的几种状态&am…