机制设计原理与应用(三)Screening

news2024/11/14 18:14:59

文章目录

3 Screening

Screening theory:机制设计理论可以被看作是其多智能体的拓展。

概率论:是初始分析,广泛用于促进理论分析。

3.1 为单个不可分割的项目定价

模型

卖方寻求出售一件不可分割的物品。

卖方的目标是使预期收入最大化。

为什么收入最大化此福利最大化更复杂?

卖方被假设为风险中立。

​ 风险中立,风险规避,风险追求?(举例)。

只有一个买家对该物品的价值为 θ \theta θ
u = { θ − t , 买方购买这个物品支付 t 0 , 否则 u = \begin{cases} \theta - t, & 买方购买这个物品支付t \\ 0, & 否则 \end{cases} u={θt,0,买方购买这个物品支付t否则
θ \theta θ对买方来说是私有的并且取决于买方的类型。

3.1.1 对 θ \theta θ的假设

θ \theta θ代表的是买方对物品的估价,卖方虽然不能直接获得,但是可以从以往的数据中找到大多数人对这个物品的购买价格(不包括非理性个体)。

  • 假设卖方对 θ \theta θ的可能值有一个概率分布。
  • 这种分布可以用CDF F和PDF f描述。
  • F在一个区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ]内,其中 0 < θ ‾ < θ ‾ 0<\underline{\theta}<\overline{\theta} 0<θ<θ;并且$f(\theta)>0,\forall \theta \in [\underline{\theta}, \overline{\theta}] $
  • 在卖方看来, θ \theta θ是一个具有CDF F的随机变量(但实际上它只由买方观察)

3.1.2 问题描述

卖方:找到一个出售物品的程序,使其预期收入最大化(即设计一个博弈和策略,又称机制的规则)。

买方:遵循设计好的机制,在知道 θ \theta θ值的情况下,选择自己的策略,使其预期效用最大化。

第一种猜测:卖方应该选择一种博弈,根据这种博弈,买方只有一种选择,即买方没有得到物品,但必须支付t,其中t可以是一些任意大的数字。(为什么要排除这种机制?)答案是个人理性!

第二种猜测:卖方应该使用"讨价还价"、“抽签”…(复杂)我们能否将注意力限制在一小部分机制上

定义

一个"直接机制"由函数q和t组成,其中
q : [ θ ‾ , θ ‾ ] ⟶ [ 0 , 1 ] ( 可能性 ) t : [ θ ‾ , θ ‾ ] ⟶ R ( 真实值 ) q:[\underline{\theta}, \overline{\theta}] \longrightarrow [0,1](可能性) \\ t:[\underline{\theta}, \overline{\theta}] \longrightarrow \mathbb{R}(真实值) q:[θ,θ][0,1](可能性)t:[θ,θ]R(真实值)

对直接机制的解释:

  • 买方被要求报告 θ \theta θ(实话实说)。
  • 买方以 q ( θ ) q(\theta) q(θ)的概率赢得该物品。
  • 买方必须向卖方支付 t ( θ ) t(\theta) t(θ)

问题:我们总能找到一个直接的机制吗?

启示原则

命题(启示录原则)

给定一个具有相应平衡/解决方案的机制,存在一个直接机制,其中

  1. 买方如实报告其价值是一种均衡/解决方案。
  2. 结果与给定机制产生的结果相同。

很明显,这使我们能够大大简化我们的分析,因为它表明,在不丧失一般性的情况下,我们可以把寻找最优机制的工作限制在直接机制上。

确定 q ( θ ) q(\theta) q(θ) t ( θ ) t(\theta) t(θ),其中如实报告 θ \theta θ对买方是最优的。

考虑到直接机制,买方的预期效用变为
u ( θ ) = θ q ( θ ) − t ( θ ) u(\theta) = \theta q(\theta) - t(\theta) u(θ)=θq(θ)t(θ)

3.1.3 特性

定义(激励相容性,IC)

如果对每一个买方类型来说,如实告知都是最优策略,也就是说这个直接机制具备激励相容性:
u ( θ ) = θ q ( θ ) − t ( θ ) ≥ θ q ( θ ′ ) − t ( θ ′ ) , ∀ θ , θ ′ ∈ [ θ ‾ , θ ‾ ] u(\theta) = \theta q(\theta)-t(\theta) \ge \theta q(\theta^{'})-t(\theta^{'}), \forall \theta, \theta^{'} \in [\underline{\theta}, \overline{\theta}] u(θ)=θq(θ)t(θ)θq(θ)t(θ),θ,θ[θ,θ]
定义(个人理性,IR)

如果买方以真实的类型自愿参与拍卖,即这个直接机制满足个人理性:
u ( θ ) ≥ 0 , ∀ θ ∈ [ θ ‾ , θ ‾ ] u(\theta) \ge 0, \forall \theta \in [\underline{\theta}, \overline{\theta}] u(θ)0,θ[θ,θ]
满足IC的条件

引理

如果一个直接机制是激励相容的,那么分配概率q随着θ的增加而增加。

引理

如果一个直接机制是激励相容的,那么买方的效用函数u是递增和凸的,并且满足:
u ′ ( θ ) = ∂ u ( θ ) ∂ θ = q ( θ ) u^{'}(\theta) = \frac{\partial u (\theta)}{\partial \theta} = q(\theta) u(θ)=θu(θ)=q(θ)
引理

如果一个直接机制是激励相容的,那么对于所有 θ ∈ [ θ ‾ , θ ‾ ] \theta \in [\underline{\theta},\overline{\theta}] θ[θθ]有:
u ( θ ) = u ( θ ‾ ) + ∫ θ ‾ θ q ( x ) d x , t ( θ ) = t ( θ ‾ ) + ( θ q ( θ ) − θ ‾ q ( θ ‾ ) ) − ∫ θ ‾ θ q ( x ) d x . \begin{array}{l} u(\theta)=u(\underline{\theta})+\int_{\underline{\theta}}^{\theta} q(x) d x, \\ t(\theta)=t(\underline{\theta})+(\theta q(\theta)-\underline{\theta} q(\underline{\theta}))-\int_{\underline{\theta}}^{\theta} q(x) d x . \end{array} u(θ)=u(θ)+θθq(x)dx,t(θ)=t(θ)+(θq(θ)θq(θ))θθq(x)dx.
命题

一个直接机制(q,t)是激励相容的当且仅当下列条件

  • q是 θ \theta θ的增函数。
  • 对于任意 θ ∈ [ θ ‾ , θ ‾ ] \theta \in [\underline{\theta}, \overline{\theta}] θ[θ,θ],有

t ( θ ) = t ( θ ‾ ) + ( θ q ( θ ) − θ ‾ q ( θ ‾ ) ) − ∫ θ ‾ θ q ( x ) d x . t(\theta)=t(\underline{\theta})+(\theta q(\theta)-\underline{\theta} q(\underline{\theta}))-\int_{\underline{\theta}}^{\theta} q(x) d x . t(θ)=t(θ)+(θq(θ)θq(θ))θθq(x)dx.

IR的条件与影响

命题

当且仅当 u ( θ ) ≥ 0 u(\theta) \ge 0 u(θ)0时,一个激励兼容的机制是个人理性的。

引理

有了IC和IR,为了使卖家的收入最大化,我们应该设定
t ( θ ‾ ) = θ ‾ q ( θ ‾ )  and  t ( θ ) = θ q ( θ ) − ∫ θ ‾ θ q ( x ) d x t(\underline{\theta})=\underline{\theta} q(\underline{\theta}) \quad \text { and } \quad t(\theta)=\theta q(\theta)-\int_{\underline{\theta}}^{\theta} q(x) d x t(θ)=θq(θ) and t(θ)=θq(θ)θθq(x)dx

3.2 为无限可分的项目定价

模型

卖方试图将一个可无限分割的物品,如糖,卖给一个买方。

卖方的目标是使预期收入最大化(风险中立)。

卖方有一个线性生产成本,即生产数量q的物品的成本为cq,其中c>0是一个常数。

买方购买数量q≥0的物品,支付t的效用为:
u = θ v ( q ) − t u=\theta v(q)-t u=θv(q)t
这里,假设 v ( 0 ) = 0 , v ′ ( q ) > 0 , v ′ ′ ( q ) < 0 , ∀ q ≥ 0 v(0)=0, v^{'}(q)>0, v^{''}(q)<0, \forall q \ge 0 v(0)=0,v(q)>0,v′′(q)<0,q0,也就是从0开始,增长的速度越来越缓慢,类似于边际效应。

θ v ( q ) \theta v(q) θv(q)表示买方对数量q的物品的支付意愿。

3.2.1 对 θ \theta θ的假设

参数 θ \theta θ反映了买方对该物品的重视程度。

  • 假设卖方对 θ \theta θ的可能值有一个概率分布。
  • 这种分布可以用CDF F和PDF f描述。
  • F在一个区间 [ θ ‾ , θ ‾ ] [\underline{\theta}, \overline{\theta}] [θ,θ]内,其中 0 < θ ‾ < θ ‾ 0<\underline{\theta}<\overline{\theta} 0<θ<θ;并且$f(\theta)>0,\forall \theta \in [\underline{\theta}, \overline{\theta}] $
  • 在卖方看来, θ \theta θ是一个具有CDF F的随机变量(但实际上它只由买方观察)

定义

一个"直接机制"由函数q和t组成,其中
q : [ θ ‾ , θ ‾ ] ⟶ [ 0 , 1 ] ( 可能性 ) t : [ θ ‾ , θ ‾ ] ⟶ R ( 真实值 ) q:[\underline{\theta}, \overline{\theta}] \longrightarrow [0,1](可能性) \\ t:[\underline{\theta}, \overline{\theta}] \longrightarrow \mathbb{R}(真实值) q:[θ,θ][0,1](可能性)t:[θ,θ]R(真实值)

对直接机制的解释:

  • 买方被要求报告 θ \theta θ(实话实说)。
  • 买方以 q ( θ ) q(\theta) q(θ)的概率赢得该物品。
  • 买方必须向卖方支付 t ( θ ) t(\theta) t(θ)

与单一不可分物品的不同是

买方的效用函数现在是 u ( θ ) = θ v ( q ( θ ) ) − t ( θ ) u(\theta)=\theta v(q(\theta))-t(\theta) u(θ)=θv(q(θ))t(θ)而不是 θ q ( θ ) − t ( θ ) \theta q(\theta)-t(\theta) θq(θ)t(θ)

3.2.3 特性

一个直接机制(q,t)是激励相容的当且仅当下列条件

  • q是 θ \theta θ的增函数。
  • 对于任意 θ ∈ [ θ ‾ , θ ‾ ] \theta \in [\underline{\theta}, \overline{\theta}] θ[θ,θ],有

t ( θ ) = t ( θ ‾ ) + ( θ v ( q ( θ ) ) − θ ‾ v ( q ( θ ‾ ) ) ) − ∫ θ ‾ θ v ( q ( x ) ) d x . t(\theta)=t(\underline{\theta})+(\theta v(q(\theta))-\underline{\theta} v(q(\underline{\theta})))-\int_{\underline{\theta}}^{\theta} v(q(x)) d x . t(θ)=t(θ)+(θv(q(θ))θv(q(θ)))θθv(q(x))dx.

一个激励兼容的机制是个人理性的当且仅当:
u ( θ ‾ ) = t ( θ ‾ ) − θ ‾ v ( q ( θ ‾ ) ) ≥ 0 u(\underline{\theta}) = t(\underline{\theta})-\underline{\theta} v(q(\underline{\theta})) \ge 0 u(θ)=t(θ)θv(q(θ))0

3.2.4 收益最大化

引理

有了IC和IR,为了使卖家的收入最大化,我们应该设定
t ( θ ‾ ) = θ ‾ v ( q ( θ ‾ ) )  and  t ( θ ) = θ v ( q ( θ ) ) − ∫ θ ‾ θ v ( q ( x ) ) d x t(\underline{\theta})=\underline{\theta} v(q(\underline{\theta})) \quad \text { and } \quad t(\theta)=\theta v(q(\theta))-\int_{\underline{\theta}}^{\theta} v(q(x)) d x t(θ)=θv(q(θ)) and t(θ)=θv(q(θ))θθv(q(x))dx
剩余的问题:如何确定函数q(即资源分配)?

回顾一下,卖方的收入等于从买方收取的价格和其生产成本之间的差额

取期望值并代入的表达式,我们有

1

对括号中的表达式进行导数,我们有
v ′ ( q ( θ ) ) ( θ − 1 − F ( θ ) f ( θ ) ) − c = 0 v^{\prime}(q(\theta))\left(\theta-\frac{1-F(\theta)}{f(\theta)}\right)-c=0 v(q(θ))(θf(θ)1F(θ))c=0

v ′ ( q ( θ ) ) ( θ − 1 − F ( θ ) f ( θ ) ) = c v^{\prime}(q(\theta))\left(\theta-\frac{1-F(\theta)}{f(\theta)}\right)=c v(q(θ))(θf(θ)1F(θ))=c
如果 θ − 1 − F ( θ ) f ( θ ) ≤ 0 \theta-\frac{1-F(\theta)}{f(\theta)} \le 0 θf(θ)1F(θ)0,那么最优选择是 q ( θ ) = 0 q(\theta)=0 q(θ)=0,为什么?

如果 θ − 1 − F ( θ ) f ( θ ) > 0 \theta-\frac{1-F(\theta)}{f(\theta)} \gt 0 θf(θ)1F(θ)>0,但 v ′ ( 0 ) ( θ − 1 − F ( θ ) f ( θ ) ) ≤ c v^{\prime}(0)\left(\theta-\frac{1-F(\theta)}{f(\theta)}\right) \le c v(0)(θf(θ)1F(θ))c,那么最优解 q ( θ ) = 0 q(\theta)=0 q(θ)=0。为什么?

如果 θ − 1 − F ( θ ) f ( θ ) > 0 \theta-\frac{1-F(\theta)}{f(\theta)} \gt 0 θf(θ)1F(θ)>0,但 v ′ ( 0 ) ( θ − 1 − F ( θ ) f ( θ ) ) > c v^{\prime}(0)\left(\theta-\frac{1-F(\theta)}{f(\theta)}\right) \gt c v(0)(θf(θ)1F(θ))>c,那么最优解 q ( θ ) q(\theta) q(θ)可以通过求解上述方程得到。

剩余的问题: q是否是 θ \theta θ的增函数?

给定以下假设,q一定是 θ \theta θ的增函数

假设

θ − 1 − F ( θ ) f ( θ ) \theta-\frac{1-F(\theta)}{f(\theta)} θf(θ)1F(θ) θ \theta θ的增函数

注意

这就是所谓的 increasing hazard rate 条件。

如果一个分布F满足这样的条件,那么它就被称为 regular 的。

3.2.5 最优解决方案

命题

假设F是 regular 的。那么,一个预期利润最大化的q的选择是由以下公式给出

  1. 如果 v ′ ( 0 ) ( θ − 1 − F ( θ ) f ( θ ) ) ≤ c v^{\prime}(0)\left(\theta-\frac{1-F(\theta)}{f(\theta)}\right) \le c v(0)(θf(θ)1F(θ))c,我们有 q ( θ ) = 0 q(\theta)=0 q(θ)=0
  2. 否则,通过求解 v ′ ( q ( θ ) ) ( θ − 1 − F ( θ ) f ( θ ) ) = c v^{\prime}(q(\theta))\left(\theta-\frac{1-F(\theta)}{f(\theta)}\right)=c v(q(θ))(θf(θ)1F(θ))=c得到最优的 q ( θ ) q(\theta) q(θ)

利润最大化的t由以下公式给出
t ( θ ) = θ v ( q ( θ ) ) − ∫ θ ‾ θ v ( q ( x ) ) d x t(\theta)=\theta v(q(\theta))-\int_{\underline{\theta}}^{\theta} v(q(x)) d x t(θ)=θv(q(θ))θθv(q(x))dx

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/177081.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Cadence PCB仿真使用Allegro PCB SI生成振铃ringing仿真报告及报告导读图文教程

🏡《Cadence 开发合集目录》   🏡《Cadence PCB 仿真宝典目录》 目录 1,概述2,生成报告3,报告导读4,总结1,概述 本文简单介绍使用Allegro PCB SI生成网络的振铃性能评估的报告的方法,及振铃ringing报告要点导读。 2,生成报告 第1步,选择需要生成报告的网络,然后…

第二章 ArcGIS数据和地理数据库

文章目录第一节 ArcGIS和4D数据基本知识1 4D数据介绍1.1 DLG1.2 DEM1.3 DOM1.4 DRG1.5 4D表现2 ArcGIS的数据和4D数据对应3 栅格数据3.1 查看帮助3.2 空间分辨率3.3 分辨率与比例尺换算3.4 栅格数据介绍——cellsize3.5 栅格数据波段3.6 栅格格式4 栅格数据改变分辨率5 转换栅格…

【 uniapp - 黑马优购 | 登录与支付(2)】如何实现三秒后跳转和微信支付

个人名片&#xff1a; &#x1f43c;作者简介&#xff1a;一名大二在校生&#xff0c;讨厌编程&#x1f38b; &#x1f43b;‍❄️个人主页&#x1f947;&#xff1a;小新爱学习. &#x1f43c;个人WeChat&#xff1a;见文末 &#x1f54a;️系列专栏&#xff1a;&#x1f5bc;…

Ubuntu20.04+MAVROS+PX4+Gazebo安装教程

Ubuntu20.04MAVROSPX4Gazebo安装PX4步骤安装MAVROS安装QGCPX4仿真安装PX4步骤 从github上clone源码 git clone https://github.com/PX4/PX4-Autopilot.git --recursive进入PX4-Autopilot文件夹&#xff0c;继续下载未下载完的组件 cd PX4-Autopilot/ git submodule update -…

flowable使用 act_hi_xxx

HistoryService 流程历史信息 act_hi_procinst : 历史流程信息&#xff0c;&#xff0c;如果流程执行完了&#xff0c;end_time_ 和 duration不为null // 没有执行完的List<HistoricProcessInstance> list historyService.createHistoricProcessInstanceQuery().unfi…

uniapp封装并全局挂载request请求

前言 日常开发中,前端项目中需要调用服务端api完成页面渲染,uniapp提供的请求api:uni.request相对繁琐;另外服务端提供的不同api仅子路径不同,api域名以及根路径都是相同的,一旦接口api变更,需要更改地方就会很多.鉴于以上可以将uni.request进行封装,简化开发. 目前uniapp项…

MySQL(四):B+树索引、聚簇索引、二级索引、联合索引

目录一、B树索引1.1 在没有索引时进行查找记录1.2 索引方案1.3 InnoDB中的索引方案二、聚簇索引三、二级索引四、联合索引五、InnoDB中B树索引的注意事项5.1 根页面的位置不会改变5.2 内节点中目录项记录的唯一性5.3 一个页面至少容纳两条记录一、B树索引 数据库中的用来存储数…

MySQL进阶篇之索引1

02、索引 2.1、索引概述 1、介绍 索引&#xff08;index&#xff09;是帮助MySQL高效获取数据的数据结构&#xff08;有序&#xff09;。在数据之外&#xff0c;数据库系统还维护着满足特定查找算法的数据结构&#xff0c;这些数据结构以某种方式引用&#xff08;指向&#…

Cepstral Analysis 倒谱分析

源过滤器分离 倒谱分析是另一种将声道滤波器响应与激励分开的方法&#xff08;如线性预测&#xff09; 它基于以下观察&#xff1a;语音信号的频谱是激励频谱和声道频率响应的乘积 可以使用log将乘法转换为加法&#xff0c;因此&#xff0c;“对数频谱”可以看作是对数激励频…

十七、Gtk4-Menu and action

Menu 用户经常使用菜单向计算机发出命令。它是这样的: 现在让我们分析一下上面的菜单。对象有两种类型。 “File”, “Edit”, “View”, “Cut”, “Copy”, “Paste” and “Select All”. 它们被称为“菜单项&#xff08;menu item&#xff09;”或简单地称为“item”。当…

字节青训前端笔记 | 前端调试

在程序员的世界中&#xff0c;BUG 一词相信同学们再熟悉不过了&#xff0c;本节课将围绕前端开发中所遇见的 BUG 出发&#xff0c;讲解作为一名合格的前端开发人员&#xff0c;你应该掌握哪些开发调试知识 Chorme DevTools Chorme DevTools 是 chorme内核为大家提供的高效的前…

gdb使用

gdb是一款UNIX及UNIX-like下的调试工具 gdb可用于调试用gcc编译的可执行文件&#xff0c;用gdb调试时gcc编译需要使用参数-g 本文是对于gdb在Linux下使用的基本命令的总结gdb调试视频演示&#xff0c;gdb调试基础指令&#xff0c;gdb调试其他命令&#xff0c;gdb常见错误说明 目…

23种设计模式(二十一)——命令模式【行为变化】

文章目录 意图什么时候使用命令真实世界类比命令模式的实现命令模式的优缺点亦称:动作、事务、Action、Transaction、Command 意图 将一个请求封装为一个对象,使发出请求的责任和执行请求的责任分割开。这样两者之间通过命令对象进行沟通,这样方便将命令对象进行储存、传递…

Centos7 Docker安装APISIX

Centos7 Docker安装APISIX1 基础介绍1.1 概念1.2 特性1.3 架构图2 快速安装2.1 前提条件2.2 安装步骤2.2.1 git命令克隆apisix-docker仓库2.2.2 docker-compose启动apisix2.2.3 访问apisix dashboard3 简单使用3.1 准备接口3.2 创建服务3.3 创建路由3.4 测试请求1 基础介绍 1.…

Kubernetes:分享一个很简洁的 k8s 管理工具 Skooner

写在前面 博文内容为 Skooner 简单介绍包括下载安装导入集群基本功能使用Skooner 的 sa 使用的当前命名空间默认的 sa不会显示创建 sa ,当然可以单独创建理解不足小伙伴帮忙指正 我所渴求的&#xff0c;無非是將心中脫穎語出的本性付諸生活&#xff0c;為何竟如此艱難呢 -----…

Spring_FrameWork_10(MyBatisPlus)

lombok mybatis:configuration:log-impl: org.apache.ibatis.logging.stdout.StdOutImplTestvoid selectById(){IPage page new Page(2,2);bookDao.selectPage(page,null);System.out.println("当前页码值&#xff1a;"page.getCurrent());System.out.println…

Java---微服务---Nacos集群搭建

Nacos集群搭建1.集群结构图2.搭建集群2.1.初始化数据库2.2.下载nacos2.3.配置Nacos2.4.启动2.5.nginx反向代理2.6.优化1.集群结构图 官方给出的Nacos集群图&#xff1a; 其中包含3个nacos节点&#xff0c;然后一个负载均衡器代理3个Nacos。这里负载均衡器可以使用nginx。 我们…

解锁Windows所有电源选项

20230123 By wdhuag 目录 参考&#xff1a; 查看当前选项&#xff1a; 警告&#xff01;修改前&#xff0c;先使用Registry Workshop备份注册表&#xff0c;导出PowerSettings&#xff1a; 在PowerSettings里增加Attributes参数&#xff08;十六进制、数值2&#xff09;&a…

Shell脚本从入门到实战

Shell 文章目录Shellshell概述Shell脚本入门1. 脚本格式2. 第一个Shell脚本:helloworld3. 第二个Shell脚本&#xff1a;多命令处理Shell中的变量系统变量1. 常用系统变量2. 案例实操自定义变量1. 基本语法2. 变量定义规则特殊变量&#xff1a;$n特殊变量&#xff1a;$#特殊变量…

零基础学JavaWeb开发(二十二)之 springmvc入门到精通

一、SpringMVC概述 1、三层架构与MVC架构区别 1.1、三层架构 表示层&#xff1a;主要对用户的请求接受&#xff0c;以及数据的返回&#xff0c;为客户端提供应用程序的访问。 servlet层 业务逻辑层&#xff1a;对我们数据实现业务逻辑的封装 service层 数据访问层&#xf…