Auction Design in the Auto-bidding World系列一：面向异质目标函数广告主的拍卖机制设计...

导读： 传统拍卖机制不存在了！出价产品智能化成为行业发展趋势，自动出价（Auto-bidding）已成为互联网广告主营销的主流，经典效用最大化模型（Utility Maximizer）的假设已经不再能良好地刻画此类广告主，传统拍卖机制在Auto-bidding下的激励性质和最优性需要被重新思考。

▐ 摘要

数字广告是互联网平台的主要收入来源之一。近年来，很多广告主开始采用自动竞价（Auto-bidding）工具来优化广告效果，这使得拍卖理论中经典的效用最大化模型（Utility Maximizer）不再能够良好地刻画此类广告主。因此，近年来业界研究提出了一个新的模型，称为价值最大化模型（Value Maximizer），用于有投资回报率（ROI）约束的自动竞价广告主。然而，无论是效用最大化还是价值最大化的模型，都只能刻画实际广告平台中的一部分广告主。在效用最大化广告主和价值最大化广告主并存的混合环境中，真实的广告拍卖设计属于多参数机制设计问题，因为广告主可以同时操作他们的广告点击价值和所属的类别两个信息。本文提出了一种满足真实性(Truthfulness)的拍卖机制，其通过巧妙结合经典的VCG和GSP机制中的扣费规则来解决多参数机制设计中的复杂性问题。同时该机制具备良好的机制性质，其社会福利的近似比为2，我们同时也证明了该近似比的下界为1.25。特别值得一提的是，我们所设计的拍卖机制是针对效用最大化广告主的VCG和针对价值最大化广告主的GSP两种拍卖机制的自然推广。基于该项工作整理的论文已被AAAI 2023录取，欢迎阅读交流。

论文：Utility Maximizer or Value Maximizer: Mechanism Design for Mixed Bidders in Online Advertising

下载：https://arxiv.org/abs/2211.16251

一、背景介绍

在典型的数字广告场景中，平台通过Vickrey-Clark-Grove（VCG）拍卖机制或广义第二价格（Generalized Second Price，GSP）拍卖机制进行广告位的分配并为广告主计算相应的扣费。在近二十多年的研究中，学术界和工业界已经发现，VCG是一种能够满足真实性（Truthfulness，也称诚实性或激励兼容性）的机制，而GSP虽然是工业界更普遍的选择，却并不满足真实性，不过GSP拍卖中存在无嫉妒纳什均衡，而且所有无嫉妒纳什均衡的收益都不比VCG低[1,2]。

现有的关于VCG和GSP的分析主要建立在拟线性效用模型上，也被称为效用最大化广告主（Utility Maximizer，UM），即广告主的目标是优化其分配的价值和扣费之间的差值。然而，在当前的很多在线广告系统中，广告主已经开始使用自动竞价（Auto-bidding）工具，利用自动竞价工具，广告主只需要设置高层次的约束条件，即在一定的预算下，指定一个投资回报率（Return On Investment，ROI，所分配得到的价值和扣费之间的比例）的阈值约束。当投资回报率约束接近于1时，它可以由UM模型中的个体理性的性质来刻画。然而，当投资回报率约束变得较大时，经典的UM模型无法刻画出广告主在自动竞价中的行为。因此，雅虎公司的研究人员Wilkens、Cavallo和Niazadeh[3]为广告主提出了另一个模型，称为价值最大化广告主（Value Maximizer，VM），该模型将分配的价值作为广告主的首要目标，将扣费作为其次的目标，只有当价值相同时才偏好扣费更少的结果。他们通过理论分析和实际系统中的观察发现，只要广告主的投资回报率约束稍高（高于2或3），其行为模式就会接近VM模型对应的行为模式。这个新模型带来了一个重要的理论结果，即工业界常用的GSP拍卖成为一个满足真实性的机制，这为GSP在工业界的普遍使用提供了一个新的视角，也使得VM模型吸引了学术界和工业界的广泛关注。

然而，无论是UM还是VM模型，都只能代表一部分广告主，其中，UM代表投资回报率约束相对较低的广告主，而VM则代表投资回报率约束相对较高的广告主。由于广告主的投资回报率约束可能多种多样，那么当UM和VM这两类广告主同时存在于一个广告系统中时，如何设计一个满足真实性的机制呢？这个问题包括两个层次：1）类别信息是公开的，即一个广告主只能自主上报他的广告点击价值；2）类别信息是私有的，即一个广告主可以同时自主上报他的类别和他的广告点击价值。即使是较简单的第一种情况，也不是一个简单的问题，因为在这种情况下，广告主的策略性行为是未知的，也就是说VCG或GSP机制都不会满足真实性。而后一种情况更加符合实际场景，因为广告主可以很容易地操纵自己的投资回报率约束，以改变相应的类别，进而从中获益。这种私有的类别信息给广告拍卖机制设计带来了实质性的挑战，这一问题属于多参数机制设计领域，而这一领域通常面临较难解决的开放性问题。

在为了解决上述问题，我们要为公开类别信息和私有类别信息两种情况设计满足真实性的机制。针对公开类别信息的情况，存在以下满足真实性的机制，且能够保证最佳的社会福利：根据广告主对广告位的出价进行排序并分配坑位，然后按照VCG扣费规则向UM收费，按照GSP扣费规则向VM收费。该机制是直观的，但在某种程度上对VM是“不公平的”，因为VM与UM相比，获得相同的分配的前提下，在该机制中可能需要付出更多费用。这意味着该机制在类别信息是私有信息的情况下是不满足真实性的。因此，我们进一步提出了一个针对私有类别信息的混合广告主的机制（Mechanism for bidders with PRivate classes，MPR）。MPR的关键思想是为每个坑位而不是每个广告主指定这样一个扣费规则：从下方最近的UM推导出的VCG式扣费值和从下方最近的VM推导出的GSP式扣费值中取最大值。有了这个扣费规则，MPR先通过自下而上的方式用所有的VM填充广告位，然后迭代地每次给一个UM分配一个具有最优效用值的广告位。大量实验证明，这种机制在广告点击价值和类别信息两个维度上都是满足真实性的，同时也保证了社会福利的近似比最高为2。我们还证明了，没有任何机制可以达到比1.25更好的近似比。

本文提出的MPR机制，主要成果包括两方面：一方面，我们首次研究了UM和VM并存的混合环境下满足真实性的广告拍卖机制设计，这为VCG和GSP机制的结合提供了一个有趣的视角：当所有的广告主都是UM时，我们提出的两个机制都会简化为VCG；当所有广告主都是VM时，会简化为GSP。另一方面，针对投资回报率约束的广告主的机制设计是近年来的一个热门研究问题[4,5]，我们的工作为理解该问题迈出了重要的一步。此外，我们的机制发现，一个满足真实性的机制可能会将更高的坑位分配给具有高投资回报率约束的广告主（即本工作中的VM），尽管他们的出价可能低于那些具有低投资回报率约束的广告主。

二、问题建模

在经典的广告拍卖模型中，有个广告位，自下而上地索引为。每个广告位具有点击率（Click-Through Rate，CTR），而且我们假设。我们使用和来表示最低坑位下面的一个虚拟坑位。有一组广告主，索引为，其中每个广告主都有一个私有的广告点击价值。不失一般性地，我们假设对于每一对广告主和，有和。为了便于表述，我们假设一个拍卖机制确定一个分配结果，并对每个广告主的每次点击收取价格，其中表示被分配到坑位的广告主。我们也用表示分配给广告主的广告坑位的索引，即若有，则有。

在我们考虑的场景中，每个广告主可以是一个效用最大化广告主（UM），也可以是价值最大化广告主（VM）。它们的定义如下：

定义1（效用最大化广告主，UM）：一个效用最大化的广告主的目标是最大化他的效用函数。

定义2（价值最大化广告主，VM）：一个价值最大化广告主的策略是最大化他的分配价值，同时保证扣费，在价值相同的结果中，更偏好价格较低的结果。

直观地说，UM遵循在线广告中经典的广告主模型，而VM则认为他所获得的分配价值优先于他的扣费，为了简化表达，我们也用“效用”一词表达VM的分配价值。我们用来表示广告主的类别，并用表示他的类型（我们将价值和类别统称为“类型”）。我们假设一个广告主可以虚报他的价值和他的类别，即，一个广告主可以报告他的类型为，其中可能出现或。此外，我们用表示所有参与者的类型概况，而表示除了以外所有参与者的类型。基于这些符号，我们定义作为广告主的扣费，其中广告主报告他的类型为，他的真实类型为，其他人的类型为，此外，我们用表示相应的效用。

一个理想的拍卖机制应该满足三个要求：激励相容性（Incentive Compatibility，IC）、个体理性（Individual Rationality，IR）和稳健性（Robustness）。

定义3（激励相容性，IC）：一个机制是激励相容的，当且仅当。

定义4（个体理性，IR）：一个机制是个体理性的，当且仅当。

定义5（稳健性，Robustness）：如果当所有广告主都是UM时，结果与VCG相同，而当所有广告主都是VM时，结果与GSP相同，则该机制是稳健的。

换句话说，IC保证了机制中的所有广告主都没有虚报类型的动机，IR保证了广告主在诚实出价时不会得到负的效用值，而稳健性保证了机制是现有机制的自然扩展。我们将宽泛地使用“真实性（Truthfulness）”一词来描述一个既满足IC又满足IR性质的机制。众所周知，VCG对于UM是满足真实性的。近年来，也有工作证明了GSP对VM是满足真实性的。这些研究都集中在只有一类广告主且类别信息是公开的情况下。而在本工作中，我们的目标是为类别信息私有的混合广告主设计一个满足真实性的机制，同时使拍卖的整体福利最大化。在这里，混合广告主可以是UM也可以是VM。

值得注意的是，经典的社会福利概念，即所有广告主的效用和卖方的收入之和，对于VM来说并不是一个可行的定义，因为在社会福利的计算中，广告主和卖方之间的交易金额不能恰好抵消（这一点与UM不同）。因此，我们从此前针对预算约束的广告主的机制设计的文献[4,6]中借鉴了可变现社会福利（Liquid Social Welfare，LSW）的概念：

定义6（可变现社会福利，LSW）：一个机制中的分配结果的可变现社会福利是所有广告主对该分配结果的最大付费意愿之和，即。

我们定义可变现社会福利的比较基准为所有可能分配中的最大LSW，即。此外，由于我们在这项工作中主要关注满足真实性的机制，所以在当上下文清楚时我们将不再区分和。

三、公开类别信息

首先，我们考虑一个简单的设定，即广告主的类别是公开的。在这种情况下，该问题属于单参数机制设计的范畴，相对比较简单，但对于理解后面章节中我们设计的机制很帮助。针对这种简单情况，我们提出了以下针对公开类别信息的广告拍卖机制（Mechanism for bidders with PUblic classes，MPU）。

机制1（MPU）：

分配：按价值对广告主进行排名，并相应地从上到下分配坑位。
付款：对于每个分配到坑位的广告主，令为下一个坑位的广告主，即。
- 如果是一个UM，那么
- 如果是一个VM，那么。

直观地说，MPU直接按价值将坑位分配给广告主，而不考虑其类别。此外，UM的扣费遵循VCG，VM的扣费遵循GSP（注意我们使用自下而上的坑位索引）。我们接下来表明，这个机制是IC、IR和稳健的，同时也保证了最佳的LSW。

定理1：当广告主的类别是公开信息时，MPU满足IC、IR和稳健性，同时是LSW最优的。

参考此前基于UM模型和VM模型的文献，定理1的证明是直接的，因此这里将证明省略。

四、私有类别信息

在上一节中，我们提出了针对公开类别的混合广告主的最优机制。然而，当类别信息是私有的时候，这个问题就变成了一个多参数的机制设计问题，这在一般情况下很难解决。我们可以首先分析MPU在私有类别的设定下是否满足IC性质。我们可以很容易地观察到，如果一个VM把他的类别虚报为UM，同时如实地报告他的价值，他有可能会享受到更低的扣费同时不改变他的分配。换句话说，MPU在某种意义上对VM是不公平的，而这种不公平可能在类别信息是私有的情况下带来策略性操纵的可能性。

4.1 针对私有类别混合广告主的机制设计

上述分析意味着，在一个私有类别设定下的真实机制中，广告主的扣费应该只依赖于他被分配的位置，而不是他的类别。换句话说，假设一个广告主在两种情况下被分配到一个相同的坑位，而其他人的分配结果也是相同的，那么无论他是UM还是VM，扣费都应该是一样的。这一要求促使我们基于坑位设计扣费规则，而非基于广告主类别设计扣费规则，这一规则应当基于该坑位下方的广告主的类型，同时应当结合VCG和GSP。因此，我们提出将一个坑位的价格设定为以下两个条件的最大值：1）从下方最近的UM推导得出的VCG式扣费，以及2）从下方最近的VM推导得出的GSP式扣费。具体来说，对于一个坑位，令下方最近的VM为，位于，而最近的下方的UM是，位于，那么，我们设定获得坑位的扣费为：

其中，

当没有低于坑位的VM或UM时，我们将相应的扣费项定为0。基于这一扣费规则，我们提出了混合广告主机制（MPR），它是IC、IR和稳健的，同时在LSW上达到了理想的近似比。

图一 MRP机制算法流程

MPR的完整伪代码在图一中给出。MPR的关键思想是用所有的VM来填充坑位，然后迭代地给一个UM分配一个具有最优效用的坑位。在图一中，MPR首先根据广告主的价值对其进行排序，并获得价值排名前名的广告主的集合 (第2-3行)。然后将价值第高的广告主分配到索引为0的坑位，作为定价的基础（第4行）。我们把中所有的UM集合表示为，把中所有的VM集合表示为（第5-6行）。接下来，MPR将中的所有VM根据它们的值依次填充到最低坑位（第7-9行）。然后，我们基于分配的VM，按照公式一计算以下坑位的价格（第10行）。事实上，由于在这一步中中的UM在这一步没有一个被分配到坑位，所以的项被设置为。因此，价格计算可以简化为GSP支付规则。在计算每个坑位的价格后，我们接着确定UM的分配。当前尚未分配的UM中价值最低的广告主被选中，我们为他选择最优坑位，也就是具有最高效用值的坑位（如果存在并列的情况，则选择较低的那个坑位）（第12-14行）。值得注意的是，有两种坑位可能被选择：1) ，即在所有被分配的广告主之上的位置（注意在第一轮的时候，且将在这个过程中被持续更新为所有未分配的UM的集合）；2) ，即一个现有广告主所占据的位置。在前一种选择中，我们只需要将这个位置分配给到；在后一种选择中，我们首先将所有在位置和在该位置以上的广告主上移一个坑位，然后将该坑位分配给 (第15-18行)。接下来，价格上面的坑位将根据新插入的UM的价值进行更新（第19行）。然后，该UM 被从中删除，然后重复这个过程，直到所有UM在中的所有UM都被分配了一个位置（第20行）。最后，如果一个广告主被分配到了坑位，他的点击扣费将是该坑位对应的价格；否则，他的付费将是0（第21行）。

接下来，我们提供一个例子来说明MPR的运行过程。我们可以从这个例子中观察到一个有趣的结果：出价较低的VM可能比出价较高的UM获得更高的坑位。

图二（左边）例1中的示例，（右边）分配结果与价格

例1：假设有四个位置和五个广告主，他们的CTR和类别信息如图二（左边）所示。在MPR中，我们首先将具有第五最高价值的广告主，即广告主A，放在虚拟坑位0上。然后，其余的VM，也就是B和C，被放置在坑位1和2上。因此，我们可以计算出1，2，3号坑位对应的价格，即。有了这些价格，我们就可以得到广告主D在坑位1，2，3分别对应的效用：0.3，0.4，0.3。然后，最优的坑位，也就是坑位被分配给他，而广告主C则被移至坑位3。接下来，坑位3和坑位4的价格通过公式一被更新为，。接着，我们得到广告主E在坑位1，2，3，4分别对应的效用：0.4，0.6，0.7和0.8。因此，坑位4被分配给了广告E，最终分配结果如图二（右边）所示，广告主点击价格由其获得的坑位的相应价格给出。

4.2 理论性质

在证明MPR的理论性质之前，我们首先定义两个坑位的_边际扣费增加值_的概念，以衡量广告主获得更高坑位时的成本表现。基于这个概念，我们提出几个引理来帮助理解MPR背后的思想，这些引理将对IC和IR的证明有帮助。

定义7： 对于两个坑位，边际扣费增加值定义为：

ã€‚

基于边际扣费增加值的定义，我们证明以下引理。由于篇幅原因，我们将证明过程略去。

引理1： 如果一个UM被分配到一个坑位，我们有。

引理2： 对于两个广告主和，如果且，即他们都是UM或都是VM，那么我们有。

引理3： 对于两个广告主和，如果广告主是一个VM，而是UM，并且，那么我们有。

引理4： 如果一个UM 被分配到一个坑位，那么我们有。

基于以上这些引理，我们证明以下定理，作为本工作的主要结果。由于篇幅原因，我们将证明过程略去。

定理2：MPR是一个稳健的机制。

定理3：MPR满足个体理性。

定理4：MPR满足激励相容性。

定理5：MPR在LSW上可以实现不超过2的近似比，即：。

定理6：没有任何一种IC、IR且稳健的机制可以实现低于的近似比。

五、结论

本文中，我们研究了UM和VM混合的广告环境中的机制设计问题，并提出了两种机制MPU和MPR，分别在类别信息公共和私有的情况下能够保证IC、IR、稳健性和（近似）最优LSW。这项工作为后续关于投资回报率约束广告主的研究提供了启发，同时也产生了一些开放性问题。其中最主要的开放性问题是如何缩小近似比的下界和上界之间的差距。我们猜想MPR在某种程度上是解决这个问题的最优机制，在后续的研究中我们希望能严格证明这一点。此外，我们将对这一机制进行推广，使之能够适用于多种类型投资回报率约束的广告主。

▐ 参考文献

[1] Edelman, B.; Ostrovsky, M.; and Schwarz, M. 2007. Internet advertising and the generalized second-price auction: Selling billions of dollars worth of keywords. American economic review, 97(1): 242–259.

[2] Varian, H. R. 2007. Position auctions. International Journal of Industrial Organization, 25(6): 1163–1178.

[3] Wilkens, C. A.; Cavallo, R.; and Niazadeh, R. 2017. GSP: the cinderella of mechanism design. In Proceedings of the 26th International Conference on World Wide Web, 25–32.

[4] Deng, Y.; Mao, J.; Mirrokni, V.; and Zuo, S. 2021. Towards Efficient Auctions in an Auto-bidding World. In Proceedings of the Web Conference 2021, 3965–3973.

[5] Balseiro, S.; Deng, Y.; Mao, J.; Mirrokni, V.; and Zuo, S. 2021. The Landscape of Auto-Bidding Auctions: Value Versus Utility Maximization. In Proceedings of the 22nd ACM Conference on Economics and Computation, 132–133.

[6] Dobzinski, S.; and Paes Leme, P. 2014. Efficiency guarantees in auctions with budgets. In International Colloquium on Automata, Languages, and Programming, 392–404.

关于我们：阿里妈妈智能广告算法团队，超⼤业务体量和丰富的商业化场景使我们在深度学习、强化学习、机制设计、自动出价等技术方向极速成⻓并积累丰富，期待与高校师生及业界同行一起交流探讨，也欢迎加入我们（暑假实习生/研究生实习生/高校AIR计划合作/访问学者等）。

联系邮箱：alimama_tech@service.alibaba.com （投递简历请注明-智能广告算法团队）

END