关于“智能出价“的一些探索和实践

news2024/11/15 22:21:42

背景

在移动数字广告营销的整个链路中,主要有三个主体,分别是媒体、adx和dsp.对于一个adx系统,主要有两个功能,分别是:

  1. 向下对接媒体:汇聚下游的媒体广告流量

  1. 向上对接dsp(广告主):将媒体流量卖给上游dsp(或广告主),获取收入。

adx作为一个流量汇聚平台,一方面从广告主那里获取广告投放收入,一方面使用媒体侧的广告位流量,需要支付费用给媒体。这一收入、一支出是adx营收的主要方式,并以此获取利润。

而智能出价系统主要解决的问题就是:如何在收入和支出之间,保证毛利额最大化的问题?在这个问题中,一般来说,收入侧就是通过rta(实时竞价系统)以一价或二价方式和dsp进行成交的价格,但今天所研究的问题是平台成交价已知(或确定)的情况;那就引出另外一个问题,就是在收入确认的情况下,如何规划支出,才能保证毛利额的最大化,因为:

毛利额= 平台成交价 - 媒体成交价

但是在实际的业务场景中,毛利额并不是这么简单的减法问题,因为这里面还涉及到曝光率的问题,具体来说涉及两个问题:

  1. 给媒体出低价:毛利额高,但是曝光率低(广告不曝光,就拿不到收入)

  1. 给媒体出高价:曝光率高,但是毛利额低。

所以在给媒体出价这个问题上,存在一个平衡,今天所说的“智能出价”,指的就是给媒体的出价,以达到我们的毛利额最大的效果,同时解放运营同事,提高他们的运营效率。

基础模型

由上述背景所述可知,毛利额的计算方式是简单的减法运算,平台成交价减去媒体成交价,但是我们又知道,广告如果不曝光,广告主是不会给我们支付费用的,所以如果仅仅从平台成交价和媒体出价两方面来考虑问题是不全面的,我们还要涉及到曝光率的问题。一般来说,我们可以根据曝光率来计算一条广告可能带来的毛利收入(期望最大化),具体的计算方式如下:

价值函数= max( (平台成交价 - 媒体成交价) * 曝光率 )

这个函数所要表达的意思是:

  1. 曝光率:针对历史数据,计算每一个出价(精确到个位数)的曝光率(可使用实时计算系统进行统计)

  1. 媒体成交价:针对历史数据,计算每一个出价(精确到个位数)在媒体侧的成交价

  1. (平台成交价 - 媒体成交价):实际毛利额

  1. (平台成交价 - 媒体成交价) * 曝光率:可以理解为毛利额的期望,当然此处的期望和数学上的期望有一定的差别。

上面这个价值函数就是最终出价的一个标准,哪个出价算出来的价值函数最大,就出那个价格。

初版开发

算法侧:以平台和广告位维度,使用实时计算系统flink计算过去两分钟内每个出价的曝光数α、未曝光数β、媒体侧平均成交价γ。形成如下的数据结构存储到redis集群:

key:平台_广告位

value:出价1:α,β,γ|出价2:α,β,γ|出价3:α,β,γ|出价4:α,β,γ|出价5:α,β,γ|...

服务侧:针对平台+广告位,从redis里面取出对应的value值,计算每一个出价的价值函数,取价值函数最大的出价作为最终给媒体的出价,我们的价值函数如下:

价值函数= max( (平台成交价 - 媒体成交价) * 曝光率 )

平台成交价:已知

媒体平均成交价:γ

曝光率:α / (α +β)

缺点:经过在线上实际业务场景中的实践发现,此类算法更容易倾向于给媒体出低价来获取更高的毛利额,原因在于我们的价值函数(毛利额 = 平台成交价 - 媒体成交价),当我们出低价的情况下,毛利额能最大化。但是这里面显然涉及另外一个问题,就是出价低毛利额大,但是在媒体侧的曝光率会受到影响,这样我们根本拿不到一定的曝光规模,这也就是我最开始说的,低出价情况下毛利额高但是曝光率低的问题。为了解决这个问题,我们需要修改初始目标,将实现业务毛利额最大化改为在实现规模扩充的基础上的毛利额最大化。

后续改进方式:增加平台+广告位的底价调整系数,一来防止出价过低拿不到曝光,而来可以根据底价调整系数来动态调整最低的出价,达到毛利额最大化的目的。具体实施方案见下一章节。

底价调整系数

在上一章节中,我们提到为了解决总是给媒体出低价而拿不到曝光规模的问题,提出了增加”底价调整系数”的方案。这里所说的“底价调整系数”的实际含义其实就是最低出价的一个系数,比如:

如果我们的系数设置的是0.5,平台成交价是100元的话,我最低给媒体的出价是 100*0.5 = 50元,也就是说,50元以下的出价我不再考虑,针对价值函数,只计算50~100元之间最大的值,这样我们就尽量减少出低价,以此来提升我们的曝光率(也就是曝光规模)。

为了找到最好的底价调整系数,我们需要动态的调整底价系数,具体的实施方案如下:

实施策略:默认广告位-平台维度的底价系数为0.5,在策略启动时,优先使用0.5和0.6进行比较,若0.5比0.6更优(比较策略见定时任务),说明系数低的比较好,则比较0.4和0.5;若0.6更优,说明系数高的比较好,则比较0.6和0.7的效果;即每比较一次都会踢出效果较差的,若是系数数值比较低的最优,则后续对比值-0.1,若系数值高的最优,则后续对比值+0.1

定时任务:每小时计算该系数对应平台-广告位的媒体下发数,以及A\B两个系数下”曝光率提升比例”及”千次下发毛利的提升比例”,对比方式为:

1、当下发数 > 阈值(可配置)

-- 若A相对于B的曝光率提升比例及千次下发毛利提升比例都为正,则A比B好,否则B比A好

-- 若A相对于B,曝光率提升为正,千次下发毛利提升为负,则计算A曝光率提升比例/B千次下发毛利提 升比例>= 1,则A比B好,否则B比A好

2、当下发数 < 阈值

不做任何操作,继续累计,直到累计数大于阈值为止

媒体出价区间:【MAX(max(媒体底价,最小媒体出价),min(平台成交价*返点*调整系数,最大媒体出价*调整系数)),MIN(平台成交价*返点,最大媒体出价)】

缺点:经过在线上实际业务场景中的实践发现,通过不断动态调整出价系数,线上会出现系数极端现象,当系数出现在0.8和0.9之间且一直是0.9系数曝光率和千次响应毛利表现较好时,系数则一直保持在0.8和0.9之间,此时若平台侧成交价较高,媒体侧出价也会变高,但出高价并未能影响到曝光率提升,反而毛利率下降明显(在媒体侧出60和出40对应的曝光率差不多,为何不出40?)

下一步优化策略:

1、还是要想办法去掉底价系数这个参数,根据实际的情况,让算法自动调节出价。

2、从当前进度看,此版本的千次下发毛利额的效果是最好的,因历史原因,此版本定义为V5版本,以后所有版本的演进效果,都以此版本为对照,以效果超过V5版本为目标。

3、之前计算曝光率的α,β值都是根据实际情况的曝光量和未曝光量累计得到的,通过实际的数据来看,不同的出价的曝光率出现参差不齐的现象,有可能高价的曝光率低于低价的曝光率,为了解决这个问题,我们针对曝光率的计算算法进行了改进,使之从理论上呈现出来一种递增效果,即:出价越高,曝光率越高。

曝光率优化

之前的曝光率是单点激励惩罚的机制进行更新,所谓单点激励惩罚指的是如果某个出价的情况下,广告曝光或者未曝光,只更新该出价的α,β值,但是经过进一步的思考认为,可以使用区间激励惩罚的机制进行更新,所谓的区间激励惩罚指的是,某个出价的情况下,广告曝光或者未曝光,不仅仅更新该出价的α,β值,对其他出价的α,β也做相应的惩罚和激励。

区间激励惩罚--第一次演进

在该次演进中,主要针对两种情况进行区间激励惩罚

情况1:如果某个出价未曝光,则小于这个出价的所有出价的β都进行更新:β + 1;而大于该出价的所有出价不进行更新。

情况2:如果某个出价曝光,则大于这个出价的所有出价的α都进行更新:α + 1;而小于该出价的所有出价不进行更新。

优点:解决了之前使之从理论上呈现出来一种递增效果,即:出价越高,曝光率越高。

缺点:使用这种更新方式,在高价部分的曝光率会出现一样的情况(如下图),导致算法给出的价格比V5版本低的情况,为了解决这个问题,我们对区间激励惩罚机制进行了二次演进。

区间激励惩罚--第二次演进

为了解决第一次演进过程中,在高价部分曝光率一样的问题,进过进一步的思考和优化,认为在进行区间激励惩罚的过程中,针对不同的出价的激励惩罚程度应该是不一样的,具体来说,还是分为两种情况:

1、出价曝光的情况

(1)、高于该出价的出价:应该也会曝光,所以更新方式和第一次演进应该是一样的,即α + 1

(2)、低于该出价的出价:在第一次演进版本中,未对该部分进行更新。但是经过分析认为,如果当前价格曝光,则出价低于当前价格时,应该也有曝光的机会,所以对这一部分的出价,也应该给予一定的激励和惩罚,激励惩罚方式为:价格越低,α 更新越少,β更新越多,但总体α + β = 1

2、出价未曝光的情况

(1)、低于该出价的出价:应该也不会曝光,所以更新方式和第一次演进应该是一样的,即β + 1

(2)、高于该出价的出价:在第一次演进版本中,未对该部分进行更新。但是经过分析认为,如果当前价格未曝光,但出价高于当前价格时,应该有曝光的机会,所以对这一部分的出价,也应该给予一定的激励和惩罚,激励惩罚方式为:价格越高,α 更新越多,β更新越少,但α + β = 1

3、α,β更新方式

针对新的α,β更新方式,确定了两种形式,一种是对数函数的方式,一种是等比例方式。

更新方式

当前价格(curprice)曝光,价格(price)低于当前价格

当前价格(curprice)曝光,价格(price)高于当前价格

当前价格(curprice)未曝光,价格(price)低于当前价格

当前价格(curprice)未曝光,价格(price)高于当前价格

等比例更新

up=(curprice - price)/(curprice - 1)

α + (1 - up)

β + up

α + 1

β不变

β + 1

α 不变

up=(price - curprice)/(100- curprice)

α + up

β + (1-up)

对数更新

up=Math.log(curprice - price)/Math.log(curprice - 1)

α + (1 - up)

β + up

α + 1

β不变

β + 1

α 不变

up=Math.log(price - curprice)/Math.log(100- curprice)

α + up

β + (1-up)

备注:curprice:当前出价 ; price:要计算α,β的出价 ; Math.log进行对数运算

经过模拟试验,这两种更新方式的最终的曝光率效果如下:

4、优点

解决了第一次曝光率演进过程中出现的高价部分曝光率未区分开的问题,使用这种针对不同出价进行不同程度的激励惩罚方式,再结合下一章中毛利额优化之后的函数,可以较好的解决高价出不上去的问题。

毛利额函数优化

为了便于描述,这里将价值函数再列一下:

价值函数= max( (平台成交价 - 媒体成交价) * 曝光率 )

可以看到在这个函数中,在计算价值函数的时,毛利额直接使用的是“平台成交价 - 媒体成交价”,用这种计算方式进行计算,有两个问题:

(1)、对于不同的媒体成交价(给媒体的出价),他们的毛利额比值过大。

举个简单的例子,当平台成交价是100元时,出价10元,毛利额是90;出价90元,毛利额是10元,毛利额之间的差距是9倍,如果想要用90元进行出价,则90元的曝光率必须是10元的9倍,而这种程度的比例在曝光率中是很难拉回来的。

(2)、曝光率和毛利额的单位不对等的问题:曝光率的值始终是在0~1之间,而毛利额的值在0~100之间。

为了解决上述两个问题,想到一个解决办法,针对毛利额进行归一化处理,将毛利额也归一到0~1之间,同时缩小不同出价的毛利额之间的比例,使用对数函数的方式进行归一化处理,归一化函数如下:

使用这种方式,就将之前的价值和函数变为:

价值函数= max( 归一化毛利额 * 曝光率 )

本地模拟程序构建

为了在上线之前看到实际的演进效果,在本地构建智能出价的模拟程序,目的有三:

1、针对提出的演进方式,进行本地模拟,观察曝光率及毛利额的最终效果是否如预期

2、观察出价能力能否赶上V5版本

3、本地模拟,减少不必要的上线流程,快速看到效果。

模拟效果:

经过多次模拟,线上运行之后的曝光率和本地模拟的情况完全一致,解决了不必通过上线,在本地模拟进行初步判断的方式,减少了或者避免了不必要的上线流程。

平台成交价分区间

通过上述方式的演进过程,在实际的在线测试中,出价能力总是稍逊于V5版本。举一个简单的例子,当平台成交价是10元的情况下,v5版本的出价维持在6元和7元,而我们的演进版本中,出价总是低于6元,为了了解具体原因进行了深入分析,这其中有两个主要的原因。

原因1:返点的问题

在实际的结算过程中,针对不同的DSP平台和广告位,我们会有不同的返点给予平台,在我们上述进行毛利额计算的情况下,是直接用平台成交价进行计算的:“平台成交价 - 媒体成交价”,但是实际上我们的毛利额应该是“平台成交价 * 返点系数 - 媒体成交价”,所以我们再次对价值函数进行了修正,如下:

价值函数= max( 归一化毛利额 * 曝光率 )

说明:在对数函数中+2的原因是,如果平台成交价10元,返点系数0.7的情况下,对数函数的底是7,value值是(7-媒体成交价),在这种情况下,当出价是6元或者7元的情况下,归一化毛利额分别是0和负无穷,这种情况下,我们永远出不到6元和7元的价格,所以+2进行了一下修正。

原因2:用总体的曝光率掩盖了不同平台成交价曝光率的差异

到目前为止,针对同一平台和广告位,所使用的曝光率是总体情况的曝光率,什么意思呢?比如出价10元的曝光率是所有平台成交价在出10元情况下的曝光数据的累积数据。但是在实际情况下,平台成交价是20元和100元的情况下,出价10元的曝光率应该是不一样的,我们犯了一个用总体掩盖了个体特性的错误。

为了解决这个问题,我们针对不同的平台成交价,计算不同平台成交价下不同出价的曝光率,解决前后的曝光率计算方式如下所示:

解决前:

解决后:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/196051.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【C语言】看了这篇文章,如果你还不会文件操作的话,我把这篇文章给吃了(doge)

&#x1f6a9;write in front&#x1f6a9; &#x1f50e;大家好&#xff0c;我是謓泽&#xff0c;希望你看完之后&#xff0c;能对你有所帮助&#xff0c;不足请指正&#xff01;共同学习交流&#x1f50e; &#x1f3c5;2021年度博客之星物联网与嵌入式开发TOP5&#xff5…

MyBatis注解CRUD执行流程剖析

MyBatis Study Notes Day03 结果映射ResultMap 引入resultMap–MyBatis中最强大的元素 数据库字段名&#xff1a;&#xff1a; 实体类字段名&#xff1a; public class User {private int id;private String name;private String password;如上所示&#xff0c;当sql的字段…

动态规划详解(1)——基础概念

动态规划是数学、编程中一个重要的算法动态规划&#xff08;Dynamic Programming&#xff0c;DP&#xff09;是运筹学的一个分支&#xff0c;是求解决策过程最优化的过程。20世纪50年代初&#xff0c;美国数学家贝尔曼&#xff08;R.Bellman&#xff09;等人在研究多阶段决策过…

Java——根据身高重建队列

题目链接 leetcode在线oj题——根据身高重建队列 题目描述 假设有打乱顺序的一群人站成一个队列&#xff0c;数组 people 表示队列中一些人的属性&#xff08;不一定按顺序&#xff09;。每个 people[i] [hi, ki] 表示第 i 个人的身高为 hi &#xff0c;前面 正好 有 ki 个…

Spring AOP表达式(execution)规则——排除切点的应用

背景 需要项目原切面的基础上排除一些类中方法。 本篇文章主要介绍了SpringBoot AOP Pointcut切入点表达式&#xff0c;以及如何排除某些类中的方法的方式。 execution(* com.winup.web.controller..*.*(..)) 参数说明 符号含义execution&#xff08;&#xff09;表达式的…

【C++之类和对象】默认成员函数

目录前言一、默认成员函数二、构造函数三、析构函数四、拷贝构造函数五、赋值运算符重载前言 前面我们学习了一些类和对象的基本知识&#xff0c;知道了什么是类&#xff0c;类中包括什么东西&#xff0c;以及能够使用一个类来实例化对象&#xff0c;并且会计算类对象的大小。这…

Java Collection 接口下的 “ List 集合” 与 “ Set 集合 ”

Java Collection接口下的“ List 集合” 与 “ Set 集合 ” 每博一文案 一个人最好的底牌&#xff0c;就这两个字: 靠谱,是最高级的聪明。 师父说&#xff1a;人生一回&#xff0c;道义一场&#xff0c;你对人对事的态度&#xff0c;藏着你一生的福报。 千金难买好人缘&#x…

SpringBoot(三):日志文件

目录一、日志文件1.1 日志文件的作用1.2 Spring Boot内置了日志框架1.3 日志的格式说明1.4 自定义日志打印1.5 日志的持久化1.6 日志的级别1.6.1 日志级别有什么作用1.6.2 日志的级别划分1.6.3 日志级别的设置1.7 使用lombok输出日志1.7.1 lombok的原理1.7.2 lombok其他注解一、…

在JS文件中使用或扩展已有的vue文件

工作中遇到一个给现有项目增加一个超时重新登录的提醒框&#xff08;可在提醒框中直接登录本账户&#xff09;。 由于页面稍微复杂&#xff0c;本人又是脚手架一把梭过来的&#xff0c;对于直接使用 js 来完成一整个复杂还带逻辑的页面稍显吃力&#xff0c;所以决定先写一个 vu…

建模助手【有求必应】的正确打开方式

今天的话题主要想解除大家对[有求必应] 的一些误解。 因为在日常的反馈中用户似乎对于[提需求] 这玩意儿无论是从概念上还是动作上都很不 “熟悉”。 其实我们对软件认知的上限是一个软件功能的上限&#xff0c;产品以及行业的发展都要从打破固有认知开始。 期待更多的你们跳出…

《新华日报·科技周刊》聚焦蓝海彤翔与《流浪地球2》

瞄准世界科技前沿瞄准江苏科技创新瞄准日常科技生活《新华日报科技周刊》第203期聚焦《流浪地球2》中的大国重器其实就在我们身边重点报道了蓝海创意云渲染农场为《流浪地球2》提供了云计算渲染服务的重要成果“数字生命计划”就是元宇宙吗&#xff1f;电影中人类面临末日危机&…

0基础如何入门人工智能?

1.1 概念 根据维基百科的解释&#xff0c;人工智能是被机器展示的智力&#xff0c;与人类和其他动物的自然智能相反&#xff0c;在计算机科学中 AI 研究被定义为 “代理人软件程序”&#xff1a;任何能够感受周围环境并且能最大化它成功机会的设备。 1.2 重大事件 2016 年 3…

[Java]JavaWeb学习笔记(尚硅谷2020旧版)

文章目录&#x1f3c0; 视频及资料地址&#x1f3c0; XML⚽ XML 简介&#x1f3d0; xml 的作用⚽ XML 语法&#x1f3d0; 文档声明&#x1f3d0; 注释&#x1f3d0; 元素(标签)⚾ XML 命名规则⚾ xml 中的元素(标签)也分单双标签&#x1f3d0; xml 元素属性&#x1f3d0; 语法规…

PHP控制反转和依赖注入的理解(通俗易懂)

目录 1.IoC是什么 2.IoC能做什么 3.IoC和DI 4.IoC(控制反转) 5.DI(依赖注入) 6.我对IoC(控制反转)和DI(依赖注入)的理解 学习PHP各个框架的过程中&#xff0c;都会听过IoC(控制反转) 、DI(依赖注入)这两个概念&#xff0c;总觉得IoC 、DI这两个概念是模糊不清的&#xff…

WINSOFT JSEngine Delphi 6-D11

WINSOFT JSEngine Delphi 6-D11 WinsoftJSEngine被认为是一个海豚引擎&#xff0c;包括一个强大的JavaScript引擎。 Winsoft JSEngine的功能和特点&#xff1a; Microsoft ChakraCore JavaScript强大的引擎实用程序 支持32位和64位窗口 提供给海豚版本6 Eli 10.1和Lazarus 为产…

29岁,从餐饮到网络安全,大龄转行逆袭成功

大龄转行&#xff0c;一直在网络上备受讨论。 从学习能力、试错成本来考虑&#xff0c;转行一定是越早越好&#xff0c;而大龄转行风险极大。 大龄转行&#xff0c;固然并非一条绝路&#xff0c;苏老泉&#xff0c;二十七&#xff0c;始发愤&#xff0c;读书籍&#xff0c;有的…

C++学习记录——사 类和对象(1)

文章目录1、面向对象和面向过程的初步理解2、类的引入3、类的定义4、类的访问限定符及封装1、访问限定符2、封装5.类的实例化6、类对象模型7、this1、this指针2、空指针问题3、C语言和C简单对比1、面向对象和面向过程的初步理解 C语言是一个面向过程的语言&#xff0c;C是一个…

美颜sdk人脸识别代码技术分析

很多人问过小编&#xff0c;什么样的美颜sdk才算好&#xff1f;对于这个问题&#xff0c;小编认为至少要符合以下几个特点。 1、稳定性强&#xff1b;2、识别精准&#xff1b;3、功能多样&#xff1b;4、集成容易&#xff1b;5、离线使用&#xff1b;6、支持多端&#xff1b;7、…

新手入门,深入解析 python lambda表达式

lambda 表达式是 Python 中的匿名函数。它接受任意数量的参数&#xff0c;并返回一个单个表达式的值。它的语法格式如下&#xff1a; lambda arguments: expression 文章目录lambda 函数原型解释lambda 函数用作其它参数lambda 函数高级的技巧多个参数返回多个值条件表达式嵌套…

java基础巩固-宇宙第一AiYWM:为了维持生计,编程语言番外篇之机器学习(项目预测模块总结:线性回归算法、逻辑回归分类算法)~整起

机器学习一、机器学习常见算法&#xff08;未完待续...&#xff09;1.算法一&#xff1a;线性回归算法&#xff1a;找一条完美的直线&#xff0c;完美拟合所有的点&#xff0c;使得直线与点的误差最小2.算法二&#xff1a;逻辑回归分类算法3.算法三&#xff1a;贝叶斯分类算法4…