本文是博客《汤普森采样(Thompson sampling):理论支持》得附录,进一步理解直观理解Beta分布。
1、曝光(α+β)比较大,且点击(α)比较好的情况,可见现在返回的值大部分在0.8左右。
2、曝光(α+β)比较大,且点击(α)比较小的情况,点击比较差的情况,返回值大多在0.2左右
3、曝光(α+β)比较小,需要探索的情况,返回的概率具有跳跃性,没有放弃还很大机会播放出去。
4、线上基本情况,实际情况基本是这样
https://statdist.ksmzn.com/