RTB场景广告保留价综述

293 阅读5分钟

这篇文章是最近关于RTB场景广告保留价调研的一些汇总。 相关paper记录在 github.com/linpingta/A…

为什么需要保留价?

保留价其实是一个publisher角度的概念,通过设置保留价,当广告出价低于保留价时,不再展示广告。说直白点,就是避免广告贱卖。

一个直观想法是,既然设置保留价可能导致广告机会浪费,那么干脆别设置保留价了,一分钱也是钱嘛。但问题是,如果不设置保留价有两个问题:

(1)按照二价的计费机制,如果某个广告位只有一个广告竞得,那么是不应该收这个广告主钱的,相当于被广告主白嫖

(2)不设置保留价,广告主较低的出价通常意味着广告质量较差(较低的ctr/cvr),展示这样的广告对用户体验有影响,通常app会控制总体的adload,那么展示低价值广告相当于浪费了一部分展现机会

据我了解,一般app都会设置保留价,而且通常是从第2个原因出发更多一些,保证用户体验。

保留价问题特点

保留价问题是一个典型的trade-off问题,即使不考虑用户体验因素,单纯考虑收入,如果设置了太高的保留价,因为ad的win rate下降,会导致收入下降,反过来说,如果设置了太低的保留价,虽然win rate得到保证,但会被dsp捋羊毛。

revenue = v * P(bid>v)
revenue = v * (1 - P(bid<=v))
revenue = max (v * (1-P(bid<=v))

这里v是设置的保留价,P(bid>v)表示广告主出价大于保留价的概率,上面公式里要max revenue,对v求导,可以得到

v = (1-F(v)) / f(v)

广告系列(九)- 动态保留价 有一个从拍卖机制角度的推导,不过我感觉还是上面的推导更好理解一些。

RTB场景保留价

其实基本思路是一致的,但非要说两点不同(第二点比较勉强):

  1. 上面求v的前提是对bid landscape有完全的了解,但rtb场景下,dsp的bid landscape其实是不断变化的,这里如何建模是相比非rtb场景最大的挑战
  2. rtb场景并不是特别关于用户体验,如上所说,即使不为优化收入,单纯为保证用户体验,app也有动机设置保留价。rtb的保留价通常是adx设置的,adx的流量很可能不是自己的,所以它不一定关心用户体验。

paper综述

首先先说明一点,rtb和自有广告的联合竞价建模不在这里,这块感觉前几年应该是一个比较重点的方向。

Display Advertising with Real-Time Bidding (RTB) and Behavioural Targeting

这个其实不只是保留价,涉及rtb的挺多方面,保留价部分在它的第6个section。

This optimisation problem has been previously studied in the context of sponsored search 这一段是说,保留价问题在非rtb场景已经有了研究,那现在问题diff在哪里呢,文章中主要提到了两点:

  1. dsp的行为对publisher来讲是个黑盒,bid会受到如budget,time等很多
  2. 保留价如果过高,可能会吓跑dsp,因此这里不仅是策略问题,还是业务问题

Optimal auction theory这一段和上面保留价求导计算部分基本一致,难点还是在于估计bidder value function上,A few drawbacks were reported mostly due to the difficulty of learning bidders’ private values, i.e., F(x). Firstly, a bidder could have a complex private value distribution which does not follow Log-normal 同样是和search广告对比,搜索广告里,publisher知道广告主的所有出价行为;同时publisher是给keyword设置底价(rtb场景,粒度更细,是imp级别)

An Empirical Study of Reserve Price Optimisation in Real-time Bidding

这是14年的paper,一晃都10年了,这里的内容和上面很像,因为作者都是一个人。bidder value function预估部分就不说了,但它总结了保留价设置的一些方法,把它分为Private Value Free Algorithms和Private Value Based Algorithms,区别是是否需要对bidder function的形式进行假设。

对于Private Value Based Algorithm,作者假设bidder属于对数正态分布或者均匀分布进行建模,Private Value Free Algorithms的方法就比较多了,能想象到的比如设置一个fix price,或者根据过去一段时间的dsp出价做平均,还有one-shot类似反馈机制的做法。

最终作者分析觉得还是Private Value Free Algorithms比较靠谱,这事应该是因为建模的方法本身不够靠谱。

Real-Time Optimization Of A Web Publisher RTB Revenue

alephd应该是法国的一个rtb公司,它这篇文章的point:一般保留价会以天/周级别change,这里做的事情是去实时预测每个auction的最优保留价。

不过实话说,这个文章也可能是我看的不够懂,感觉里面缺少很多细节,比如里面提到的对比方法:PL RES: setting an optimal reserve price per placement determined on the training set (using uncensored bid values) == 我理解是根据每个plc历史的出价,来决定如何设置底价 == 问题是,bid req发过去的时候,你怎么知道dsp会出哪个plc呢?

不过话说回来,这点也可以理解,毕竟公司不是学校,赚钱的策略也不会往外发。有价值的一点可能是它的思路,把floor price分成桶,然后预测当前bid应该设置成哪个桶得到最优结果