推荐系统学习系列 8 : Pacing广告系统出价竞价机制发展综述

1,086 阅读27分钟

最近正好有个相关工作,正好梳理一下,水一篇blog。

广告出价方式发展

广告出价方式转变主要是经历了以下三个阶段:

image.png

(图片来源阿里云)

第一阶段:手动出价

CPA/CPS

Cost per Action/Cost per Sales,按广告投放实际效果或实际销售产品数量计费,它们的区别在于CPA定义的投放效果不一定是产品销售数量,也可能是App激活量、用户销售线索回收量等等,缺点是无法控制最终结果。

CPT

Cost per Time,按时间付费,例如按天或者包月付费,这种广告付费形式在互联网广告发展的早期,还有媒体平台变现的早期很常见。媒体平台广告产品体系成熟后,虽然CPT会继续存在,但是所占比例会逐渐减小。

CPC

Cost per Click,按点击付费,只有当用户点击广告时才计费,往往和竞价广告相结合。百度搜索推广广告、淘宝直通车广告都采用这种付费方式。

CPM

Cost per Mille / Cost per Thousand Impression,是一种按千次广告曝光付费的结算方式,是针对广告主而言的,指的是广告主为一千次广告曝光付出的成本。CPM=总消费/曝光量 * 1000。举例来说,某广告主一次投放了10万元,曝光1000万次,那这次投放的CPM=10万元/1000万次 * 1000=10元,千次广告曝光付费10元。

第二阶段:智能出价

oCPM

oCPM的英文全称为 Optimized Cost Per 1000 Impressions,是在CPM的基础上,以优化为目标,同时以展示为收费依据的一种计费方式。CPM计费是一种按照展示即收费的广告计费模式,展示了就收费,不必关心广告的转化效果。之所以说oCPM是在CPM基础上演变的一种计费方式,区别在于oCPM将广告的点击率和转化效果计入广告的考核目标。oCPM可以在广告主摸清用户的消费习惯和爱好后,为用户设置广告费用,提高转化率。

1)oCPM的出价依据:广告主根据转化目标设置的转化出价
怎么设置转化出价呢?举个简单例子,假如广告主通过核算,得到一个付费用户的获取成本低于60元就有钱赚,广告主会在内心设置一个付费价格(60元),再根据广告主预估的曝光点击率0.03,预估的点击转化率0.1,预估的下载转化率为0.5,预估的付费率0.1,计算出一个根据转化目标设置的内心cpm出价=600.030.10.50.1*1000=9元。
这个9元就是广告主设置的转化出价,实操中广告主会根据经验价格进行上下浮动来进行测算。

2)oCPM的竞价依据:广告平台根据转化率预估的广告价值
广告平台通过实时预估广告主每次曝光的转化概率,并根据广告主设置的转化出价,在广告主可以接受的转化成本范围进行智能调控出价。
即:oCPM的竞价依据=广告系统的实时出价=平台预估eCPM=bid_price(广告主设置的转化出价)*pCVR(从点击到转化的比例预估)*pCTR(点击率预估)*智能调控因子。
什么是智能调控因子? 这是在传统固定出价的基础上演变的一种精细化匹配方式,由流量广告的日预算消耗情况、转化成本的达成情况等因素共同决定,其目标是平台帮助广告主在预算范围内根据流量质量动态调整出价,获得尽可能多的转化量,同时实际转化成本尽量不超出广告主预期。

3)oCPM的收费依据:按照用户实际曝光进行收费
值得注意的是,真实收费受广告主的出价依据(转化目标)影响,但是不等于出价依据或竞价依据。举个例子,广告按照平台预估eCPM进行竞价,如果广告主设置的bid_price越高,竞价成功性越高。当广告主竞价成功后,如果按照广告的广义第二价格(GSP)收费,真实收费就是这个预估价格的第二价格。

oCPC

oCPC的英文全称为Optimized Cost Per Click,是在CPC的基础上,以优化为目标,同时以点击为收费依据的一种计费方式。同样地,区别于CPC计费,系统会在广告主出价(固定bid)的基础上,基于多维度、实时反馈及历史累积的海量数据,根据预估的转化率以及竞争环境,智能化地调整出价,进而优化广告排序,帮助广告主竞得最合适的流量,降低转化成本。

1)oCPC的出价依据:广告主根据转化目标设置的点击出价
基本原理同oCPM,在此不做赘述。

2)oCPC的竞价依据:广告平台根据转化率预估的广告价值
oCPC的竞价依据=广告系统的实时出价=平台预估eCPM=click_cost(广告主设置的点击出价)*pCVR(从点击到转化的比例预估)*智能调控因子。
从公式可以看出,无论是oCPC还是oCPM的出价模式,绝大多数平台都会将出价根据公式换算eCPM,这样的好处是平台侧可以将商业价值一致化,再在根据平台侧目标(用户体验/平台分发等),将这些价值换算成一个统一的score从而进行流量分发。

3)oCPC的收费依据:按用户实际点击进行收费
尽管在oCPC的出价方式下,广告平台对广告的点击率也可能存在预估动作,但是是否精准对于广告主的费用影响不很大,对比来看,oCPM则完全按照预估ctr后的结果来进行收费,这对平台的预估精准度是一个很大的挑战。

oCPC v.s. oCPM

  • 最根本的区别在于收费点不同和oCPM不同,oCPC是根据点击而扣费,对于仅有曝光而没有点击的广告,广告主无需支付流量费用,理论上对广告主来说肯定更加友好。一般流量比较好的媒体,使用oCPC和oCPM的效果区别不大,但是平台通过oCPM可以将流量分配权掌握在自己手中,所以通常比较成熟的平台更多会使用oCPM来计算。但是有些流量参差不齐的媒体,比如联盟,通常使用oCPC。
  • 对于广告主和广告平台来说,oCPM优化空间更多。 从平台角度来看:oCPC只能以cpa(比如下单、gmv等)作为优化目标,oCPM则多了一个空间,可以按照 ctr 作为优化目标,也可以按照 cvr 作为优化目标,也就是说,平台从曝光到转化上就有非常大的调配空间。从广告主角度来看:oCPM的方式给了广告主很多方向进行参数优化(bid/pCTR/pCVR等),而当广告主不断的优化参数——广告真实的CTR和CVR都会变得更高,这时平台对于广告的预估点击率pCTR和预估转化率pCVR又会受到正向影响而提高,平台计算出来的竞价eCPM就会提高,广告的竞价优势也得到了提升。这种情况下,广告主可以在不调高出价的基础上就拿到了更多的流量,而广告主为了优化参数而改善的创意样式、创意质量等又有机会在其他平台进行复用,对于广告和平台来说,都是1+1>2的事情。
  • 对于广告主来说,oCPM可满足的转化目标更多。 相比较oCPC来说,oCPM可以支持更多不同的转化目标和更复杂的转化类型组合,比如完播、关注、分享等,而这些转化类型的收费方式可能不同,对于复杂度更高的广告平台比如某条,统一用m计费也有利于统一管理,可以进一步丰富平台的广告生态。
  • oCPM的优势更加明显,为什么有些平台仍保留oCPC的出价模式呢? 我们可以从两个方面来思考这个问题。第一是广告形式,国内主流平台比如某度,已经培养了以点击为主的用户行为,以点击为主的广告样式也更加原生,所以oCPC对于这类平台来说更为合理。第二,现在的主流大型平台会以对oCPX进行超成本赔付的方式来保障和广告主间建立起一种更为健康的合作机制。平台在进行赔付时,看到的通常时广告主经过多次竞价后的总成本,无法把具体的赔付进行归因。在oCPM模式中,如果产生了大量的虚假表现,平台数据积累滞后,模型一时间没有反应过来,就会在短期提升平台的作弊收益,提高平台赔付额。而在oCPC的模式下,平台能控制的参数变少,且制造虚假点击的难度也会高于制造虚假曝光,对于一些流量质量参差不齐的平台,会是一种更为科学的出价模式。

第三阶段:自动出价

亚马逊SP广告更新了新的竞价模式:基于规则的竞价。这是亚马逊广告首次出现以广告的最终效果为优化目标,结合机器学习自动优化广告的新模式,这是一次革命性的更新,将标志着亚马逊广告正式进入智能调控时代。

Target RoAS

基于规则的竞价(Rule-Based Bidding,下文用Target RoAS表示),是一种以广告的最终效果(RoAS)为目标,利用机器学习算法将一系列影响效果的参数(时间、受众人群、展示位置等)考虑在内,并依据大规模数据帮助广告主更准确地出价,这些都是无法通过人工去实现的。

Target RoAS顾名思义广告自动优化的目标是RoAS,先根据RoAS的计算公式分解出背后的影响因素。
RoAS= Ad Sales/Ad Cost
=(曝光点击率转化率客单价)/(曝光点击率CPC)*
= 转化率 * 客单价/ CPC
所以机器在每次为广告展示实时出价时会考虑这三个因素:我们设置的RoAS目标、预测每次点击的转化价值、预测转化率。

预测每次点击的转化价值”其实就是客单价,但这个客单价不仅仅是指我们开广告的产品客单价,还包括客户通过广告购买的同店铺其他产品的客单价,在亚马逊的广告逻辑中,这也会算进该广告的销售额中,因为每次出单带来的销售额可能不同,所以预测的每次点击的转化价值也就存在差异,这也是一个亚马逊要考虑的动态值。
预测转化率”就是由于每次客户搜索时的需求、时间、地点、使用设备、搜索关键词、广告的展示位置等因素会使每次点击的转化率存在差异,所以这也是一个动态变化的值。

简而言之,在RoAS确定的前提下,如果机器判定每次点击转化的价值(客单价)和预测的转化率越高,就会出更高的竞价,反之,就会出更低的竞价。
系统每次出价都会和预测的转化价值与预测的转化率相匹配,如果预测的准,出价又合适,最终的广告效果自然就会符合预期,怎么才能让系统预测的更准些呢,那就需要给系统“投喂”大量的数据。

自动出价策略的演进

image.png

(图片来源阿里云)

整体可以划分为4个阶段:

  • 第一代:经典控制类
    • 把效果最大化的优化问题间接转化为预算消耗的控制问题。基于业务数据计算消耗曲线,控制预算尽可能按照设定的曲线来消耗。PID及相关改进是这一阶段常用的控制算法。当竞价流量价值分布稳定的情况下,这类算法能基本满足业务上线之初的效果优化。
  • 第二代:规划求解类
    • 相比于第一代,规划求解类(LP)算法直接面向目标最大化优问题来进行求解。可基于前一天的参竞流量来预测当前未来流量集合,从而求解出价参数。自动出价问题根据当前已投放的数据变成新的子问题,因此可多次持续的用该方法进行求解,即Online LP。这类方法依赖对未来参竞流量的精准预估,因此在实际场景落地时需要在未来流量的质和量的预测上做较多的工作。
  • 第三代:强化学习类
    • 现实环境中在线竞价环境是非常复杂且动态变化的,未来的流量集合也是难以精准预测的,要统筹整个预算周期投放才能最大化效果。作为典型的序列决策问题,第三阶段用强化学习类方法来优化自动出价策略。其迭代过程从早期的经典强化学习方法落地,到进一步基于Offline RL方法逼近「在线真实环境的数据分布」,再到末期贴近问题本质基于Online RL方法实现和真实竞价环境的交互学习。
  • 第四代:生成模型类
    • 以ChatGPT为代表的生成式大模型以汹涌澎湃之势到来,在多个领域都表现出令人惊艳的效果。新的技术理念和技术范式可能会给自动出价算法带来革命性的升级。阿里妈妈技术团队提前布局,以智能营销决策大模型AIGA(AI Generated Action)为核心重塑了广告智能营销的技术体系,并衍生出以AIGB(AI Generated Bidding)为代表的自动出价策略。

广告竞价机制发展调研

拍卖机制是对竞争性资源的一种高效的市场化分配方式,具有良好博弈性质的拍卖机制在互联网广告场景下可以引导广告主的有序竞争,从而保证竞价生态的稳定和健康。

整体而言,可以划分为三个阶段:

image.png

(图片来源阿里云)

第一阶段:经典竞价机制

经典拍卖机制如GSP、VCG由于其良好的博弈性质以及易于实现的特点使得其在2002年前后开始被互联网广告大规模的使用。接下来分别从单广告位和多广告位进行讲解。

单个广告位

一价计费

即排名第一的广告出价多少钱,广告平台则计费多少钱。一价机制是最早应用到搜索广告竞价计费的一种机制,简单直接,但是有一个最严重的问题:在一价机制下,广告主之间不存在一个出价策略均衡,而是广告主会根据其他广告主的行为不断调整,整个系统会不断变化,不会达到纳什均衡。

假设拍卖某一个广告位的流量,按 cpm 一价计费拍卖,也就是出价高的人拿走流量,计费完全等于出价。假设有两个广告主竞价,保留价是 10 元。那么一开始广告主 A 出 10.1 元买走了第一个的流量,广告主 B 出 10.2 元买走了第二个的,这个时候广告主 A 会调整出价到 10.3 元,广告主 B 又调到 10.4 元。。。直到当前价格是广告主 A 出 100 元,这个时候广告主 B 算了下再加价要亏本了,决定不再跟了,反正是第二名,出 99.9 元也是输,出 10 元也是输,不如把价格调回到 10 元,这样如果广告主 A 预算撞线了或者退出了,还能捡个漏。这个时候广告主 A 发现 B 已经把价格调到 10 元了(不能直接看到 B 的出价,但是可能会逐渐试探到),自己也不用花 100 元去买,直接出 10.1 元就可以了。广告主 B 又把价格提高到 10.2 元。。。于是,一个新的循环又开始了。排名第一的广告的价格呈现锯齿状,非常不稳定。这就是没有达到纳什均衡的现象,即没有达到:博弈的任何一方,只要改变当前的选择,双方各自的利益都不会增加。不管现在这个循环的哪个阶段,总有一方可以针对性地调整自己的出价,从而提高自己的收益。

二价计费

即排名第一的广告赢得竞价,但是只计排名第二的广告的出价。一价下广告主会不断通过调整出价来尝试降低成本,这样会造成整个系统及其不稳定(平台收益一直处于波动中),在二价机制下广告主没有调价的动力了,按照期望价值出价即可,可以使系统更加稳定。由于二价机制原理简单,易于理解,很快二价便取代一价成为主流竞价机制。

在二价计费机制下,当广告主 B 把价格调整到 10 元后,广告主 A 不需要再把价格调到 10.1 元。因为计费按第二名 + 最小货币单位,也是按 10 元 + 0.001 元计费。不管是保持 100 元出价还是修改到 10.1 元,都是按 10.001 元计费。这个时候循环就被打破了。在这个阶段,广告主 A 是没有办法再通过调整自己的出价,来提高自己的收益。广告主 B 也没有办法再调整出价,来提高自己的收益。这个时候就达到了所谓的纳什均衡。

一价 v.s. 二价

理想情况下的拍卖,广告主之间是无信息沟通的,每个广告主独立出价。但实际中并不一定如此,在特定的机制下广告主之间可以通过「约定」来进行作弊,损害平台利益。

  • 二价下广告主之间有动力通过同谋的方式进行作弊,让广告平台利益受损。二价机制中,假设只有 A、B 两个广告主,若 A、B 之间相互独立,出价分别为 100 和 60,则按照二价广告平台计费 60,A 获得竞价;但若 A 和 B 事先进行约定,此次竞价让 A 胜出,B 只出价 10,这时候 A 依然能胜出,但只需付给广告平台 10。
  • 一价下广告主之间同谋的动力减少,反而相互背叛的动力会增强。 一价机制中,还是上面的例子,如果 A、B 之间约定 A 出 10,B 出 5,这时候 B 只要不按约定出一个稍高于 10 的出价,即可以竞价获胜,因此 B 有动力去背叛 A 而获得收益。

尽管二价机制存在广告主结盟作弊的可能性,但只要参与竞价的广告主数量增多,同谋作弊的难度就会增高,客观上缓解了这个问题。

多个广告位

GSP

在同时有多个广告位进行竞价时(通常见于搜索广告场景),二价机制泛化为 GSP (Generized Second Price,广义第二价格拍卖),即所有广告主按照排名下一位的广告主的出价计费。

举一个例子进行分析:总共有两个广告位,点击率分别为 0.1 和 0.07,ABC 三个广告主分别按点击出价 10、8、5 块。


GSP 机制下,首先,广告系统按照广告主的出价来对广告主进行排名,按出价从高到低排序,因此广告位的分配为:
广告位 1(点击率 0.1):由广告主 A 获得。
广告位 2(点击率 0.07):由广告主 B 获得。
广告主 C 出价最低,没有获得广告位。

GSP 机制下,每个广告主支付的价格是排在其后面的广告主的出价,因此:
广告主 A 获得第 1 个广告位,但支付的是排在它后面的广告主 B 的出价,也就是 8 元广告位 1 的点击率是 0.1,广告主 A 的支付价格为 8 元,因此该广告位eCPM为:0.1×8×1000=800 (元)

广告主 B 获得第 2 个广告位,但支付的是排在它后面的广告主 C 的出价,也就是 5元广告位 2 的点击率是 0.07,广告主 B 的支付价格为 5 元,因此该广告位eCPM为:0.07×5×1000=350 (元)

广告系统的总收入为两个广告位的收入之和:800+350=1150 (元)
因此, 在 GSP 机制下,广告系统的总收入为1150元。

VCG

虽然二价在单个广告位时是 truth-telling 的,但在多个广告位时并不是。而VCG(Vickrey–Clarke–Groves)机制则让广告主在多个竞标物下也保持 truth telling。VCG 机制核心是:每个广告的计费为:因为他们获得这个位置造成的社会总效用的下降,这个社会总效用通常使用 eCPM 进行衡量。

在 VCG 机制中,需要确定广告主的支付金额与他们对社会效用的贡献(出价 × 点击率 × 1000):

假设广告位分配如下:
广告主 A 获得广告位 1(点击率 0.1),效用为 10 × 0.1 ×1000 = 1000
广告主 B 获得广告位 2(点击率 0.07),效用为 8 × 0.07 ×1000 = 560

如果去掉广告主 A,广告主 B 将获得第 1 个广告位,广告主 C 获得第 2 个广告位。
广告主 B 在广告位 1 上的效用为 8 × 0.1 ×1000 = 800
广告主 C 在广告位 2 上的效用为 5 × 0.07 ×1000 = 350
因此,去掉广告主 A 后的社会效用为:800+350=1150

广告主 A 的边际贡献去掉广告主 A 后的社会效用 - A参加条件下其他竞价者受益 = 1150 - 560 = 590 ,即为 A 为广告位 1 应付的钱。同理可计算B为广告位2所付的钱为 1350 - 1000 = 350。

广告系统的总收入为两个广告位的收入之和:590+350=940(元)
因此, 在 VCG 机制下,广告系统的总收入为1150元。

GSP v.s. VCG
  • 在只有一个广告位时,VCG 中总效用的下降其实正好就好第二位的 eCPM(因为排名第二的广告主的收益由 eCPM 变为 0,其他排名第二位之后的广告主收益没变化)。因此在只有一个广告位时 VCG 和二价机制是等价的
  • 在多个广告位下,GSP 并不是 truth-telling 的,在 GSP 机制下所有广告主 truth-telling 并不是占优策略,广告主仍有动力去通过调价获利

还是按照上面的例子分析。假设 10、8、5 是广告主 ABC 按照真实价值出价,这时 A 的收益是 1000 - 800 = 200,其中 1000 是收入,800 是成本。如果此时 A 将出价调为 7.9,那么 B 将获得广告位 1,A 能够获得广告位 2,A 的收益为 553 - 350 = 203 > 200,高于在 truth-telling 下的收益

结论

  • 互联网广告竞价机制经历了从 GFP 到 GSP/VCG 的演变,相较而言目前 GSP 更为主流(谷歌、雅虎、微软、百度、腾讯等),VCG 在 Facebook 有被应用
  • GFP 机制依赖广告主自己的出价,广告主没有最佳的出价策略,会不断试探价格以最大化收益,会造成广告系统不稳定,损害广告系统收益
  • GSP和 VCG 机制均不依赖广告主自己的出价,在密封出价、只有一个竞标物(广告位)时,两者是等价的。在多个广告位时 GSP 和 VCG 有所差异:
    • 在 VCG 下,truth-telling 是所有人的占优策略,所有人 truth-telling 构成 VCG 一个纳什均衡点;在 GSP 中所有人 truth-telling 并不是占优策略
    • GSP 尽管不存在 truth-telling 的平衡,但是存在非常强条件的均衡,GSP 通常也能够达到稳定的状态
    • GSP 对于广告系统的收益在最差情况下也比 VCG 机制所有人 truth-telling 下的收益要更好
    • VCG 机制复杂,对于广告主来说较难理解,相比之下 GSP 规则较容易被广告主理解接受

第二阶段:Learning-based 拍卖机制

随着深度学习&强化学习的蓬勃发展,大家开始探索将深度学习/强化学习引入到拍卖机制设计中,学术界典型的工作包括RegretNet、RDM等。此外,阿里妈妈设计出Deep GSP、Neural Auction、Two-Stage Auction等机制,借助深度网络强大的学习能力,提升拍卖机制的优化效果。

Deep GSP

阿里妈妈提出一种基于深度神经网络的拍卖机制Deep GSP。Deep GSP延续GSP的二价扣费机制,并通过深度网络提升其分配能力。不同于经典的广告拍卖机制,其能够通过深度网络的学习实现任意给定目标的优化,整个优化过程使用深度强化学习中确定性策略梯度算法实现。

image.png

Neural Auction

Deep GSP的模式采用GSP-Style的机制设计模式,通过深度网络为每个广告计算出一个分数,排序后决定分配和扣费结果。训练时基于最终效果为参与竞价的每一条广告样本分配奖赏并采用强化学习的方法驱动模型参数更新。从机制的角度,求解最优分配问题是一个全局视角的组合优化问题,而Deep GSP是建模在广告粒度,如何把整体的效果分摊到每个广告上,即信用分配问题,会对训练产生很大的影响。但排序是一个不可微的操作,在模型训练的时候无法直接像监督学习那样通过样本标签计算的loss反向梯度传导优化模型参数。

因此,阿里妈妈又提出了一种新的拍卖机制Neural Auction,以一种可微的计算形式来表达"排序"算子,从而能够与梯度下降训练方法结合,实现端到端优化。

image.png

Score-Weighted VCG

广告拍卖机制的效果依赖于广告展示商品点击率(CTR)的精确预估,但在实际场景中,商品展示点击率会受到相互之间的外部性影响。这一现象在近年来开始受到学术界和工业界的广泛关注。然而,传统的广告拍卖通常简化或忽略了外部性。例如,广泛使用的 GSP 拍卖机制基于可分离 CTR 模型,假定广告的点击率只由广告内容和位置决定,而忽略了其他商品的影响。因此传统的广告拍卖机制在考虑外部性时不再适用。

但考虑外部性影响对于最优广告拍卖的设计带来了许多挑战。由于广告的点击率受到上下文中其他商品的影响,即使对分配进行微小修改,也可能导致广告拍卖的预期收入发生复杂的变化。一般而言,对于外部性结构不作具体假设时,计算具有最大社会福利的分配方案是 NP 困难的。因此,如何设计高效实用的分配算法是一个非平凡的问题。另一方面,由于外部性影响的存在,拍卖机制更难控制每个广告主得到的效用,因此 IC 和 IR 等约束更难满足。

于是提出一个数据驱动的广告拍卖框架,以在考虑外部性的情况下实现收入最大化,同时确保满足 IC 和 IR 约束。结合理论分析提出 Score-Weighted VCG 框架,将最优拍卖机制的设计拆解为一个单调得分函数的学习和一个加权福利最大化算法的设计。基于这一框架又提出一个实用的实现方案,利用数据驱动的模型实现最优拍卖机制。通过完备的理论证明了该框架在各种感知外部性的点击率模型下都能产出满足激励兼容和个体理性的近似最优广告拍卖。

image.png

第三阶段:拍卖机制 & 自动联合设计

随着自动出价能力的广泛应用,广告主竞价方式相较于之前有了大幅度的改变,广告主向平台提交高层次的优化目标和约束条件,然后由出价代理代表广告主在每次广告拍卖中做出详细的出价决策。对于广告主来说,平台需要把出价和拍卖机制看成一个整体联合设计,典型的工作包括:

Designing Ad Auctions with Private Constraints for Automated Bidding

在自动出价的新广告范式中,我们需要重新审视经典的拍卖机制模型是否仍然适用。由于可以获取有关广告主与用户之间互动的历史数据,平台可以估计用户的潜在行为(如点击和转化),这些行为可以被视为广告主对物品的估值。在自动出价中,广告主的私有信息实际上是其在整个广告投放过程的约束条件。这些与经典拍卖截然不同的新特点需要对应的新的广告拍卖模型,以激励广告主真实地上报其高层次的私有约束。

这篇paper提出了一类基于排序函数的激励兼容机制,关键思想是采用提前确定的排序函数为每个广告主进行排序,并将阈值ROI设计为赢得足够多的竞价机会以消耗完预算的最大ROI。在该机制中,给定广告主上报的预算和ROI,首先基于排序函数计算不同广告主对于每个物品的虚拟出价。只要这些排序函数在ROI上是单调递减的,保证最终的拍卖机制是满足DSIC与IR的。接下来,将每个物品分配给排序分数最高的广告主,并根据第二高的排序函数计算赢得此物品所需要的ROI。为了保证约束的IC,我们使用前面提到的基本规则来计算关键ROI,即赢得足够多的物品以消耗完预算的最大ROI,其中使用关键ROI作为实际ROI来计算支付。这是一个对此类问题的初步尝试,未来还需要进一步深入思考。

 

参考资料

  1. www.yunyingpai.com/market/4679…
  2. blog.csdn.net/weixin_4444…
  3. zoo.cs.yale.edu/classes/cs4…
  4. www.economics.utoronto.ca/damiano/ps4…
  5. borgwang.github.io/adtech/2020…
  6. developer.aliyun.com/article/149…
  7. www.woshipm.com/operate/548…