《计算广告》笔记(三)

155 阅读7分钟

《计算广告》笔记(三)

原生广告平台

表现原生与意图原生 原生的两重含义,“原生”这一概念实际上有两种不同的诉求:一种诉求是将广告的展示风格和样式变得与内容相一致,(我的理解是就是在表现形式上做成类似于软广的效果,让用户无感)从而做到产品形式上的“原生”;另一种诉求是将广告的投放决策逻辑与内容生产相一致,从而做到用户意图上的“原生” (什么意思呢? 感觉像是推送的逻辑和内容保持一致,甚至从投放逻辑都无感, 这个比较难理解)(无论怎样, 此类的原生在2024年的视角看, 政策上不允许,广告必须要标注为“广告”, 但是可以表现为内容“植入”)
植入式原生广告 (正好这里就提到的植入是广告)原生广告如何精准投放 一是要判断用户当前的意图,二是要确定根据用户的意图提供什么信息。(这里举了个类似小红书的软广)以植入式广告的逻辑来运营原生广告,是希望在内容生产的过程中,当某些片段商业价值较高时,将这些内容按照严格的条件交由广告平台来生产(总结来看,原生广告应该是对内容伤害较小的, 最大化变现能力的)(所有有些广告现在来看已经背离了植入式广告的初衷,这里可以重点批评B站的花火植入广告,真的垃圾)
原生广告案例: InMobi OutBrain,(同样的案例其实还是有时代局限)
原生广告与程序化交易 未来发展趋势(现在看呢? )
### 在线广告产品实践
回归到广告的目的 核心问题 (1) 媒体变现 (2) 广告主选择广告 (3) 第三方平台数据(点击、停留、用户特征)如何变现
媒体决策

image-20240530145925480.png

广告主决策

image-20240530145956240.png

数据方决策

image-20240530150034905.png

计算广告的技术

(可能这部分对于技术人员才是重点, 不过前面的概念也很重要)

个性化系统与搜索系统 采用检索(retrieval)加排序(ranking)这样类搜索的系统架构
用于实时响应请求,完成决策的在线投放(online serving)引擎;离线的分布式计算(distributed computing)数据处理平台;用于在线实时反馈的流计算(stream computing)平台;连接和转运以上三部分数据流的数据高速公路(data highway)。(对于现代的feed系统比如微博、或者短视频而言基本上都是必须的几个组件 在线部分,离线部分、实时流式部分、 以及数据总线,可以说非常笼统)

image-20240530150420475.png

广告投放引擎: 设计目标 (1) 在线实时响应 (2) 个性化决策 ;类似搜索

image-20240530150857683.png

本文的示意架构,

实时引擎

广告投放机 adServer 是接受广告前端 Web 服务器发来的请求,完成广告投放决策并返回最后页面片段的主逻辑, (我的理解对C端的入口)
广告检索(ad retrieval) 这个就有点顾名思义了, 处理在线部分的标签、检索合适广告(就是就是类似召回的粗排阶段)
广告排序(ad ranking)是在线高效地计算广告的eCPM,并进行排序的模块, (对应的是将召回的结果进行精排)
收益管理(yield management)。 (我理解有点像是在实时过程中对收益结果进行粗预估,然后实时的法调整排序,进行反馈)
广告请求接口。 统一的对端接口, 应该也有openApi接口,广告请求可能来自于基于 HTTP 的 Web 服务器,也可能来自于移动 App 内的 SDK, (理解没错 就是接口网关)
定制化用户划分(customized audience segmentation 从广告主处收集用户信息的产品接口 , (类似于用户的特征采集)

离线数据处理引擎

在我的理解下,离线部分的核心是对于有价值数据的挖掘, 最大化数据、用户、流量的价值

1.用户会话日志 ,服务与定向和打标
2.行为定向,挖掘用户日志,用户打标
3.上下文定向 上下文打标
4.点击率建模, 为了建立特征?
5.分配规划, 服务收益管理,(感觉是建立一个收益管理的自动决策模型)
6. BI系统, (感觉这个是一般意义上人们第一时间理解的离线系统,) 数据处理和分析、数据反馈、 辅助决策
7.广告管理系统 :客户执行(AE) AE 通过广告管理系统定制和调整广告投放,并且与数据仓库交互,获得投放统计数据以支持决策

在线数据处理

就是流式引擎,下面也是一般的模块,同样的放在2024年的节点,很多内容可能是过时的,辩证对待

1.在线反作弊, (洗数据)
2. 计费 (实时扣费,欠费消耗账户就可以立即停止消耗)
3.在线反馈,用户的行为能够实时影响反馈到模型,包括实时受众定向(real-time targeting)和实时点击反馈(realtimeclick feedback)等部分。这部分是将短时内发生的用户行为和广告日志及时地加工成实时用户标签以及实时的点击率模型特征, 非常重要,准确性和实时性都会影响推送的效果
4. 实时索引(real-time indexing)。实时接受广告投放数据,建立倒排索引。 这个感觉和实时反馈是一个事情,一个是算法效果层面,一个是工程性能层面

计算广告的一些技术难点

实时索引、Nosql 、 mapreduce 、高并发快速响应
开源工具(这一块就是感觉是给产品等的科普部分了,有些也怎么流程了,有些和语言也有关系) nginx、zk、es-lucence、thrift、flume、hadoop、redis、storm、spark

技术知识

这一块是算法比较熟悉和关注的, 但是对其他同学反而是最值得学习了解的

信息检索 IR、机器学习ML (放现在大语言模型也是不得不提的)
IR 倒排索引(ES) ,向量空间空性(VSM) (特征建模)
最优化方法(Optimization) , 包括 拉格朗日法与凸优化、 下降单纯形法 、 梯度下降法、拟牛顿法、 Trust-Region 法
统计机器学习 1 最大熵与指数族分布、2 混合模型和 EM 算法、3 贝叶斯学习、

合约广告技术

广告排期系统,(理解上就是一个调度系统, 对广告资源、投放计划进行编排的系统)
担保式投放系统

image-20240530160026929.png

AdWords 问题,也被称为有预算约束的出价(budgeted bidder)问题,讨论的是在CPC 结算的竞价广告环境下,给定各个广告主的预算,整体化市场营收的问题。

受众定向技术

特征提取:受众定向技术是对广告(a)、用户(u)、上下文(c)这三个维度提取有意义的特征(这些特征也称为标签)的过程。由

程序化交易技术

广告交易平台 实时竞价,高效变现、 Cookie映射、询价优化(在带宽和服务成本的约束下获得更高的 eCPM)、
需求方平台 DSP、支持定制化的用户划分能力、出价策略、从利润的角度出发,除了尽量提高广告的 eCPM,还需要尽量降低每次广告展示的费用,