250526 | 关注抖音趋势划重点（2）抖音公开算法篇当所有的信息越来越透明化，每天信息量爆炸，你认为真正剩下有价值的

前言思考：当所有的信息越来越透明化，每天信息量爆炸，你认为真正剩下有价值的会是什么，你会对海量信息如何取舍？推荐算法篇刚好和前阵子看过的算法推荐书重合了，好巧。

抖音公开算法篇

一、版块概览

01 从零开始了解推荐系统

推荐平台依靠算法，能智能主动地发掘用户兴趣，帮助解决超大规模信息分发的效率问题。

推荐算法核心目标是通过分析用户的“行为”（点击、浏览、喜欢、转发、收藏等），构建个性化的推荐模型。系统会基于用户历史动作、对象特征和上下文环境，采用算法模型，预测用户可能会对什么样的内容产生什么样的行为。

抖音算法已几乎不依赖对内容和用户打标签，而是通过神经网络计算，预估用户行为，计算用户观看这条内容获得的价值总和，把排名靠前的内容推给用户。

抖音应用的深度学习算法包括Wide&Deep模型、双塔召回模型等。前者可解决协同过滤算法容易造成信息单一、泛化不足的问题；后者在召回环节提供更好的推荐效果。

02用户行为背后的算法推荐逻辑

基于人工智能机器学习和深度学习构建的推荐算法，其本质是数学模型的运算过程，只是在建立用户行为与内容特征之间的数学统计关联，而非理解内容本身。抖音推荐算法的核心逻辑可以简化为“推荐优先级公式”：综合预测用户行为概率 × 行为价值权重 = 视频推荐优先级。

模型需要内容和用户两端的数据做输入，其中主要是学习用户行为数据。结合用户行为和视频本身的价值权重，推算出视频推荐的价值分数，并将综合得出的价值最高的视频推送给用户。

抖音的价值模型希望实现内容、用户、作者以及平台的多方价值共赢，并通过不断调整参数，对各类价值进行加权。随着算法的进步，抖音已经实现了“分钟级”实时反馈更新。

03抖音算法的多目标平衡

推荐算法通过各种“目标”来预估用户行为。推荐算法诞生之初，只关注单一或者少量的目标。早期的抖音以15秒短视频为主，这一阶段，完播率是推荐算法的核心目标之一。

随着抖音的用户愈发多样化，内容风格也日益多元，平台上有了越来越多的优质中长视频，完播率等少数目标难以满足需求，多目标建模成为技术上的自然选择。

抖音已经发展出非常复杂的多目标体系，比如将收藏率纳入多目标，帮助知识类内容推送给有需求的用户；增强“收藏+复访”“关注+追更”“打开+搜索”等组合目标，预估用户长期行为，帮助用户探索长期需求；设置探索类指标，帮助用户探索可能他们自己都还没发现的潜在需求，助力破除“信息茧房”；设置原创性目标，鼓励优质、新颖且具有独特价值的内容推荐。

04平台治理为推荐算法设置“护栏”

算法无法理解内容语义，因其对内容的理解存在不足，可能导致违法违规、不良内容被推荐传播。在真实使用场景中，算法必须要由平台治理对其进行约束和规范。

平台治理存在于内容发布与传播的每一个环节，整体遵循两个原则。一是所有在平台发布的内容都会经过评估，流量越高的内容经过评估的次数越多，标准也越严格；二是“人工+机器”审核相互分工又密切配合。

一条视频可能触发多个治理研判节点，视频被举报、评论区出现集中质疑、流量激增等情况，均可能触发“人工+机器”审核。而在任一环节，一旦内容被处置，基本都会立即停止进一步的推荐和分发。

针对社会普遍关心的、呈现聚集特征的、反复出现的、对用户造成较多困扰的焦点问题，抖音成立了数个专项治理团队，分别设置相应的治理标准、识别策略、处置手段和风险巡查能力，专注应对涉及特殊群体、网络暴力、AIGC技术滥用等问题治理。

二、了解推荐系统

从技术视角来看，推荐算法的基础是机器学习。事实上，机器学习是人工智能的核心技术之一，其定义有很多种，大体都可以归结为通过已有的数据进行数学建模、挖掘规律，随后，在此基础上对未知的数据进行预测。

推荐算法是机器学习技术的重要应用领域之一，其核心目标是通过分析用户的“行为”（点击、浏览、喜欢、转发、收藏等），构建个性化的推荐模型。具体而言，系统会基于用户历史动作、对象特征和上下文环境，采用算法模型预测用户可能会对什么样的内容产生什么样的行为。

协同过滤算法通过分析用户行为数据而非内容特征，实现个性化推荐。

“协同过滤”（ Collaborative Filtering，简称 CF）推荐算法是最经典的推荐算法之一，至今仍然在广泛使用。所谓“协同过滤”推荐，简单来说就是协同用户的行为，一起对海量的信息进行过滤，从中更加快速筛选出用户可能会产生行为（比如完播、点赞）的内容。

基于内容的协同过滤的大致过程是这样的。比如用户 A 观看了内容 X、Y、Z，用户 B 观看了内容 X、Z、W，那么X 和 Z 之间就有较高的相似度。然后根据用户对已观看或已评分内容的偏好，为用户推荐与这些内容相似的其他内容。重点是计算内容之间的相似度，根据用户的行为数据，找出与目标内容相似的其他内容。这种方法在内容数量相对稳定、用户数量较大的场景下表现较好。

因此协同过滤可以在完全“不理解内容”的情况下，也为用户推荐其可能想看的内容。其原理简单来说就是，找到和你兴趣相似的用户，把他们感兴趣的内容也推荐给你。

深度学习&神经网络原理介绍

深度学习的基础依然是机器学习。机器学习是人工智能的一个分支，核心目标是使用数据和算法使人工智能能够模仿人类的学习方式，并逐渐提高准确性。

在推荐算法应用领域，机器学习的核心目标是学习模仿人类点击某种内容的行为。其常见的过程大致可以简化如下：

准备训练集数据；
将训练集中的数据输入模型进行训练；
将模型输出数据与训练集的目标数据进行对比；
通过不断调整参数使得二者不断接近（数学称为拟合）。

这个过程，从表面看和老师教授学生新知识类似：在训练集（相当于老师）的指导下，通过大量的数据输入（相当于练习题），对比目标不断调整模型参数（改错），使得模型输出结果尽量准确，这个过程就是机器学习。

近几年，机器学习的能力越来越强，这得益于深度学习的发展。深度学习是机器学习的高级形态，其核心特点是以人工神经网络为架构。

人工神经网络（Artificial Neural Network，即ANN）是模仿生物大脑内神经网络的结构和功能设计的计算模型，由大量的节点（类似生物大脑的神经元）之间相互连接构成。

人工神经网络可以分成三个主要部分：输入层、隐藏层、输出层。输入层能够对外界的信息进行处理和分类，然后将结果传递给下一层；隐藏层可能包含一层或多层，能够对输入层或者其他隐藏层传递来的信息进行处理，并将信息传递给输出层或下一个隐藏层；输出层对输入进来的信息进行最终分类判断，并输出结果。深度学习中的“深度”，指的就是在神经网络中使用“多层”，通常情况下，层数越多，算法的能力越强。

常用模型

抖音Wide&Deep模型

抖音在2016年上线，恰逢推荐算法开始进入深度学习时代，我们所应用的推荐算法也是深度学习算法的一种。接下来我们以至今依然是抖音推荐算法主力模型之一的Wide&Deep模型为例进行介绍。[4]

Wide＆Deep模型的主要思路正如其名，是由单层的 Wide部分和多层的 Deep部分组成的混合模型。其中，Wide部分的主要作用是让模型具有较强的“记忆能力”（memorization），“记忆能力”可以被理解为模型直接学习并利用历史数据中物品或者特征的“共现频率”的能力；Deep部分的主要作用是让模型具有“泛化能力”（generalization），“泛化能力”可以被理解为模型传递特征的相关性，以及发掘稀疏甚至从未出现过的稀有特征与最终标签相关性的能力。

其具体模型结构如下图：Wide＆Deep模型把单输入层的Wide部分与由Embedding层和多隐层组成的Deep部分连接起来，一起输入最终的输出层。Deep部分进行深层的特征交叉，挖掘藏在特征背后的数据模式；而单层的Wide部分善于处理大量稀疏的特征，使得数据稀少的用户或者物品也能获得有数据支撑的推荐得分，从而提高泛化能力。

抖音双塔召回模型

一条视频从海量信息中被选中，推送给用户，一般要经过进入内容池、召回、排序三个环节。用户发布的新视频首先要经过初步评估进入内容池，然后进入召回环节，其作用是从海量的内容池中，初步快速粗筛出一大批用户可能感兴趣的内容。

举例来说，召回环节需要用到召回模型，抖音最常用的召回模型是“双塔召回模型”（Two-Tower Retrieval Model）。双塔召回模型把用户和内容都转化为数学空间里的一个个点，就像是给用户和内容贴上了独特的“数字标签”，这个过程叫做向量化表征学习。

具体运行步骤关键如：

（2）将转化后的数学特征输入到用户塔、内容塔两个深度学习模型中，经过训练，各自形成一组新的数字集合，这叫做用户表征和内容表征。在这一步，原本各自代表一个现实特征的数字不再具备任何实际语义，两个模型会把用户特征和内容特征都转化为没有现实意义的数字代码——因此，算法不用理解现实语义，只需处理纯粹的数学符号；

（3）将两组形式为纯粹的数字集合的用户表征和内容表征，放入同一个向量空间中，每一组数字集合便在向量空间中拥有了一组专属的向量值，好比一组独有的“数字指纹”；

（4）将训练过的所有内容表征的向量值和当前用户表征的向量值的距离进行对比，距离越接近代表用户越喜欢。当你的“数字指纹”和某个视频的“数字指纹”在坐标系里刚好比较“匹配”（距离近），算法就会推荐它。

1、建立专门的标准管理团队

为确保治理标准体系系统、清晰，保障其具有可执行性，抖音组建了专门的团队，负责对治理标准进行准入及准出的管理工作，综合研判以确保标准符合治理目标。

2、全面覆盖各类风险问题

目前，标准管理团队已对违法违规、色情低俗、公序良俗、危险行为等十余大类、数百种风险设置了独立标准条款，每条标准条款都匹配典型违规案例及对应执行手册。另外，针对抖音上不同的内容体裁（如视频、图片、文字等）及不同的产品场景（如用户昵称、评论、话题等）的特性，也制定了对应的标准。

3、标准及时迭代和评估

根据法律法规调整、社会热点变化以及外部意见建议，标准管理团队对标准进行更新和迭代，并设定产品化的线上流程和审批机制，确保所有标准的变更与管理有留存、可追溯。常规情形下团队定期进行评估和更新，遇到突发风险时启动标准快速上线与下发流程，以确保风险问题快速被识别。

4、标准落地质量追踪和纠偏

在标准团队内部设置专门的质量管理组，评估和追踪标准执行的质量；同时，设置专业的标准培训组，定期做好执行团队的纠偏。

5、对用户和作者开展治理标准普及

抖音也对外公开了治理标准，参见**抖音社区自律公约**。抖音在App和PC端都设立了专门的规则中心，用户可自行查阅标准公约。同时，对于违规用户，平台会通过站内信等方式告知用户其存在的违规行为。

平台治理的第二步是针对标准中定义出的问题，针对性地将有问题的内容识别出来，并进行处置。

抖音的平台治理存在于内容发布与传播的每一个环节。一方面，内容的传播与治理紧密关联，一条内容传播的次数越多，其需要经历的审核次数也越多；另一方面，治理链路包括感知、识别、判定、处置、体验等多个步骤，且不断从头到尾，从尾到头，实现循环与升级。

在明确了治理标准后，抖音的平台治理链路核心有两个原则。

原则一：所有在平台发布的内容都会经过评估：流量越高的内容经过评估的次数越多，标准也越严格。

具体而言，这套内容分发和治理体系，需要解决三个层次的问题。

第一层在内容发布前或最初阶段，需要从严处置存在违法违规等底线问题的内容；第二层针对已在平台产生一定传播量级的内容，复审该内容继续传播是否会引发广大用户不适甚至反感；第三层主要针对潜在高热内容，努力将流量提供给原创、优质的内容。

其具体流程如下：

1、初审

创作者将内容上传至抖音平台后，均会进入初审识别环节，如果被识别出含有高危特征，内容将被直接拦截；如果未直接命中高危特征但模型判断其大概率有底线问题，则会将其送至人工审核，由专业人员按初审标准进行研判；而未直接命中高危特征且模型判断其有问题的概率较低的内容，则将获得基础流量并进入下一个环节。

初审环节的核心是识别内容是否存在底线风险。经过数年的积累，抖音仅仅在机器审核环节已拥有上百种模型，具有代表性的如血腥模型、自残模型等。

2、复审

通过初审的内容，视频会继续被推荐分发，待视频达到一定播放量级阈值（阈值为波动状态）后，平台会对其召回进行复审。“人工+机器”会按照复审标准进行判断，如果命中问题内容标准，则对视频停止分发；如果不命中相关标准，则视频继续由推荐算法进行新一轮自然推荐分发。

复审环节的重点判断是内容是否存在不宜过多分发的非底线问题，如画面引人不适等。

3、三审

如果视频通过复审后播放量持续增高，待视频达到更高播放量级阈值（阈值为波动状态）后，平台会第三次召回视频，进行三审研判。其审核逻辑与复审类似，但标准要求更严更高。

通过以上三个环节，部分视频会达到较高热度的播放量级阈值（阈值为波动状态），这时会由运营人员介入，对视频的质量进行综合研判，判定其是否适合继续分发传播。

需要说明的是，具体的传播与治理链路中，一条视频可能触发的治理研判节点可能会更多，平台治理并非仅仅根据播放量的增长而循序进入上述三个步骤。视频被举报、评论区出现集中质疑、不合常理的流量激增等信号均有可能触发“人工+机器”的审核，而在任一环节，被处置后的内容，基本都会立即停止进一步的推荐和分发。

原则二：“人工+机器”审核相互分工又密切配合。

上面提及的是“人工+机器”进行平台治理的大致流程和节奏，而在具体治理过程中，“人工”和“机器”承担的角色也会各有侧重。

1、“机器”主要负责“宽度”，主动对所有投稿进行评估。 抖音平台每天有用户发布海量信息，为了不让违法违规和不良信息传播，平台依靠多维度的模型技术检测、拦截和过滤问题内容、违规账号。机器学习算法在各行各业都有应用，除了推荐算法，内容识别算法也让海量内容的审核识别变成了可能，关于机器学习算法在问题内容识别的具体应用，我们后续也将会持续展开介绍。

2、“人工”主要负责“深度”，确保疑难问题尽可能精准研判，减少错判。 “算法”不懂内容，需要依靠人工团队识别研判问题。特别是对于流量大、热度高的内容更需要多人协同工作，从多层次、多视角、多维度确保治理效果。

3、“人工”持续校准和升级“机器” ，这一点，下文会详细说明。

上述两大原则下的内容治理流程，总体上构成了抖音针对普遍性问题的治理框架。

坦白说，平台治理要时刻面对海量的内容，任何一个环节都需要充分考虑传播和治理的效率与精准度，不可避免存在机器漏审，人工判定尺度不一导致的违规内容漏放，误判误伤等问题，导致损害了用户体验。因此，抖音也建立了异常数据预警、判定结果二次确认等机制，以便及时、灵活应对这些问题，达到平台治理、用户体验的多角度平衡。

抖音如何治理专项风险

抖音一方面建设了通用问题治理标准及流程，用于系统性治理平台上可能出现的普遍性风险内容，另一方面针对社会普遍关心的、呈现聚集特征的、反复出现的、对用户造成较多困扰的焦点问题，成立了数个专项治理团队，分别设置相应的治理标准、识别策略、处置手段和风险巡查能力，专注应对涉及特殊群体、网络暴力、AIGC技术滥用等问题治理。

以治理“网络暴力”专项为例。网络暴力备受社会关注且影响恶劣，治理面临以下难题：“施暴者”“受害者”“旁观者”等角色难以区分；场景广泛，涵盖短视频、直播间、评论区、账号主页等；传播方面，具有突发性、密集性和破坏性等特征；此外，还存在概念难界定、时效难保证、单个平台难以根治等问题。

针对上述问题，平台成立了专门治理网暴的团队，以“防护、打击、教育”为关键词，通过主动识别潜在网暴受害者并推送预警、分级干预风险账号、设置防网暴专区提供工具进行防护；通过重点打击侮辱威胁、煽动围攻及侵犯隐私三类施暴者，结合AI与人工治理持续打击；通过发布治理规范、发起反网暴倡议及案例宣传提升公众关于网暴的认知。另外，针对重点场景和人群，建设相关产品能力，为受害者提供心理关怀、法律咨询援助等帮助。

抖音平台治理迭代的核心方法是“问题及时发现+全链路敏捷响应”。

第一，构建多渠道的问题信号发现网络。 抖音通过多个渠道加强对新问题的发现能力，构建起多维度的问题发现网络，包括人工发现+机器发掘+用户反馈等。例如，机器会通过类似内容的异常聚集涌现，识别出部分新问题；通过广大用户的投诉反馈，也可将新问题及时纳入治理范围。

第二，治理全链路的敏捷迭代。 在问题点明确后，相关团队会快速对治理全链路进行整体诊断，弥补治理链路在同类问题上的短板，如进行标准动态校准、识别能力迭代、处置策略更新、效果反馈校验等。整个过程跟随新问题的出现随时进行动态同步、高速响应，确保全链路敏捷迭代，响应突发治理需求。

需要强调的是，在进行治理能力升级之前，治理体系还会对存量问题进行全面回扫，避免能力迭代后存在存量盲区，并为能力迭代提供更多数据支持。而在能力升级完成后，便会正式从新问题的突发式应对，转向常态式治理。

四、多目标价值体系

探索用户深层需求，增强收藏等目标权重
判断用户长期需求，增强“收藏+复访”等组合目标。与之类似的还有“关注+追更”“打开+搜索”等组合目标。这些目标有助于预估用户的长期行为，帮助用户探索长期需求。

· “握手模型”目标带给作者的积极体验，抖音的“握手模型”会将“用户留言并得到作者回复”视为一次对作者更为积极的互动信号。如同一次“握手”，带给人们的好感，明显高于单方面挥手打招呼一样。

· 为了支持优质中长视频，抖音充分利用了多目标建模的能力。点赞分、分享分、点击关注分、完播分、评论分、停留时长、收藏分

· 什么样的目标及权重能最终催生出像热带雨林一样健康繁荣的内容生态，也是抖音完善多目标过程中在持续思考的问题之一。

抖音社区多目标价值体系：

1）内容生态：生态保护、原创性…

2）探索：多样性探索、探索兴趣、主动兴趣

3）非即时体验价值：复访、长期价值模型

4）即时体验价值：时长（停留时长、完播、跳过）、互动（点赞、收藏、分享、评论、关注）

5）用户调研：满意度、营销感、获得感…

五、常见误区及信息茧房

1、为什么用户会觉得推送内容那么准，以至于不少人产生被“窃听”的错觉呢？

原因一：跨平台营销推荐

跨平台营销推荐在业界被称为 “程序化广告”，这一商业模式作为互联网时代产品/服务与消费者的重要连通机制，具体是指广告主根据用户在其应用中的偏好，在用户当前使用的 App 上进行的广告展示。程序化广告是符合我国相关法律法规的一种广告形式。这类广告是基于用户在前述应用上的网络行为数据，比如浏览、点击、收藏等举动而对用户进行行为偏好预测，然后形成用户群体画像，进行定向营销广告。

例如，用户在A电商平台搜索了一款猫粮。关闭A平台后，打开了B社交平台，发现B平台也在推荐猫粮。这并不是B平台对用户做了监控，是A平台作为B平台的广告主，通过程序化广告利用A平台的数据定向给用户展示了广告，实现跨平台的广告营销。

2、消除“信息茧房”也并不简单。

从技术视角看，这实际是推荐的精准性和多样性如何平衡的问题：内容单一当然会陷入“信息茧房”，所以必须追求内容多样性；但多样性太强，推送用户喜爱内容的精准度就可能会变差，用户体验也会下降。

因此，算法的任务，可以归纳为基于用户感兴趣前提下的多元化。为此，抖音算法在多目标建模体系下，设置了专门的探索维度，通过多样性探索、兴趣探索等目标，引导算法打破“茧房”。具体举例，有如下两方面：

一是兴趣多样性覆盖，即对用户在平台上已经表现出的兴趣，尽可能推荐更多样的内容。具体方法有很多，比如：

多样性打散：同样兴趣点的内容不连续、密集出现。
多样性频控：系统会在推荐的每个环节，动态调整不同类型内容的出现比例。比如在初筛、排序等步骤里，既控制相似内容的数量，又确保每个环节传递到下一步的内容足够丰富。这样一来，最终呈现给用户的结果就不会扎堆重复，而是百花齐放。
多兴趣召回：对内容按兴趣方向归类，为用户召回多种兴趣类型的内容。
扶持小众（长尾）兴趣：这类内容在推荐中天然处于劣势，平台会利用模型聚类，对长尾兴趣做扶持和更多冷启动优化。

二是帮助用户探索更多新兴趣。 具体方法包括：

设置随机推荐，打破推荐模型训练集中的循环。抖音会随机推荐用户未表现出兴趣的内容，帮助用户做更多兴趣探索。从应用结果来看，每个用户看到的视频类目明显增加，多样性变好。
偶尔随机推送用户可能感兴趣的内容，帮助用户找相似兴趣。抖音对用户的兴趣表征进行随机扰动，帮助用户探索相关的兴趣。例如，如果用户喜欢音乐，随机扰动后，算法可能会为用户推荐美术、舞蹈等品类的视频。
基于用户社交关系进行兴趣拓展。在获得用户授权后，推荐系统会通过用户的“互相关注好友”推断用户的兴趣圈层，朋友喜欢的内容会成为用户的兴趣探索内容。同时，我们推出了好友推荐功能，用户可以对某条内容进行推荐，被推荐的内容会出现在该用户好友的推荐流中。
让用户的主动探索行为影响推荐系统。（1）搜索推荐联动，用户的搜索行为会影响推荐结果。（2）负反馈让兴趣不再展现：“不感兴趣”对算法是强烈的负反馈信号，抖音对负反馈有独立的打分模型，影响推荐各个漏斗的排序。同时，用户可以设置屏蔽词，相关内容不会在推荐中再展现。

资料源：抖音安全与信任中心官网

Ps：学习笔记，以上仅作为个人学习记录使用，非商用，同时欢迎行业资深前辈交流，共同进步。

250526 | 关注抖音趋势划重点（2）抖音公开算法篇

一、版块概览

01 从零开始了解推荐系统

02用户行为背后的算法推荐逻辑

03抖音算法的多目标平衡

04平台治理为推荐算法设置“护栏”

二、了解推荐系统

协同过滤算法通过分析用户行为数据而非内容特征，实现个性化推荐。

深度学习&神经网络原理介绍

常用模型

推荐算法的本质

推荐只预估行为动作

概率模型预测：抖音推荐算法都预估用户哪些行为

价值模型评估：定义行为的“推荐价值”

动态调整：价值权重的即时反馈

三、平台治理

抖音如何为内容制定治理标准

平台治理的第一步是定义违规内容，设定标准。