编译 | AI科技大本营(rgznai100)
参与 | reason_W
不过我们还是尽可能地利用了能拿到手的数据。我和我的前同事Jeremy Rosen花了六个多月的时间来研究Frederator所拥有并运营的频道数据,想尽可能多地搞明白YouTube的算法。
关于“观看时长”,可以参考作者另一篇文章
http://www.tubefilter.com/2016/05/12/youtube-watch-time-metric-algorithm-statistics/
观看时长
访问量和访问速度
访问时长
启动会话
上传频率
持续会话时间
结束会话
基本上,这些项目中的每一个都关系到你的频道和视频表现的好坏:观众是不是经常来访问(开始一次页面访问会话),以及他们是不是会停留很长时间。
为了让你的频道跟视频在算法中累计下任何变量值(译者注:起码得让变量值不为0吧),你首先需要获取访问量。为了让这些视频“成功”(即在前30天内访问量实现等于或大于订阅者的50%的观众),你需要在视频发布开始的前数分钟、数小时、数天内获得大量的访问次数,我们将其称为访问速度。
接下来,我们先来看看两个变量的作用。
访问量和访问速度
根据这个发现,我们进行了一些更深入的挖掘:如果用这个“访问速度”的规律去预测视频是否会表现良好,能达到92%的准确率。
其实,视频的平均累计访问量和前72小时订阅用户访问百分比的相关性更大。
这些图和相关性充分表明,“访问量”和“访问速度”对于视频和频道的整体成功有着直接而重大的影响。
此外,有证据表明,这个影响反过来也很明显:“访问速度”低不仅对当前视频有负面影响,对前一个视频和后一个视频也有负面影响。
下面这个图显示,如果Frederator上一次上传的视频在前48小时内的“访问速度”低(低的定义是指订阅用户访问百分比不到5%),则下一次上传也将受到负面影响。
该数据证实了马修·帕特里克在视频(https://www.youtube.com/watch?v=HLJQ0gFHM8s)中提到的理论。他的理论表明,如果你的某个视频没有被大量订阅者点击,YouTube就不会赋给你的下一次上传内容很大的订阅者推荐比重。或者是因为你的前期上传工作做得不好,使得频道的访问量变低,这反过来会导致分发机制将你的内容分发给更少的观众。但不管原因是哪个,悲催的结果是一样的。
下面的第一张图表中,蓝线是前48小时订阅用户访问量,红线是前48小时订阅用户访问量与频道整体访问量的七天滚动平均百分比。 第二个图表显示了当天视频的访问次数与频道整体访问次数的百分比。
这两个图表都表明了一件事:当订阅用户访问你的新上传视频和/或频道库视频的百分比下降时,频道整体访问次数也会下降。
也就是说,通过这样的算法,YouTube会积极推广那些能吸引该频道核心观众的频道,同时积极惩罚不能吸引观众的频道。
访问时长
我们发现,对算法有重大影响的下一个最大变量是“访问时长”。访问时长表示观众停留在单个视频页面上的时长。
注意:这里没考虑视频持续时间大于8分钟的视频数据(因为这样只要看完视频,访问时长就大于8分钟了)。
我们还发现,访问时间越长,视频表现也会更好。
下图显示了视频访问时长不到五分钟(1),五分钟到十分钟(5)和10分钟以上(10)的视频前七天的平均访问次数:
下图这张图也是这个意思,不过从7天拉长到整个生命周期了。
除了这些发现之外,我们还有个不太确定的结论,延长视频时间能提高访问数据的表现。
Frederator有一个儿童乐园的频道,每周会上传三到四个视频(时长分别是3分钟,10分钟,30分钟和70分钟)。我们注意到,即使是上传频道库的一些旧视频,70分钟时长视频的前48小时访问量也远远高于其他视频。除此之外,70分钟时长的视频与该频道上其他任何时长视频的平均访问时长相同。
我们建议他们每周只上传70分钟时长的视频。采取了我们的策略之后,儿童乐园频道每日的平均访问次数增加了50万次,同时在过去6周内的视频上传量却减少了75%。这让人很惊讶,我知道。
启动会话,持续会话时间和结束会话
http://www.tubefilter.com/2016/05/12/youtube-watch-time-metric-algorithm-statistics/
这说明了为什么你的订阅用户的前72小时的访问量如此重要。订阅用户是在第一天就可以观看你的视频的人。他们也最可能点击该频道的缩略图,因为他们熟悉你的品牌。
YouTube的算法关注频道的推广效果,而不是个人视频的效果。
- 能让人们经常回到平台
能让人们长时间停留在平台上
第二个图表显示平均每日访问次数和频道的五天滚动订阅用户访问百分比关系。
这意味着如果你能持续地获得大量用户启动会话(五天滚动平均),算法就会增加你的视频发送到该频道整个视频库的日访问量。
这表明,频道的持续性和访问量之间存在相关性,而访问量又表现为订阅用户访问的百分比。
评分算法
这里我们将对这些算法进行逆向破解,并进行重建。通过15个变量和对其权重的最佳估计,我们创建了一个评分算法。
这些变量用于开发评分算法的算法因子。
下面这些图是这些因子的实际效果。
下面这张图展示得更加详细。
知道你好奇,下面这张图就是我们对算法各项变量权重的一个(非常)粗略的估计:
然而,因为没有更多的数据,我们还不能确定在计算相关性中该使用哪种类型的回归。
YouTube通过算法决定了每个视频和频道能获得多少访问量。
成功的频道专注于某个特定的内容类型/想法。
频道一旦确立起成功的内容类型后,就不应该再进行太多探索。
高价内容制作者在YouTube平台上永远不会取得成功,因此这部分群体也绝不会完全接受Youtube。
个性化的节目/频道将永远是平台上的主要内容类型,因为它们就是人们要看的“特定的内容类型”。
新建立的频道,如果不能从YouTube站外导流进去的话,想要提高访问量会很不容易。
如果你想在YouTube上取得成功,我们给你的最佳建议是,你应该专注于某个特定群体利益的市场,并尽可能对单个话题制作出长达10分钟或更长的视频。
(本文作者Matt Gielen,曾担任Frederator Networks前副总裁,主管编程和观众发展。 Matt管理团队建立了世界上最大的动画网络——Frederator Networks频道。此外, 他还领导了团队进行YouTube上Frederator Networks运营频道的制作和编程。本篇即为其通过数据研究分析的心得体会。)