处理流量激增问题

108 阅读2分钟

2019年,Hotstar创造了向2530万名同时在线观众进行直播的全球纪录。都发生了什么?

在印度和新西兰之间的国际刑事法院2019年世界杯半决赛期间,Hotstar创造了向2530万并发观众进行直播的新世界纪录。这比以往任何其他平台所能做到的都要多!

Hotstar是如何实现这一目标的?在这个过程中又发生了什么事情?让我们来看一看。

发生了什么?

在比赛的第2天,当印度开始击球时,人们看到的第一个峰值是从150万到1500万。然后达尼上场击球,流量又突然激增,达到2530万并发用户。但随后Dhoni下场,观众突然从2530万急剧下降到<100万用户。

挑战

第一个挑战是处理2530万并发用户。第二个挑战是当观众决定退出时;他们要么完全退出应用,要么返回主页探索其他内容,导致相应的主页服务的负载突然增加。

Hotstar是如何解决这个问题的?

Hotstar维护了一个名为 "Project Hulk "的内部项目,用于负载测试和代。它测试系统的复原力,并帮助他们找到其突破点。它允许他们用不同的输入来模拟整个用户旅程,也可以模拟整个流量模式,比如这场比赛。

Hotstar没有使用AWS的传统自动扩展,因为它带来了挑战,例如容量不足的错误,这在现场活动中无法处理。此外,有限的步长使其在直播活动中的扩展速度很慢。

所以他们建立了自己的扩展策略。它允许他们在像现场比赛这样的高并发事件之前预热他们的基础设施。此外,它还允许自动主动扩展,有一个缓冲区来处理流量的突然飙升。它还允许次要的自动扩展组作为备份,并在主要的扩展失败的情况下被利用。

此外,为了管理像这样的高并发事件,他们关闭了非关键服务,如推荐、个性化、聊天和表情符号服务,以减少后端服务器的负载。他们还遵循优雅降级的原则,在不影响实际客户的情况下解决错误。这帮助他们在流量高峰期保持稳定。

Hotstar是一个很好的例子,说明如何处理突然的流量高峰。它显示了事先准备和建立一个良好的基础设施的意义,这样你的网站可以处理任何流量负荷。