LinkedIn开源了Greykite,这是一个Python库,承诺以可解释的方式提供准确的未来预测,允许对趋势、季节性和其他影响进行可视化。为了灵活、直观和快速,LinkedIn团队证明了它的表现比FB的预测好4倍,为1天和7天的预测提供更准确的结果。
它用Python编写,提供了可用于短期和长期预测的机制。由于其快速、准确和直观的特性;Silverkite,该库的主要算法适用于大规模的互动和自动预测。时间序列预测可以提供对指标和其他可随时间测量的数量的未来预期。
这些模型允许企业从任何角度对未来进行优化和更好的准备。
例如,在LinkedIn的案例中,它被用于资源规划、绩效管理、优化和生态系统的洞察力生成。更具体地说,它在LinkedIn使用的几个场景。
- 提供足够的基础设施来处理峰值流量。
- 设定业务指标,跟踪运营成功的进展。
- 通过预测各种市场的增长来优化预算决策。
- 了解哪些国家在经历了像COVID-19大流行病这样的冲击后恢复得更快或更慢。
在预测的帮助下,LinkedIn的网站可靠性工程(SRE)团队以成本效益的方式确保网站的可用性:他们预测下一年的峰值分钟级QPS(每秒查询次数)和服务服务QPS,以便提供足够的容量,而不需要过多的缓冲和成本。对未来流量更准确的洞察力,与仔细的站点容量测量相印证,使得决策充满信心。每一个微小的成本节约都会转化为总成本的减少,精确的预测会产生巨大的商业影响。
预测的应用也可以在LinkedIn的营销解决方案中找到,预算、点击量、收入和其他指标的短期预测被纳入健康仪表板,帮助指出潜在的问题。预测表明任何偏差,并提供关于哪个指标维度或相关指标可能有助于解释异常的背景。长期预测允许指标目标的设定和常规检查,以确保他们在实现这些目标的轨道上。
输出是可解释的,允许对趋势、季节性和其他影响以及它们的统计意义进行可视化。Silverkite算法在具有(潜在的时间变化)趋势和季节性、重复事件/假期和/或短程效应的时间序列上运行良好。在LinkedIn,它被成功地应用于不同时间频率(每小时、每天、每周等)的各种指标,以及各种预测范围,例如,提前1天(短期)或提前1年(长期)。
一些关键的好处。
- 灵活: 为趋势、季节性、假期、变化点和自回归提供时间序列回归器。
- 直观: 提供探索性的图表,调整的模板,以及有明确假设的可解释预测。
- 快速: 允许快速的原型设计和规模部署。
Greykite的开发团队进行了一项基准测试,结论是Silverkite的开箱配置与Auto-Arima和Prophet相比,在1天和7天的预测范围内表现更好。就平均运行时间而言,Greykite和Auto-Arima的表现都比Prophet快4倍(从LinkedIn发布的下一个表格中可以看出
除了Silverkite,Greykite还支持Facebook Prophet,并计划在未来启用其他开源算法。
LinkedIn对Greykite的开源为任何想为未来做更好准备的人提供了一个工具。这延续了迄今为止发布的一系列工具:Dagli,一个Java的ML库;Lift,一个测量AI模型公平性的库;GDMix,一个训练AI个性化模型的框架;Ambry,一个媒体文件的对象存储和其他。Greykite在GitHub和PyPI上提供。
Greykite承诺在短期和长期范围内提供准确的未来预测。