Quora 构建推荐系统的十大经验

941
原文链接: mp.weixin.qq.com

Xavier Amatriain,Quora工程VP。一起来看看他分享的Quora推荐系统(recommender systems,下面也会简写为recsys)构建经验。

Quora的使命


查看图片

Quora的数据情况


查看图片

大量高质量文本信息

查看图片

大量的数据关联

查看图片

Quora的推荐系统


查看图片

在Quora,很多地方都会用到推荐。

查看图片

模型

查看图片

从推荐系统构建过程中学到的经验


  1. implicit signals beat explicit ones (almost always)

查看图片

查看图片

(注:显式信号指的是直接收集的反馈,比如让用户打分,或者点反对/支持。隐式信号指的是通过用户行为分析出的信息,比如根据用户日志来分析。)

查看图片

查看图片

2.be thoughtful about your training data

查看图片

查看图片

3. your model will learn what you teach it to learn

查看图片

查看图片

查看图片

4.explanations might matter more than the prediction

查看图片

查看图片

5. if you have to pick one single approach, matrix factorization is your best bet

查看图片

查看图片

6. everything is an ensemble

查看图片

查看图片

查看图片

查看图片

7. building recommender systems is also about feature engineering

查看图片

查看图片

查看图片

查看图片

查看图片

8. why you should care about answering questions (about your recsys)

查看图片

查看图片

查看图片

9. Data and models are great. You know what's even better? The right evaluation approach!

查看图片

查看图片

查看图片

查看图片

10. You don’t need to distribute your recsys

查看图片

(一定要分布式吗?不见得)

查看图片

查看图片

结论


查看图片

幻灯片链接:http://www.slideshare.net/xamat/recsys-2016-tutorial-lessons-learned-from-building-reallife-recommender-systems

(完)

近期热文


消灭小黄图的大宝剑 | X 次元口袋

Yahoo开源大规模Pub-Sub消息系统Pulsar

YouTube基于深度神经网络的推荐系统

标记-清除垃圾回收算法详解

推荐10篇架构、大数据方面的干货