1.基于内容推荐:
根据物品或内容的元数据,发现物品或内容的相关性,然后基于用户以前的喜好记录推荐给用户相似的物品,更适合“用户焦点比较集中”的使用场景,比如垂直领域的内容推送。如图所示:
首先需要对电影元数据建模,计算相似度(当然,只根据类型是不够的,要得到更好的推荐,我们还可以考虑电影的导演,演员等等),然后根据用户历史观看记录进行推荐(根据物品属性构建向量,判断向量的相似性,推荐物品
优点: 不需要其它用户的数据,没有冷开始问题和稀疏问题 能为具有特殊兴趣爱好的用户进行推荐 能推荐新的或不是很流行的项目,没有新项目问题 通过列出推荐项目的内容特征,可以解释为什么推荐那些项目 已有比较好的技术,如关于分类学习方面的技术已相当成熟
缺点: 要求内容能容易抽取成有意义的特征 要求特征内容有良好的结构性 用户的口味必须能够用内容特征形式来表达 不能显式地得到其它用户的判断情况
2.基于协同过滤的:更适合“给用户带点新鲜的东西”的使用场景
UserCF:找到跟TA喜好最相似的其他用户,然后把这些用户喜欢的商品推给TA
ItemCF:找到跟TA喜好最相似的商品,然后推给TA
优点: 能够过滤难以进行机器自动内容分析的信息,如艺术品,音乐等 共享其他人的经验,避免了内容分析的不完全和不精确,并且能够基于一些复杂的,难以表述 的概念(如信息质量、个人品味)进行过滤 有推荐新信息的能力 能够有效的使用其他相似用户的反馈信息,较少用户的反馈量,加快个性化学习的速度
缺点: 稀疏问题(可以先分别对用户和商品进行聚类) 可扩展问题(Scalability) 新用户问题 质量取决于历史数据 开始数据质量差
3.混合推荐系统