Download:百度网盘
基于内容的推荐 基于内容推荐的原理是根据用户感兴趣的物品A,找到和A内容信息相近的物品B,从而将B推荐给A。
而提取用户偏好的物品特征是基于内容推荐算法的关键,基于内容的推荐过程是用户喜欢的物品和特征的描述。
物品的特征有属性、描述等,图书的特征是一些文本内容,特征提取可能涉及文本处理相关技术,将文本内容转化为可计算的向量形式,实现对物品的特征建模,应用推荐算法进行内容推荐。
除此之外,还有相似度计算(根据关键词进行相似度计算,常用的算法有TF-IDF)。基于内容的推荐优点是简单有效,推荐结果直观,容易理解,不需要领域知识。不需要用户的历史行为数据,比如对物品的评价等。
TF-IDE算法思想 基于内容的推荐的新闻推荐系统
基于协同过滤的推荐算法 基于用户行为数据设计的推荐算法,称为协同过滤算法。此方法主要根据用户的历史行为,寻找用户或物品的临近集合,以此计算用户对物品的偏好,包括基于领域、图、关联规则、知识的推荐算法,其中最广泛应用的是基于领域的方法,在实践中往往是上述几种方法的混合应用。
而基于领域的推荐算法主要包括两种算法:基于用户的协同过滤算法和基于物品的协同过滤算法,基于物品的协同过滤与计算用户兴趣相似度一致,基于物品的协同推荐需要计算与用户偏好的物品相似的物品。
基于用户的协同过滤算法 基于用户的协同过滤算法为用户推荐兴趣相似的其他用户喜欢的物品。算法的关键是计算两个用户的兴趣相似度。计算用户相似度的方法有3种:余弦相似性、皮尔森系数相关和修正的余弦相似性。算法步骤如下: