Spark2.x开发企业级个性化系统
今天先学习Spark2.x开发企业级个性化系统第2章、第4章、第6章、
第8章、第10章、第12章、第14章。(已结)其他时间学习其他章节。
第2章 了解系统的生态
2-1 章难点
2-2 系统的关键元素和思维模式
2-3 算法的主要分类
2-4 系统常见的问题
2-5 系统效果评测

第4章 详解协同过滤算法原理
4-1 章难点
4-2 章作业
4-3 最小二乘法
4-4 梯度下降法
4-5 余弦相似度
4-6 什么是user-based的协同过滤
4-7 Spark实现user-based协同过滤
4-8 什么是item-based协同过滤
4-9 Spark实现item-based协同过滤
4-10 模型的协同过滤
4-11 矩阵分解模型的两种算法:SVD和PMF
4-12 缺失值填充

第6章 系统搭建——需求分析和环境搭建
6-1 章难点
6-2 项目需求分析 技术分解 模块设计
6-3 开发环境搭建
6-4 环境问题 工具问题 版本问题
6-5 环境搭建文档

第8章 系统搭建——数据层
8-1 数据上报(上)
8-2 下
8-3 日志清洗和格式化数据(上)
8-4 中
8-5 下
8-6 分析用户行为和商品属性

第10章 结果存储
10-1 数仓ODS和DWD层搭建
10-2 搭建用户行为日志数据仓库
10-3 利用外部分区表存储用户行为

第12章 关联规则的算法
12-1 Apriori的关联算法
12-2 Spark实现Apriori算法(上)
12-3 下
12-4 FP-Growth的关联算法
12-5 Spark实现FP-Growth算法

第14章 内容的算法
14-1 文本向量化
14-2 Spark实现TF-IDF
14-3 课结

