目标值是离散值

K-金邻

算法核心：距离公式(欧式距离等)。
超参数：K
数据的处理：标准化。
优点：理解简单易于实现。
缺点：

条件独立，才能叫朴素贝叶斯。
概率基础：条件概率和联合概率。
数据的处理：文本特征抽取。
贝叶斯公式。
优点：主要在文本分类上应用，准确率较高，有概率作为理论基础。
缺点：

信息论：信息熵，信息增益，信息熵的大小变化和不确定性相关，不确定性越大则信息熵越大。
分类依据：

优点：准确率高，适用于各种数据，可解释性强。
缺点：容易过拟合，树的建立太大。

一种集成学习方法，由多个同样的分类器组成。
多个决策树组成
建立过程：
优点：准确率高，不会过拟合，对大数据集适用。
超参数：树的深度，多少颗树，通过网格搜索即可。

准确率
精确率和召回率