逻辑回归数据为什么要离散化?

141 阅读1分钟

1、引入非线性,逻辑回归本质上还是广义上的线性函数,表达能力有限,经过离散化后,每个变量有单独的权重,这相当于引入了非线性,能够提升模型的表达能力,加大拟合。

2、模型对稀疏向量趋之若鹜,离散后向量更加稀疏运算速度快,也更加方便存储扩展

3、更具有鲁棒性,如果age>30为1否则为0,对于年龄200的模型也不会太过于惊讶

4、离散后特征方便进行交叉,提升表达能力,由 M+N 个变量编程 M*N 个变量,进一步引入非线形,提升了表达能力;

如有不足欢迎补充~