逻辑回归|ML算法

缓缓飘落的枫叶像思念_

2023-04-23 197 阅读2分钟

Logistic回归是机器学习中常用的分类算法，用于预测一个事件发生的概率。它是一种有监督的学习算法，当因变量（我们试图预测的结果）是二进制（即，有两种可能的结果）时，就会使用这种算法。

以下是建立逻辑回归模型的基本步骤：

收集数据：第一步是收集带有因变量（y）和一个或多个自变量（x）的数据。
将数据可视化：必须将数据可视化，以了解自变量和因变量之间是否存在关系。这可以使用散点图或其他可视化技术来完成。
分割数据：将数据分成训练集和测试集。这是为了确保模型不会过度拟合训练数据，并能很好地归纳到新数据。
选择一个模型：选择一个最适合数据的逻辑回归模型。这涉及到为模型参数（权重）找到最佳值，使观察数据的可能性最大化。
训练模型：在训练数据上训练模型。这包括为模型参数找到最佳值，使预测值和实际值之间的误差最小。
评估模型：在测试数据上评估模型，看它对新数据的概括能力如何。这可以通过计算各种性能指标来完成，如准确率、精确度、召回率和F1得分。
使用该模型：一旦对模型进行了评估，就可以用它来对新数据进行预测。

在使用逻辑回归时要记住的一些关键概念包括：

Logistic函数，也被称为sigmoid函数，用于将任何实值数字映射为0和1之间的概率值。
逻辑回归模型估计的是在自变量值的情况下，因变量等于1的概率。
模型参数（权重）是用最大似然估计法来估计的，这涉及到找到观察数据的最大似然值。
Logistic回归假定自变量和因变量的对数之间存在线性关系。