Machine Learning（机器学习）之三要尝试分类，一种方法是使用线性回归并将大于0.5的所有预测映射为1，将所

Machine Learning（机器学习）之二：juejin.cn/post/684490…

分类问题

要尝试分类，一种方法是使用线性回归并将大于0.5的所有预测映射为1，将所有小于0.5的预测映射为0.但是，此方法不能很好地工作，因为分类实际上不是线性函数。

分类问题就像回归问题一样，除了我们现在想要预测的值只占用少量离散值。现在，我们将重点关注二进制分类问题，其中y只能处理两个值0和1.（我们在这里所说的大多数也将推广到多类情况。）例如，如果我们正在尝试为电子邮件构建垃圾邮件分类器X （i ），如果是一封垃圾邮件，则y可能为1，否则为0。因此，y∈{0,1}。0也称为负类，1表示正类，它们有时也用符号“ - ”和“+”表示。X（i ），相应的Y（i ）也称为训练范例的标签。

假设函数的表达式

我们可以忽略y是离散值的事实来处理分类问题，并使用我们的旧线性回归算法来尝试预测给定x。但是这种方法的效果非常差。

直观地说，当y∈{0,1}时，h θ(x) 取大于1或小于0的值没有什么意义。要解决这个问题，让我们改变假设函数的形式 hθ(x)让它满足