机器学习解决的3大问题:分类、回归、聚类

56 阅读2分钟

分类

在数据当中,找到目标分析数据与有限的结果数据之间的映射关系。
将数据集中的对象分配到预定义类别中。
核心算法:逻辑回归、随机森林、决策树(基于树结构的分类算法)

业务场景学习数据分类标签
B端-库存预警当前库存、近一段时间销量、采购周期预警、不预警
B端-是否放贷近期收入、累积债务、当下存款放贷、不放贷
C端-用户价值标签累计消费金额、客单价、最近一次活跃时间重要发展、重要保持、重要流失、非重要发展。。。

用数学角度来讲,分类学习目标是离散化的,没有办法在坐标系中找到明确规律。

任何预警问题都可以归成分类问题。C端很多要用到RFM模型分析。

回归

对禹一事件,进行数据的相对精准的预测 核心算法:线性回归

业务场景学习数据分类标签
B端-销量预测历史每年的销量数据销量
B端-放贷额度历史人工放贷数据、对应利率、银行放贷金额池房贷额度
C端-活跃用户预估历史不同时间的活跃用户、当日新增用户、前一日累积用户活跃用户数

用数学角度来讲,回归学习目标是可以在坐标系中找到明确规律,在坐标系中是连续值。

聚类

聚类算法一般很少单独应用,会配合其他算法使用。 对于一事件,进行数据的相对标准的预测。 核心算法:k-means、支持向量机(基于核函数的分类算法)

业务场景使用算法
B端-线性分配偏好k-means
B端-订单指派骑手持向量机
C端-基于用户的相识推荐

聚类算法:适合于无监督学习场景,可以帮助我们发现数据中的隐藏模式和结构。比如,在市场营销领域,对大量的顾客数据进行分析,识别出不同的消费群体并制定个性化营销策略。

分类算法:适用于有监督学习场景,可以帮助我们根据已有的标记数据进行预测和分类。比如,在医疗诊断中,对患者的症状和检测结果进行分析,辅助医生做正确的诊断和治疗决策。

下一篇可以对每种算法再深入研究及进行对比。