分类
在数据当中,找到目标分析数据与有限的结果数据之间的映射关系。
将数据集中的对象分配到预定义类别中。
核心算法:逻辑回归、随机森林、决策树(基于树结构的分类算法)
业务场景 | 学习数据 | 分类标签 |
---|---|---|
B端-库存预警 | 当前库存、近一段时间销量、采购周期 | 预警、不预警 |
B端-是否放贷 | 近期收入、累积债务、当下存款 | 放贷、不放贷 |
C端-用户价值标签 | 累计消费金额、客单价、最近一次活跃时间 | 重要发展、重要保持、重要流失、非重要发展。。。 |
用数学角度来讲,分类学习目标是离散化的,没有办法在坐标系中找到明确规律。
任何预警问题都可以归成分类问题。C端很多要用到RFM模型分析。
回归
对禹一事件,进行数据的相对精准的预测 核心算法:线性回归
业务场景 | 学习数据 | 分类标签 |
---|---|---|
B端-销量预测 | 历史每年的销量数据 | 销量 |
B端-放贷额度 | 历史人工放贷数据、对应利率、银行放贷金额池 | 房贷额度 |
C端-活跃用户预估 | 历史不同时间的活跃用户、当日新增用户、前一日累积用户 | 活跃用户数 |
用数学角度来讲,回归学习目标是可以在坐标系中找到明确规律,在坐标系中是连续值。
聚类
聚类算法一般很少单独应用,会配合其他算法使用。 对于一事件,进行数据的相对标准的预测。 核心算法:k-means、支持向量机(基于核函数的分类算法)
业务场景 | 使用算法 |
---|---|
B端-线性分配偏好 | k-means |
B端-订单指派骑手 | 持向量机 |
C端-基于用户的相识推荐 |
聚类算法:适合于无监督学习场景,可以帮助我们发现数据中的隐藏模式和结构。比如,在市场营销领域,对大量的顾客数据进行分析,识别出不同的消费群体并制定个性化营销策略。
分类算法:适用于有监督学习场景,可以帮助我们根据已有的标记数据进行预测和分类。比如,在医疗诊断中,对患者的症状和检测结果进行分析,辅助医生做正确的诊断和治疗决策。
下一篇可以对每种算法再深入研究及进行对比。