以下是按照 算法的核心目的/任务 进行分类的详细整理,涵盖常见应用场景和代表性算法:
1. 预测(Prediction)
目标:根据历史数据推断未来或未知值。
| 子类型 | 场景举例 | 代表算法 |
|---|---|---|
| 回归预测 | 房价预测、销量预估 | 线性回归、XGBoost、LSTM |
| 时间序列预测 | 股票价格、天气预报 | ARIMA、Prophet、Transformer |
| 概率预测 | 事件发生可能性(如违约率) | Logistic回归、贝叶斯网络 |
2. 分类(Classification)
目标:将数据划分到预定义类别。
| 子类型 | 场景举例 | 代表算法 |
|---|---|---|
| 二分类 | 垃圾邮件检测、疾病诊断 | SVM、随机森林、BERT |
| 多分类 | 图像识别(CIFAR-10) | ResNet、LightGBM |
| 多标签分类 | 文本标签(如新闻分类) | 深度神经网络(输出层多神经元) |
3. 聚类(Clustering)
目标:无监督地将相似数据分组。
| 子类型 | 场景举例 | 代表算法 |
|---|---|---|
| 划分聚类 | 用户分群、市场细分 | K-Means、K-Medoids |
| 密度聚类 | 异常检测、地理热点分析 | DBSCAN、OPTICS |
| 层次聚类 | 生物基因分类、文档主题挖掘 | AGNES、BIRCH |
4. 关联规则学习(Association Rule Learning)
目标:发现数据中的频繁模式或关联关系。
| 场景举例 | 代表算法 |
|---|---|
| 购物篮分析(啤酒与尿布) | Apriori、FP-Growth |
| 医疗症状关联分析 | Eclat |
5. 降维(Dimensionality Reduction)
目标:减少数据特征数量,保留关键信息。
| 子类型 | 场景举例 | 代表算法 |
|---|---|---|
| 线性降维 | 数据可视化、特征压缩 | PCA、LDA |
| 非线性降维 | 高维数据(如图像)可视化 | t-SNE、UMAP |
6. 生成(Generation)
目标:创建与训练数据相似的新数据。
| 子类型 | 场景举例 | 代表算法 |
|---|---|---|
| 文本生成 | 聊天机器人、自动写作 | GPT、LSTM |
| 图像生成 | AI绘画、数据增强 | GAN、Diffusion Model |
| 音频生成 | 音乐合成、语音克隆 | WaveNet、Tacotron |
7. 优化(Optimization)
目标:找到最佳解或近似最优解。
| 子类型 | 场景举例 | 代表算法 |
|---|---|---|
| 连续优化 | 参数调优、路径规划 | 梯度下降、遗传算法 |
| 组合优化 | 排班调度、旅行商问题 | 模拟退火、蚁群算法 |
8. 强化学习任务(Reinforcement Learning)
目标:通过环境交互学习最优策略。
| 子类型 | 场景举例 | 代表算法 |
|---|---|---|
| 策略学习 | 游戏AI、机器人控制 | PPO、DQN |
| 多智能体学习 | 自动驾驶协作、博弈模拟 | MADDPG |
9. 异常检测(Anomaly Detection)
目标:识别数据中的异常点或模式。
| 场景举例 | 代表算法 |
|---|---|
| 金融欺诈检测 | Isolation Forest、One-Class SVM |
| 工业设备故障预警 | Autoencoder、LOF |
10. 推荐(Recommendation)
目标:为用户推荐个性化内容。
| 子类型 | 场景举例 | 代表算法 |
|---|---|---|
| 协同过滤 | 电商商品推荐 | User-CF、Item-CF |
| 深度学习推荐 | 视频平台内容推荐 | Wide & Deep、YouTube DNN |
分类逻辑总结
- 任务驱动:根据实际需求选择算法类型(如预测选回归,分组选聚类)。
- 数据形态:结构化数据常用传统算法(如XGBoost),非结构化数据(如图像)多用深度学习。
- 有无标注:监督学习(分类/回归)需标注数据,无监督学习(聚类)直接挖掘模式。