机器学习期末总结

224 阅读1分钟
  • 数据探索

    • 利用箱型图分析数值范围 查看异常值
    • 填充异常值
    • 计算相关性系数,设置阈值去除相关性系数较大的属性
    • 卡方检验
  • 特征工程

    • 数据归一化
    • 数据降维
    • 切分数据集,验证集
  • 模型选择

  • 模型评估

    • 过拟合(模型复杂,正则化)

    • 欠拟合(模型简单)

    • 交叉验证

    • 网格搜索

    • 模型融合