首页
首页
沸点
课程
直播
活动
竞赛
商城
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
百面机器学习
用户4131273490606
创建于2023-02-12
订阅专栏
百面机器学习
暂无订阅
共5篇文章
创建于2023-02-12
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
02 类别型特征
场景描述 类别型特征(Categorical Feature)主要是指性别(男、女)、血型(A、B、AB、O)等只在有限选项内取值的特征。类别型特征原始输入通常是字符串形式,除了决策树等少数模型能直接
03 高维组合特征的处理
知识点 组合特征 问题 什么是组合特征?如何处理高维组合特征? 分析与解答 为了提高复杂关系的拟合能力,在特征工程中经常会把一阶离散特征两两组合,构成高阶组合特征。以广告点击预估问题为例,原始数据有语
04 组合特征
场景描述 上一节介绍了如何利用降维方法来减少两个高维特征组合后需要学习的参数。但是在很多实际问题中,我们常常需要面对多种高维特征。如果简单地两两组合,依然容易存在参数过多、过拟合等问题,而且并不是所有
05 文本表示模型
场景描述 文本是一类非常重要的非结构化数据,如何表示文本数据一直是机器学习领域的一个重要方向。 知识点 词袋模型(Bag of Words),TF-IDF(Term Frequency-Inverse
01 特征归一化
为了消除数据特征之间的纲量影响,我们需要对特征进行归一化处理,使得不同指标之间具有可比性。例如,分析一个人的身高和体重对健康的影响,如果使用(米)和千克(kg)作为单位,那么身高特征会在1.6 ~ 1