首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
酱72268
掘友等级
学生
机器学习,深度学习
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
50
文章 50
沸点 0
赞
50
返回
|
搜索文章
最新
热门
学习笔记(5.5)
1、最常用的求解方法有两种:批量梯度下降法(batch gradient descent), 正规方程方法(normal equations)。 前者是一种通过迭代求得的数值解,后者是一种通过的公式一步到位求得的解析解。在特征个数不太多的情况下,后者的速度较快,一旦特征的个数成…
学习笔记(5.4)
1、用平均值、中值、分位数、众数、随机值等替代。效果一般,因为等于人为增加了噪声
学习笔记(5.3)
余弦相似度衡量的是维度间取值方向的一致性,注重维度之间的差异,不注重数值上的差异,而欧氏度量的正是数值上的差异性。
学习笔记(5.2)
1、升维往往能让数据直接的关系更加清楚,更易于找到规律。其次,也是更重要的,分箱之后可以让无序数据之间关系更加正确。 Object 数据类型可以指向任意数据类型的数据,包括您的应用程序识别的任意对象实例。当您在编译时不知道变量可能指向哪种数据类型时,请使用 Object。
学习笔记(5.1)
2、离散化:将定量数据向定性数据转化。比如一系列连续数据,可用标签进行替换(0,1)
学习笔记(4.30)
遇到问题:暂无学习内容1、astype(int)将数据类型变为整数类型2、通过DataFrame或Series的apply方法调用:pd.to_datetime或pd.to_numeric;objec
学习笔记(4.29)
如果该列是字符串的,就将该列中出现次数最多的字符串赋予空值,mode()函数就是取出现次数最多的元素。 使用后一个数值替代空值或者NA,limit=1就是限制如果几个连续的空值,只能最近的一个空值可以被填充。 将缺失值全部用该列的平均值代替,这个时候一般已经提前将字符串特征转换…
学习笔记(4.28)
2、处理缺失数据时,比如该列都是字符串,不是数值,可以将出现次数最多的字符串填充缺失值。
学习笔记(4.27)
遇到问题:暂无学习内容1、查看缺失值2、特征值类型为分类变量(object),需要将该特征值(除了因变量Y)变为多列(onehotencode),才能参与到建模当中3、使用平均值进行填充缺失值,相当于
学习笔记(4.26)
1、倾斜数值特征通过函数log(feature + 1) ,这样使得特征更加标准正规,有利于建立更加好模型。
下一页
个人成就
文章被点赞
49
文章被阅读
14,278
掘力值
627
关注了
16
关注者
2
收藏集
0
关注标签
5
加入于
2019-03-21