首页
沸点
课程
AI Coding
数据标注
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
Applied Machine Learning
hzh0921
创建于2022-11-21
订阅专栏
学习在线课程《 CPSC 330: Applied Machine Learning at the University of British Columbia 》笔记总结
暂无订阅
共6篇文章
创建于2022-11-21
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
Lecture 07 (1): 缺失值处理、数值型特征的缩放
本次课程依旧使用人口普查数据, 上次课中,当我们对类别型变量编码的时候,就发现某些列中有?(问号),这是因为此数据集中,空缺用?填充,本节会学习处理这种缺失值以及如何对数值型特征缩放,从而提高模型效果
Lecture 06 下: encoding categorical variables 编码类别型变量
数据集 (成人普查数据预测收入) 本次使用的也是一个经典的数据集,成人普查数据从而预测收入。 借用此数据集学习类别型变量如何编码
Lecture 06 上: overfitting the validation set
本节课讲师依旧使用IMDB数据集为例 一开始提出了问题:既然cross validation也是评估模型在unseen data上的效果,为何不在整个数据集上做cross-validation呢?
Lecture 05 supplement: sklearn调参三大方法
本节课,讲师介绍了三种在sklearn中可以使用的自动调参方法, 分别是grid search、random search 和更高级的贝叶斯调参。 数据集依然是IMDB电影评论。
Lecture 05: pipelines 如何使用sklearn中的pipeline
在上次课中,代码中没有使用cross validation,原因是cross validation涉及splitting,而它会违反golden rule。本次会介绍pipeline来解决该问题
lecture04- logistic regression, word counts, predict_proba
本次课讲师用了IMDB电影评论数据,我们需要根据review字段(文本)预测该评论是positive还是negative的评论,所以需要先想办法将文本转换为可用的数字格式