首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
机器学习
尤而小屋
创建于2021-05-14
订阅专栏
人工智能、机器学习理论+实战
等 67 人订阅
共114篇文章
创建于2021-05-14
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
零基础入门机器学习:线性回归算法
大家好,我是Peter~ 机器学习有许多不同的算法,每个算法都有其特定的应用场景和优缺点。然而,最简单的机器学习算法可能是线性回归。 线性回归是一种用于预测连续数值输出的监督学习算法,它通过建立一个线
机器学习算法竞赛实战:数据探索
机器学习算法竞赛实战-数据探索 本文是《机器学习算法竞赛实战》的读书笔记2:在进行建模之前如何进行数据探索,了解数据的基本情况。通过系统的探索加深对数据的理解。 数据探索 分析思路是什么 最好使用多种
《机器学习算法竞赛实战》:如何看待机器学习竞赛问题
机器学习算法竞赛实战-竞赛问题建模 更新《机器学习算法竞赛实战》一书的阅读笔记,更多详细的内容请阅读原书。本文的主要内容包含: 竞赛问题的3个主要部分 -如何理解竞赛问题 机器学习的样本选择 如何线下
图解机器学习术语-a系列
大家好,我是Peter~ 最近看到国外一位大神对机器学习知识点绘制的彩图,通过图解的形式来解释一个知识点,比如过拟合、auc、boosting算法等,非常的形象👍,比如: 支持向量机 L2正则化过程
台湾大学李宏毅-图解卷积神经网络CNN
大家好,我是Peter~ 本文记录的是台湾大学李宏毅老师对CNN卷积神经网络的讲解,图解非常易懂。涉及到的知识点: 卷积神经网络如何运用到图片分类问题 感受野 Receptive Field 步长St
逻辑回归:信贷违规预测!
大家好,我是Peter~ 今天给大家带来一篇新的kaggle数据建模文章:信贷违约预测 本文是基于一份Lendingclub上面的信贷数据,根据贷款人的历史数据和贷款信息,建立一个逻辑回归模型来预测借
特征工程:数据归一化和标准化!
大家好,我是Peter~ 今天给大家分享的是关于特征工程的文章:数据的归一化和标准化。 数据的归一化和标准化都是对数据做变换,指通过某种处理方法将待处理的数据限制在一定的范围内或者符合某种分布。 它们
kaggle实战-肿瘤数据统计分析
大家好,我是Peter~ 今天给大家带来的是kaggle上面一份关于肿瘤数据的统计分析,适合初学者快速入门,主要内容包含: 基于直方图的频数统计 基于四分位法的异常点定位分析 描述统计分析 基于累计分
特征工程:独热码
大家好,我是Peter~ 本文给大家介绍一种数据挖掘中常见的特征处理方式:基于独热码的哑变量生成。 哑变量又叫做虚拟变量,虚设变量或者名义变量,是人为设定的用于将分类变量引入回归模型中的方法。 比如学
kaggle实战-用户个性化分析及聚类分群!
大家好,这里是尤而小屋~ 基于一份超市消费数据集的用户个性化分析以及用户细分分群的实现,文章主要是从人、货、促销、地点等4个方面进行分析 原数据集地址: https://www.kaggle.com/
特征工程-特征分箱
特征工程-特征分箱 大家好,我是Peter~ 一般在建立分类模型时,当我们进行特征工程的工作经常需要对连续型变量进行离散化的处理,也就是将连续型字段转成离散型字段。 离散化的过程中,连续型变量重新进行
数学公式编辑神器-Mathpix Snipping Tool
大家好,我是Peter~ 之前在文章LaTeX数学公式、常用符号备忘录中给大家介绍了LaTeX,以及常见公式的编码,最后还分享了一份小册子 编辑常见公式 比如,使用LaTeX我们可以快速编辑下面的公式
德国信贷数据建模baseline!
大家好,我是Peter~ 本文是基于3大树模型对一份德国信贷数据的简单建模,可以作为一份baseline,最后也提出了优化的方向。主要内容包含: 导入库 导入的库用于数据处理、可视化、建模等 数据简介
尤而小屋三周年!
大家好,我是Peter~ 大家好,我是尤而小屋,英文名Yule Cottage,今天我三周岁啦!Happy Birthday to Yule🍰 大家好,我是Peter,今天是尤而小屋成立三周年的日子。
机器学习实战:基于3大分类模型的中风病人预测
大家好,我是Peter~ 今天给大家分享的是kaggle上一个关于中风疾病案例的数据集建模,文章的主要内容参考导图: 原数据地址:https://www.kaggle.com/datasets/fed
机器学习实战:基于MNIST数据集的二分类问题
大家好,我是Peter~ MNIST数据集是一组由美国高中生和人口调查局员工手写的70,000个数字的图片,每张图片上面有代表的数字标记。 这个数据集被广泛使用,被称之为机器学习领域的“Hello W
特征工程系列:特征理解
大家好,我是Peter~ 后面会开始特征工程系列的文章,本文是第一篇:特征理解。 特征理解的作用:告诉你数据集里都有什么? 结构化数据和非结构化数据 定量数据和定性数据 数据的4个等级 探索性数据分析
3大树模型实战乳腺癌预测分类
3大树模型实战乳腺癌分类预测 本文从数据的探索分析出发,经过特征工程和样本均衡性处理,使用决策树、随机森林、梯度提升树对一份女性乳腺癌的数据集进行分析和预测建模。 关键词:相关性、决策树、随机森林、降
机器学习高频使用代码片段
大家好,我是Peter~ 本文记录的是个人高频使用的数据分析和机器学习代码片段,包含的主要内容: pandas设置 可视化 jieba分词 缺失值处理 特征分布 数据归一化 上下采样 回归与分类模型
基于深度学习Keras的深圳租房建模
基于深度学习Keras的深圳租房建模 大家好,我是Peter~ 本文是针对深圳租房数据的第3次分析,文章主要内容: 导入库 数据基本信息 读取数据 形状shape In [3]: Out[3]: 字段
下一页