首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
scikit-learn
databook
创建于2023-09-22
订阅专栏
scikit-learn库的基本使用方法
等 20 人订阅
共62篇文章
创建于2023-09-22
订阅专栏
默认顺序
默认顺序
最早发布
最新发布
线性模型与多分类问题:简单高效的力量
在机器学习的世界里,分类问题无处不在,而多分类问题更是其中的常见挑战。 无论是识别手写数字、分类新闻主题,还是预测客户购买的产品类别,多分类问题都扮演着重要角色。 线性模型,以其简洁高效的特点,成为了
线性判别分析(LDA):降维与分类的完美结合
在机器学习领域,线性判别分析(Linear Discriminant Analysis,简称LDA)是一种经典的算法,它在降维和分类任务中都表现出色。 LDA通过寻找特征空间中能够最大化类间方差和最小
直线思维的进化:线性到广义线性
在数据科学领域,线性模型和广义线性模型是两种基础且重要的统计工具, 它们被广泛应用于各种预测和分析任务中,从简单的回归问题到复杂的分类场景。 今天,让我们深入探讨这两种模型,了解它们的原理、区别以及实
比较检验:找出最佳机器学习模型
在机器学习领域,我们常常需要在多个模型之间进行比较,以选择最适合特定任务的模型。 模型比较检验为此提供了科学的依据和方法。 本文将探讨比较检验的概念、方法、区别与适用范围,并结合scikit-lear
模型的泛化性能度量:方法、比较与实现
在机器学习领域,模型的泛化性能度量是评估模型在未知数据上表现的关键环节。 通过合理的性能度量,不仅能了解模型的优劣,还能为模型的优化和选择提供科学依据。 本文将深入探讨泛化性能度量的重要性、各种度量方
掌握机器学习数据集划分
在机器学习的流程中,数据集的合理划分是模型训练与评估的关键前提。 恰当的划分方式不仅能有效利用数据资源,还能确保模型评估结果的可靠性,为模型的泛化能力提供有力保障。 本文将深入介绍3种常见的数据集划分
scikit-learn中的Pipeline:构建高效、可维护的机器学习流程
我们使用scikit-learn进行机器学习的模型训练时,用到的数据和算法参数会根据具体的情况相应调整变化, 但是,整个模型训练的流程其实大同小异,一般都是加载数据,数据预处理,特征选择,模型训练等几
sklearn基础--『分类模型评估』之模型持久化
模型持久化(模型保存与加载)是机器学习完成的最后一步。因为,在实际情况中,训练一个模型可能会非常耗时,如果每次需要使用模型时都要重新训练,这无疑会浪费大量的计算资源和时间。 通过将训练好的模型持久化到
sklearn基础--『分类模型评估』之评估报告
分类模型评估时,scikit-learn提供了混淆矩阵和分类报告是两个非常实用且常用的工具。它们为我们提供了详细的信息,帮助我们了解模型的优缺点,从而进一步优化模型。 这两个工具之所以单独出来介绍,是
sklearn基础--『分类模型评估』之系数分析
前面两篇介绍了分类模型评估的两类方法,准确率分析和损失分析,本篇介绍的杰卡德相似系数和马修斯相关系数为我们提供了不同的角度来观察模型的性能,尤其在不平衡数据场景中,它们更能体现出其独特的价值。 接下来
sklearn基础--『分类模型评估』之损失分析
分类模型评估中,通过各类损失(loss)函数的分析,可以衡量模型预测结果与真实值之间的差异。不同的损失函数可用于不同类型的分类问题,以便更好地评估模型的性能。 本篇将介绍分类模型评估中常用的几种损失计
sklearn基础--『分类模型评估』之准确率分析
分类模型的评估和回归模型的评估侧重点不一样,回归模型一般针对连续型的数据,而分类模型一般针对的是离散的数据。 所以,评估分类模型时,评估指标与回归模型也很不一样,比如,分类模型的评估指标通常包括准确率
sklearn基础--『回归模型评估』之评估可视化
在scikit-learn中,回归模型的可视化评估是一个重要环节。它帮助我们理解模型的性能,分析模型的预测能力,以及检查模型是否存在潜在的问题。通过可视化评估,我们可以更直观地了解回归模型的效果,而不
sklearn基础--『回归模型评估』之偏差分析
模型评估在统计学和机器学习中具有至关重要,它帮助我们主要目标是量化模型预测新数据的能力。 本篇主要介绍模型评估时,如何利用scikit-learn帮助我们快速进行各种偏差的分析。 1. R² 分数 R
sklearn基础--『回归模型评估』之误差分析
模型评估在统计学和机器学习中具有至关重要,它帮助我们主要目标是量化模型预测新数据的能力。 在这个数据充斥的时代,没有评估的模型就如同盲人摸象,可能带来误导和误判。模型评估不仅是一种方法,更是一种保障,
sklearn基础--『无监督学习』之空间聚类
空间聚类算法是数据挖掘和机器学习领域中的一种重要技术。 本篇介绍的基于密度的空间聚类算法的概念可以追溯到1990年代初期。随着数据量的增长和数据维度的增加,基于密度的算法逐渐引起了研究者的关注。其中,
sklearn基础--『无监督学习』之谱聚类
谱聚类算法基于图论,它的起源可以追溯到早期的图分割文献。不过,直至近年来,受益于计算机计算能力的提升,谱聚类算法才得到了广泛的研究和关注。 谱聚类被广泛应用于图像分割、社交网络分析、推荐系统、文本聚类
sklearn基础--『无监督学习』之层次聚类
层次聚类算法是机器学习中常用的一种无监督学习算法,它用于将数据分为多个类别或层次。该方法在计算机科学、生物学、社会学等多个领域都有广泛应用。 层次聚类算法的历史可以追溯到上世纪60年代,当时它主要被用
sklearn基础--『无监督学习』之均值聚类
聚类算法属于无监督学习,其中最常见的是均值聚类,scikit-learn中,有两种常用的均值聚类算法:一种是有名的K-means(也就是K-均值)聚类算法,这个算法几乎是学习聚类必会提到的算法;另一个
sklearn基础--『监督学习』之支持向量机分类
支持向量机也是一种既可以处理分类问题,也可以处理回归问题的算法。关于支持向量机在回归问题上的应用,请参考:sklearn基础--『监督学习』之支持向量机回归 支持向量机分类广泛应用于图像识别、文本分类
下一页