scikit-learn

scikit-learn

scikit-learn

scikit-learn库的基本使用方法

等 26 人订阅共67篇文章创建于2023-09-22

sklearn基础--『无监督学习』之空间聚类

空间聚类算法是数据挖掘和机器学习领域中的一种重要技术。本篇介绍的基于密度的空间聚类算法的概念可以追溯到1990年代初期。随着数据量的增长和数据维度的增加，基于密度的算法逐渐引起了研究者的关注。其中，

2年前
333
点赞
评论

sklearn基础--『无监督学习』之空间聚类

sklearn基础--『无监督学习』之谱聚类

谱聚类算法基于图论，它的起源可以追溯到早期的图分割文献。不过，直至近年来，受益于计算机计算能力的提升，谱聚类算法才得到了广泛的研究和关注。谱聚类被广泛应用于图像分割、社交网络分析、推荐系统、文本聚类

2年前
546
点赞
评论

sklearn基础--『无监督学习』之谱聚类

sklearn基础--『无监督学习』之层次聚类

层次聚类算法是机器学习中常用的一种无监督学习算法，它用于将数据分为多个类别或层次。该方法在计算机科学、生物学、社会学等多个领域都有广泛应用。层次聚类算法的历史可以追溯到上世纪60年代，当时它主要被用

2年前
581
点赞
评论

sklearn基础--『无监督学习』之层次聚类

sklearn基础--『无监督学习』之均值聚类

聚类算法属于无监督学习，其中最常见的是均值聚类，scikit-learn中，有两种常用的均值聚类算法：一种是有名的K-means（也就是K-均值）聚类算法，这个算法几乎是学习聚类必会提到的算法；另一个

2年前
343
点赞
评论

sklearn基础--『无监督学习』之均值聚类

sklearn基础--『监督学习』之支持向量机分类

支持向量机也是一种既可以处理分类问题，也可以处理回归问题的算法。关于支持向量机在回归问题上的应用，请参考：sklearn基础--『监督学习』之支持向量机回归支持向量机分类广泛应用于图像识别、文本分类

2年前
239
点赞
评论

sklearn基础--『监督学习』之支持向量机分类

sklearn基础--『监督学习』之随机森林分类

随机森林分类算法是一种基于集成学习（ensemble learning）的机器学习算法，它的基本原理是通过对多个决策树的预测结果进行平均或投票，以产生最终的分类结果。随机森林算法可用于回归和分类问题

2年前
685
点赞
评论

sklearn基础--『监督学习』之随机森林分类

sklearn基础--『监督学习』之决策树分类

决策树分类算法是一种监督学习算法，它的基本原理是将数据集通过一系列的问题进行拆分，这些问题被视为决策树的叶子节点和内部节点。决策树的每个分支代表一个可能的决策结果，而每个叶子节点代表一个最终的分类结果

2年前
313
3
评论

sklearn基础--『监督学习』之决策树分类

sklearn基础--『监督学习』之贝叶斯分类

贝叶斯分类是一种统计学分类方法，基于贝叶斯定理，对给定的数据集进行分类。它的历史可以追溯到18世纪，当时英国统计学家托马斯·贝叶斯发展了贝叶斯定理，这个定理为统计决策提供了理论基础。不过，贝叶斯分类

2年前
267
点赞
评论

sklearn基础--『监督学习』之贝叶斯分类

sklearn基础--『监督学习』之逻辑回归分类

逻辑回归这个算法的名称有一定的误导性。虽然它的名称中有“回归”，当它在机器学习中不是回归算法，而是分类算法。因为采用了与回归类似的思想来解决分类问题，所以它的名称才会是逻辑回归。逻辑回归的思想可以追

2年前
325
3
评论

sklearn基础--『监督学习』之逻辑回归分类

sklearn基础--『监督学习』之K-近邻分类

KNN（K-近邻），全称K-Nearest Neighbors，是一种常用的分类算法。KNN算法的历史可以追溯到1957年，当时Cover和Hart提出了“最近邻分类”的概念。但是，这个算法真正得到广

2年前
425
点赞
评论

sklearn基础--『监督学习』之K-近邻分类

sklearn基础--『监督学习』之随机森林回归

随机森林回归（Random Forest Regression）是一种在机器学习领域广泛应用的算法，由美国科学家 Leo Breiman 在2001年提出。它是一种集成学习方法，通过整合多个决策树的预

2年前
2.5k
点赞
评论

sklearn基础--『监督学习』之随机森林回归

sklearn基础--『监督学习』之决策树回归

决策树算法是一种既可以用于分类，也可以用于回归的算法。决策树回归是通过对输入特征的不断划分来建立一棵决策树，每一步划分都基于当前数据集的最优划分特征。它的目标是最小化总体误差或最大化预测精度，其构建

2年前
1.0k
点赞
评论

sklearn基础--『监督学习』之决策树回归

sklearn基础--『监督学习』之支持向量机回归

在机器学习中，支持向量机（Support Vector Machine）算法既可以用于回归问题，也可以用于分类问题。支持向量机（SVM）算法的历史可以追溯到1963年，当时前苏联统计学家弗拉基米尔·

2年前
277
点赞
评论

sklearn基础--『监督学习』之支持向量机回归

sklearn基础--『监督学习』之LASSO回归

LASSO（Least Absolute Shrinkage and Selection Operator）回归模型一般都是用英文缩写表示，硬要翻译的话，可翻译为最小绝对收缩和选择算子。它是一种线

2年前
395
点赞
评论

sklearn基础--『监督学习』之LASSO回归

sklearn基础--『监督学习』之岭回归

岭回归（Ridge Regression）是一种用于处理共线性数据的线性回归改进方法。和上一篇用基于最小二乘法的线性回归相比，它通过放弃最小二乘的无偏性，以损失部分信息、降低精度为代价来获得更实际和可

2年前
572
点赞
评论

sklearn基础--『监督学习』之岭回归

sklearn基础--『监督学习』之线性回归

线性回归是一种用于连续型分布预测的机器学习算法。其基本思想是通过拟合一个线性函数来最小化样本数据和预测函数之间的误差。概述常见的线性回归模型就是：$f(x) = w_0+w_1x_1+w_2x_2

2年前
286
点赞
评论

sklearn基础--『监督学习』之线性回归

sklearn基础--『预处理』之缺失值处理

数据的预处理是数据分析，或者机器学习训练前的重要步骤。通过数据预处理，可以提高数据质量，处理数据的缺失值、异常值和重复值等问题，增加数据的准确性和可靠性整合不同数据，数据的来源和结构可能多种多样，

2年前
447
点赞
评论

sklearn基础--『预处理』之缺失值处理

sklearn基础--『预处理』之离散化

数据的预处理是数据分析，或者机器学习训练前的重要步骤。通过数据预处理，可以提高数据质量，处理数据的缺失值、异常值和重复值等问题，增加数据的准确性和可靠性整合不同数据，数据的来源和结构可能多种多样，

2年前
609
点赞
评论

sklearn基础--『预处理』之离散化

sklearn基础--『预处理』之分类编码

数据的预处理是数据分析，或者机器学习训练前的重要步骤。通过数据预处理，可以提高数据质量，处理数据的缺失值、异常值和重复值等问题，增加数据的准确性和可靠性整合不同数据，数据的来源和结构可能多种多样，

2年前
489
2
评论

sklearn基础--『预处理』之分类编码

sklearn基础--『预处理』之正则化

数据的预处理是数据分析，或者机器学习训练前的重要步骤。通过数据预处理，可以提高数据质量，处理数据的缺失值、异常值和重复值等问题，增加数据的准确性和可靠性整合不同数据，数据的来源和结构可能多种多样，

2年前
1.3k
2
评论

sklearn基础--『预处理』之正则化