机器学习技术备忘录机器学习技术术语解释监督学习 (Supervised Machine Learning) 无监督学习

监督学习 (Supervised Machine Learning)

线性回归 (Linear Regression)

一种用于预测连续变量的回归分析方法，通过拟合一条直线来最小化预测值和实际值之间的误差。

广义线性模型 (Generalised Linear Models)

扩展线性回归模型，使其适用于各种类型的响应变量，包括二元和多元分类问题。

高斯判别分析 (Gaussian Discriminant Analysis)

一种基于贝叶斯定理的分类方法，通过假设数据服从高斯分布来进行分类。

基于树的和集成方法 (Tree Based & Ensemble Methods)

包括决策树、随机森林和梯度提升等方法，通过组合多个模型来提高预测性能和稳定性。

无监督学习 (Unsupervised Machine Learning)

主成分分析 (PCA)

一种降维技术，用于减少数据集的维度，同时尽可能保留数据的方差信息。

K-means 聚类 (K-means Clustering)

一种将数据点分成K个簇的聚类算法，通过最小化簇内的平方误差来确定簇的中心。

层次聚类 (Hierarchical Clustering)

一种构建层次树状结构的聚类方法，通过逐步合并或分裂数据点来形成层次结构。

期望最大化 (Expectation Maximization)

一种迭代算法，用于寻找具有隐变量的概率模型的参数，通过交替进行期望步骤和最大化步骤来优化参数。

聚类评估指标 (Clustering Evaluation Metrics)

用于评估聚类效果的指标，如轮廓系数和调整兰德指数，帮助判断聚类的质量。

深度学习 (Deep Learning)

神经网络 (Neural Networks)

模仿人脑结构的计算模型，由多个层级的神经元组成，用于处理复杂的模式识别和分类任务。

卷积神经网络 (Convolutional Neural Networks)

专门用于处理图像数据的神经网络，通过卷积层提取图像特征，广泛应用于计算机视觉领域。

递归神经网络 (Recurrent Neural Networks)

适用于处理序列数据的神经网络，通过循环连接的方式捕捉数据的时间依赖关系，常用于自然语言处理和时间序列预测。

强化学习与控制 (Reinforcement Learning & Control)

通过与环境交互来学习最佳策略的学习方法，广泛应用于机器人控制和游戏AI等领域。

机器学习技巧与窍门 (ML Tips & Tricks)

模型选择 (Model Selection)

选择最适合特定任务的模型，考虑模型的复杂度、性能和适用性等因素。

模型评估 (Model Evaluation)

评估模型性能的方法，如交叉验证和混淆矩阵，用于判断模型在新数据上的表现。

诊断 (偏差/方差) (Diagnostics (Bias/Variance))

分析模型偏差和方差，以识别和解决模型的过拟合或欠拟合问题，平衡模型的复杂度和泛化能力。

概率与统计 (Probability & Statistics)

随机变量 (Random Variables)

描述随机现象的变量，可以是离散的或连续的，用于表示可能的结果及其概率分布。

概率与组合学 (Probability & Combinatorics)

研究事件发生的可能性和组合方式，涉及概率计算、排列和组合等概念。

条件概率 (Conditional Probability)

在已知某一事件发生的条件下，另一个事件发生的概率，反映事件之间的依赖关系。

参数估计 (Parameter Estimation)

从样本数据中估计总体参数的方法，包括点估计和区间估计，用于推断总体特征。

代数与微积分 (Algebra & Calculus)

矩阵运算 (Matrix Operations)

矩阵的基本运算，如加法、乘法、转置和求逆等，广泛应用于线性代数和机器学习中。

矩阵性质 (Matrix Properties)

矩阵的特性，如行列式、特征值和特征向量，用于描述矩阵的结构和性质。

矩阵微积分 (Matrix Calculus)

矩阵形式的微积分运算，用于求解涉及矩阵和向量的函数的导数和梯度，在机器学习的优化算法中尤为重要。

407ba29afe694b43a8fc0e7310afe402.png~tplv-0es2k971ck-image.png