主成分分析(PCA)问题及答案

538 阅读3分钟

关于主成分分析(PCA)的多选题练习,并附有答案。这是机器学习应用中的一项基本技术。

如果你想复习这个概念,请阅读这篇文章👉。

让我们从问题开始。点击右边的选项,答案将被解释。

问题1

在聚类之前使用PCA的重要性是什么?请选择最完整的答案。

找到数据的哪个维度的特征方差最大

找到好的特征以提高聚类分数

避免不良特征

找到解释方差

为了提高聚类效率,你需要找到数据中哪个维度的特征方差最大,也可以通过这个结果找到每个维度的解释方差。当你的方差越大,你损失的数据就越少。

问题2

按照PCA算法的运行步骤,为什么标准化数据如此重要?

找到能够最好地预测Y的特征

标准化的数据可以让其他人更好地理解你的工作

使用数据处理的最佳实践

让训练时间更快

当你标准化你的数据时,你会发现具有较高方差的特征,在这种情况下,这些特征将更好地预测我们的目标(Y)。

问题3

PCA之后做什么?

降低数据的维度,从给定的特征集中创建新的特征

高效率地预测你的目标

创建聚类,以便让你知道什么是类。

为你提供尽可能多的特征,使你的机器学习算法的效率最大化。

随着维度的降低,使用聚类方法更容易使你的数据可视化,将帮助你减少数据中的噪音,训练阶段将更快。

问题4

为什么你要放弃不重要的特征?

使用最重要的特征会让你更有效地预测你的目标

使数据标准化

找到正确的聚类

更快地训练模型

只使用最重要的特征会给你一个数据损失较少的环境,会让你清楚地知道哪些特征是最重要的,并且会降低维度。所有这些都是PCA的真正目的。

问题5

什么时候使用PCA?

你想找到潜在的特征并降低维度

每次使用机器学习算法之前

当我有一个过拟合的案例时

当我的数据很小并且只有几个特征时

PCA可以帮助你在所有的数据中找到潜在的特征,可以将维度降低到1/10,使数据更容易可视化,并且因为使用更少的硬件运行而使训练更快。

通过OpenGenus的这些关于主成分分析(PCA)的问题,你一定对主成分分析(PCA)有一个很好的了解。请欣赏。