关于主成分分析(PCA)的多选题练习,并附有答案。这是机器学习应用中的一项基本技术。
如果你想复习这个概念,请阅读这篇文章👉。
让我们从问题开始。点击右边的选项,答案将被解释。
问题1
在聚类之前使用PCA的重要性是什么?请选择最完整的答案。
找到数据的哪个维度的特征方差最大
找到好的特征以提高聚类分数
避免不良特征
找到解释方差
为了提高聚类效率,你需要找到数据中哪个维度的特征方差最大,也可以通过这个结果找到每个维度的解释方差。当你的方差越大,你损失的数据就越少。
问题2
按照PCA算法的运行步骤,为什么标准化数据如此重要?
找到能够最好地预测Y的特征
标准化的数据可以让其他人更好地理解你的工作
使用数据处理的最佳实践
让训练时间更快
当你标准化你的数据时,你会发现具有较高方差的特征,在这种情况下,这些特征将更好地预测我们的目标(Y)。
问题3
PCA之后做什么?
降低数据的维度,从给定的特征集中创建新的特征
高效率地预测你的目标
创建聚类,以便让你知道什么是类。
为你提供尽可能多的特征,使你的机器学习算法的效率最大化。
随着维度的降低,使用聚类方法更容易使你的数据可视化,将帮助你减少数据中的噪音,训练阶段将更快。
问题4
为什么你要放弃不重要的特征?
使用最重要的特征会让你更有效地预测你的目标
使数据标准化
找到正确的聚类
更快地训练模型
只使用最重要的特征会给你一个数据损失较少的环境,会让你清楚地知道哪些特征是最重要的,并且会降低维度。所有这些都是PCA的真正目的。
问题5
什么时候使用PCA?
你想找到潜在的特征并降低维度
每次使用机器学习算法之前
当我有一个过拟合的案例时
当我的数据很小并且只有几个特征时
PCA可以帮助你在所有的数据中找到潜在的特征,可以将维度降低到1/10,使数据更容易可视化,并且因为使用更少的硬件运行而使训练更快。
通过OpenGenus的这些关于主成分分析(PCA)的问题,你一定对主成分分析(PCA)有一个很好的了解。请欣赏。