关于回归的问题与答案

349 阅读5分钟

练习关于回归的多项选择题,并给出答案。这是机器学习的基本技术之一,被广泛用于基本问题中。

如果你想复习这个概念,请阅读这篇文章👉。

让我们从问题开始。点击正确的选项,答案将被解释。

问题1

什么是回归?

它是一种预测数值的技术

它是一种固定数据的技术

它是一种机器学习算法

它是一种寻找异常值的技术

回归是用来建立一个因变量与一个或多个自变量之间的关系。

问题2

什么是因变量

我们想要预测的值

我们的数据集的特征

回归算法的参数

干扰我们要预测的值的数值

因变量是我们想要预测的价值。想象一下,我们想知道一所房子的价值是多少。它是因变量,我们必须考虑它的大小、邻里关系、有多少个房间、多少个卫生间、是否有花园,以及其他变量。它的价值取决于所有这些信息,这就是为什么它被称为自变量。

问题3

什么是自变量?

干扰我们想要预测的价值的数值。

我们的数据集的特征

回归算法的参数

我们想要预测的值

按照房价的例子,所有能干扰房价的变量都可以被称为自变量。房子的大小,邻里关系,有多少个房间,什么时候建的,等等。

问题4

什么是离群值?

我们数据集中的极端数据点

相互关联的数值

它是我们数据集的主要趋势

它是一种回归技术

离群值是我们数据集中的极端数据点,它比其他数据点的值多得多或少得多。大多数时候,异常值可以从数据集中排除,以保持回归的质量。另一方面,如果我们正在努力防止欺诈,那么异常值就是我们要寻找的,因为它们代表着可疑的行为。

问题5

什么是多重共线性?

独立变量之间的高度关联性

独立变量之间的低关联性

异常值之间的相关性

特征之间的相关性

当我们有2个或更多的独立变量具有高相关性时,我们称之为多重共线性。这对我们的回归是有害的,因为它使我们更难对这些变量进行排序,以便知道哪个变量对我们的因变量有更大的影响。在这种情况下,我们通常只保留其中一个变量,而舍弃其他变量。

问题6

什么是过拟合?

训练结果好,测试结果差

训练结果好,测试结果好

训练结果差,测试结果差

训练结果差,测试结果也差

当我们使用不必要的解释变量时,可能会导致过度拟合。

问题7

什么是线性回归和逻辑回归?

回归的类型有

它是你如何对回归进行分类的

一个回归必须是线性或逻辑的

有一些过拟合的类型

尽管它们是最知名的回归类型,但还有许多其他类型。

问题8

哪个答案能更好地解释线性回归?

自变量是连续的,自变量可以是连续的或离散的,回归线的性质是线性的。

自变量是离散的,自变量可以是连续的或离散的,回归线的性质是线性的。

自变量是连续的,自变量可以是连续的或离散的,回归线的性质是非线性的。

自变量是离散的,自变量可以是连续的或离散的,回归线的性质是非线性的。

线性回归在因变量和所有自变量之间建立一个关系,使用一条最适合的直线,称为回归线。

问题9

什么情况下适合使用Logistic回归?

当因变量是二元的时候

当自变量是二元的时候

当因变量不是二进制时

当自变量不是二进制时

当我们在寻找一个二进制值时,就会使用Logistic回归。这种类型的回归计算一个事件的成功或失败的概率。它被广泛用于分类。

问题10

多项式回归是用于什么?

处理非线性和可分离的数据

处理线性和可分离的数据

对二进制数据进行分类

寻找最佳的线性线

当我们处理非线性和可分离的数据时,直线是行不通的。在这种情况下,多项式是非常有用的,它们总是有功率大于1的独立变量。

问题11

我们什么时候使用岭回归?

当我们的数据有多重共线性时

当我们的数据不存在多重共线性时

当我们有很多离群值的时候

没有离群值时

岭回归有一个正则化参数来解决多重共线性问题。它缩小了系数的值,但没有达到零,这表明没有特征选择功能。

问题12

Lasso回归与Ridge回归的不同之处是什么?

它在正则化参数中使用绝对值,而不是平方值。

它在正则化参数中使用平方值

它在小数据集中效果更好

在大数据集中效果更好

Lasso回归在惩罚函数中使用绝对值,而不是平方值。其结果是惩罚值导致一些参数估计值变成了完全的零。

问题13

什么是ElasticNet回归?

它是Lasso和Ridge回归的混合体。

它是最新的回归类型

它是机器学习中使用回归的最佳方式。

它是一种专注于异常值的回归类型。

它是L1和L2正则化的组合。

通过OpenGenus的这些关于回归的问题,你一定对回归有了很好的了解。请享受。