练习关于回归的多项选择题,并给出答案。这是机器学习的基本技术之一,被广泛用于基本问题中。
如果你想复习这个概念,请阅读这篇文章👉。
让我们从问题开始。点击正确的选项,答案将被解释。
问题1
什么是回归?
它是一种预测数值的技术
它是一种固定数据的技术
它是一种机器学习算法
它是一种寻找异常值的技术
回归是用来建立一个因变量与一个或多个自变量之间的关系。
问题2
什么是因变量
我们想要预测的值
我们的数据集的特征
回归算法的参数
干扰我们要预测的值的数值
因变量是我们想要预测的价值。想象一下,我们想知道一所房子的价值是多少。它是因变量,我们必须考虑它的大小、邻里关系、有多少个房间、多少个卫生间、是否有花园,以及其他变量。它的价值取决于所有这些信息,这就是为什么它被称为自变量。
问题3
什么是自变量?
干扰我们想要预测的价值的数值。
我们的数据集的特征
回归算法的参数
我们想要预测的值
按照房价的例子,所有能干扰房价的变量都可以被称为自变量。房子的大小,邻里关系,有多少个房间,什么时候建的,等等。
问题4
什么是离群值?
我们数据集中的极端数据点
相互关联的数值
它是我们数据集的主要趋势
它是一种回归技术
离群值是我们数据集中的极端数据点,它比其他数据点的值多得多或少得多。大多数时候,异常值可以从数据集中排除,以保持回归的质量。另一方面,如果我们正在努力防止欺诈,那么异常值就是我们要寻找的,因为它们代表着可疑的行为。
问题5
什么是多重共线性?
独立变量之间的高度关联性
独立变量之间的低关联性
异常值之间的相关性
特征之间的相关性
当我们有2个或更多的独立变量具有高相关性时,我们称之为多重共线性。这对我们的回归是有害的,因为它使我们更难对这些变量进行排序,以便知道哪个变量对我们的因变量有更大的影响。在这种情况下,我们通常只保留其中一个变量,而舍弃其他变量。
问题6
什么是过拟合?
训练结果好,测试结果差
训练结果好,测试结果好
训练结果差,测试结果差
训练结果差,测试结果也差
当我们使用不必要的解释变量时,可能会导致过度拟合。
问题7
什么是线性回归和逻辑回归?
回归的类型有
它是你如何对回归进行分类的
一个回归必须是线性或逻辑的
有一些过拟合的类型
尽管它们是最知名的回归类型,但还有许多其他类型。
问题8
哪个答案能更好地解释线性回归?
自变量是连续的,自变量可以是连续的或离散的,回归线的性质是线性的。
自变量是离散的,自变量可以是连续的或离散的,回归线的性质是线性的。
自变量是连续的,自变量可以是连续的或离散的,回归线的性质是非线性的。
自变量是离散的,自变量可以是连续的或离散的,回归线的性质是非线性的。
线性回归在因变量和所有自变量之间建立一个关系,使用一条最适合的直线,称为回归线。
问题9
什么情况下适合使用Logistic回归?
当因变量是二元的时候
当自变量是二元的时候
当因变量不是二进制时
当自变量不是二进制时
当我们在寻找一个二进制值时,就会使用Logistic回归。这种类型的回归计算一个事件的成功或失败的概率。它被广泛用于分类。
问题10
多项式回归是用于什么?
处理非线性和可分离的数据
处理线性和可分离的数据
对二进制数据进行分类
寻找最佳的线性线
当我们处理非线性和可分离的数据时,直线是行不通的。在这种情况下,多项式是非常有用的,它们总是有功率大于1的独立变量。
问题11
我们什么时候使用岭回归?
当我们的数据有多重共线性时
当我们的数据不存在多重共线性时
当我们有很多离群值的时候
没有离群值时
岭回归有一个正则化参数来解决多重共线性问题。它缩小了系数的值,但没有达到零,这表明没有特征选择功能。
问题12
Lasso回归与Ridge回归的不同之处是什么?
它在正则化参数中使用绝对值,而不是平方值。
它在正则化参数中使用平方值
它在小数据集中效果更好
在大数据集中效果更好
Lasso回归在惩罚函数中使用绝对值,而不是平方值。其结果是惩罚值导致一些参数估计值变成了完全的零。
问题13
什么是ElasticNet回归?
它是Lasso和Ridge回归的混合体。
它是最新的回归类型
它是机器学习中使用回归的最佳方式。
它是一种专注于异常值的回归类型。
它是L1和L2正则化的组合。
通过OpenGenus的这些关于回归的问题,你一定对回归有了很好的了解。请享受。