【Data Mining】【第五章作业】

665 阅读6分钟

本文已参与「新人创作礼」活动,一起开启掘金创作之路。

一. 单选题

1.回归分析中使用的距离是点到直线的垂直坐标距离,最小二乘准则是指( )。

A. 在这里插入图片描述

B. 在这里插入图片描述

C.在这里插入图片描述

D. 在这里插入图片描述

正确答案: D

2.回归分析的步骤为( )。

① 进行相关分析 ② 建立预测模型 ③ 确定变量 ④ 确定预测值 ⑤ 计算预测误差

A. ①③④⑤②

B. ③①⑤②④

C. ③②①⑤④

D. ③⑤①②④

正确答案: C

3.下列变量之间的关系是函数关系的是( )。

A. 已知二次函数y=ax2+bx+c,其中a,c是已知常数,取b为自变量,因变量是这个函数的判别式Δ=b2-4ac。

B. 光照时间和果树亩产量

C. 降雪量和交通事故发生率

D. 每亩施用肥料量和粮食产量

正确答案: A

4.对于回归分析,下列说法错误的是( )。

A. 在回归分析中,变量间的关系若是非确定性关系,那么因变量不能由自变量唯一确定

B. 线性相关系数可以是正的,也可以是负的

C. 回归分析中,如果r2=1,说明x与y之间完全相关

D. 样本相关系数r∈(-1,1)

正确答案: D

5.某地区调查了2-9岁儿童的身高,由此建立的身高y(cm)与年龄x(岁)的回归模型为y=8.25x+60.13,下列叙述正确的是( )。

A. 该地区一个儿童的身高为142.63cm

B. 该地区2-9岁的儿童每年的身高约增加8.25cm

C. 该地区9岁儿童的平均身高是134.38cm

D. 利用这个模型可以准确地预测该地区每个2-9岁儿童的身高

正确答案: B

6.在这里插入图片描述

A. y = 0.51x + 6.65

B. y = 6.65x + 0.51

C. y = 0.51x + 42.30

D. y = 42.30x + 0.51

正确答案: A

7.下表是x和y之间的一组数据,则y关于x的回归方程必过( )。

在这里插入图片描述

A. 点(2, 3)

B. 点(1.5, 4)

C. 点(2.5, 4)

D. 点(2.5, 5)

正确答案: C

8.反映由模型中解释变量所解释的那部分离差大小的是( )。

A. 总离差平方和

B. 回归平方和

C. 残差平方和

D. 可决系数

正确答案: B

9.总离差平方和TSS、残差平方和RSS与回归平方和ESS三者的关系是( )。

A. TSS>RSS+ESS

B. TSS=RSS+ESS

C. TSS<RSS+ESS

D. TSS2=RSS2+ESS2

正确答案: B

10.决定系数R2的取值范围是( )。

A. R2<=1

B. R2>=1

C. 0<R2<1

D. -1<R2<1

正确答案: C

11.回归分析中定义的( )。

A. 解释变量和被解释变量都是随机变量

B. 解释变量为非随机变量,被解释变量为随机变量

C. 解释变量和被解释变量都为非随机变量

D. 解释变量为随机变量,被解释变量为非随机变量

正确答案: B

12.最大或然准则是按从模型中得到既得的n组样本观测值的什么最大的准则确定样本回归方程( )。

A. 离差平方和

B. 均值

C. 概率

D. 方差

正确答案: C

13.下表为日本的汇率与汽车出口数量数据,其中X为平均汇率(日元/美元),Y为汽车出口数量(万辆),那么,X与Y的相关系数为( )。

在这里插入图片描述

A. 0.0769

B. 0.9321

C. 0.9203

D. 0.0679

正确答案: B

14.已知某农场通过试验取得早稻收获量与春季降雨量和春季温度的数据如下,则早稻收获量对春季降雨量和春季温度的二元线性回归方程为( )。

在这里插入图片描述

A. 在这里插入图片描述

B. 在这里插入图片描述

C. 在这里插入图片描述

D. 在这里插入图片描述

正确答案: D

15.为研究某市家庭收入与月平均生活支出的关系,该市统计部门随机调查了10个家庭,得数据如下,则回归直线方程为()。

在这里插入图片描述

A. 在这里插入图片描述

B. 在这里插入图片描述

C. 在这里插入图片描述

D. 在这里插入图片描述

正确答案: C

二. 多选题

1.在回归分析中,检验线性相关显著性常用的三种检验方法,包含( )。

A. 相关系数显著性检验法

B. t检验法

C. F检验法(即方差检验法)

D. χ2检验法

正确答案: ABC

2.回归方程 ,则下列说法不正确的有( )。

A. y=1.5x - 15

B. 15是回归系数a

C. 1.5是回归系数a

D. x=10时,y=0

正确答案: ABD

3.下列关系中具有相关关系的是( )。

A. 人的年龄与他拥有的财富之间的关系

B. 曲线上的点与该点的坐标之间的关系

C. 苹果的产量与气候之间的关系

D. 森林中的同一种树木,其断面直径与高度之间的关系

正确答案: ACD

4.下列变量中,属于正相关的是( )。

A. 收入增加,储蓄额增加

B. 产量增加,生产费用增加

C. 收入增加,支出增加

D. 价格下降,消费增加

正确答案: ABC

三. 填空题

1.回归分析按照涉及变量的多少,分为:___

正确答案: (1) 一元回归分析 (2) 多元回归分析

2.若线性回归方程中的回归系数b = 0,则相关系数r为:____

正确答案: (1) 0

3.某化工厂为预测产品的回收率y,需要研究它和原料有效成分含量x之间的相关关系,现取8对观测值,计算得 ,则其线性回归方程为(系数保留两位小数)____

正确答案: (1) y=2.62x+11.47;y=11.47+2.62x

4.已知关于某设备的使用年限x与所支出的维修费用y(万元),有如下统计资料。若y对x呈线性相关关系,则回归直线方程 ,表示的直线一定过定点:____

在这里插入图片描述

正确答案: (1) (4,5)

5.使用F检验对多元线性回归方程进行线性关系的显著性检验,所求F值越大,说明线性关系越:____

正确答案: (1) 显著

6.在使用决定系数R2对回归方程进行拟合优度检验时,R2越大表示回归方程的拟合程度越____,R2越小表示回归方程的拟合程度越____。

正确答案: (1) 好 (2) 差

7.____是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。

正确答案: (1) 回归分析

8.F检验运用服从F分布的统计量或方差比作为统计检验,通过____度量回归方程的线性关系是否显著

正确答案: (1) 显著性水平; 显著性水平检验

9.____是指分类器/回归器正确地预测新的或先前未见过的数据的属性值/类标号的能力

正确答案: (1) 准确率;分类准确率

10.当一些变量的值确定以后,另一些变量的值也随之完全确定的关系,这些变量间的关系完全是已知的,变量间的关系可以用函数关系表示,我们称之为____

正确答案: (1) 确定性关系

11.变量之间有一定的依赖关系,变量之间虽然互相影响和制约,但由于受到无法估计和控制的因素的影响,使变量间的关系呈现不确定性,当一些变量的值确定以后,另一些变量值虽然随之变化,却不能完全确定,这时,变量间的关系就可以精确地用函数表示,即不能由一个或若干变量的值精确地确定另一个变量的值,我们称这样的关系为____

正确答案: (1) 非确定性关系

12.在回归分析中:被解释变量y是____、解释变量x是____。

正确答案: (1) 随机变量;因变量 (2) 非随机变量;自变量