一、列联分析
1. 概览
(1)提出假设:H0:没有差异没有影响;H1:有差异有影响
(2)构造边缘分布表:行边缘分布和列边缘分布
二、方差分析
1. 概览
(1)提出假设:H0:没有差异没有影响;H1:有差异有影响
(2)分析差异:计算各组平均数、总平均数;计算组间平方和SSA、组内平方和SSE、总平方和SST
三、相关分析与回归分析
1. 概览
- 变量间的关系:确定的函数关系、不确定的统计关系—相关关系、没有关系。
- 相关关系的类型:
(1)变量数量:简单相关、多重相关
(2)表现形式:线性相关、非线性相关
(3)关系变化的方向:正相关、负相关
(4)相关程度:完全相关、不相关、不完全相关 - 相关系数ρ(样本线性相关系数r):|r|=1完全相关,|r|—>1关系密切,|r|—>0关系不密切
- 几种相关系数:皮尔逊相关系数(Pearson)、斯皮尔曼相关系数(Spearman)、肯德尔相关系数(Kendall)
3. 回归分析
(1)模型的回归函数:总体/样本、条件均值/个别值
(2)参数估计方法:最小二乘法OLS(因变量的观测值与估计值的离差平方和最小)(5种计算方法:函数法、散点图法、回归分析法、规划求解法、矩阵法)
(3)拟合优度检验: (4)回归系数的显著性检验: 4. 拓展:多元线性回归的模型检验
(1)修正可决系数(考虑变量个数增大带来的影响) (2)F检验:所有变量联合起来对因变量是否有显著影响 5. 拓展:Logistic回归——因变量为分类变量
(1)说明:二元Logistic回归的因变量只有2个分类,多元Logistic回归的因变量有多个分类 (2)参数估计方法:极大似然估计法