假设检验

315 阅读3分钟

这是我参与8月更文挑战的第10天,活动详情查看:8月更文挑战

为什么需要假设检验

数据分析过程中 - 一些产品/项目 效果 分析 - 新功能上线后是否会带来负面影响

假设检验是什么

推论统计中 - 检验统计假设的一种方法 EG:两组样本对应的正态分布的均值是否相同

假设检验中,原假设和备择假设常用的划分方法是什么?

原假设H0,备择假设H1 - 备择假设是真正需要关注和证明的
H0,H1 - 根据实际需要进行的选择
检验统计量 - 用于假设检验计算的统计量 - 基于样本检验统计量的值 - 接受/拒绝原假设
原假设成立 - 检验统计量服从一个特定的分布
备择假设成立 - 不服从该分布
常用的检验统计量有t统计量、z统计量

假设检验的基本思想

证明 原假设成立的基础上 - 检验统计量出现当前值/更为极端的值 - “小概率”事件 - 推翻原假设,接受备择假设
p-value - 检验统计量出现当前值/更为极端的值的概率
小概率 - 将p-value与预先设定的显著性水平α进行对比
通过证明该样本对应的p-value小于α - 推翻原假设,接受备择假设

假设检验的两类错误是什么?

  1. 原假设成立 - 拒绝了原假设
  2. 原假设不成立 - 接受了原假设

在假设检验中,如何平衡两类错误?

  1. 定义显著性水平α【预先设定犯第一类错误的上限】
    1-α:置信度 - 一般设定为5%, 要求比较严格的检验中- 设定为1% - 取决于业务的实际要求
  2. 显著性水平固定 - 减少第二类错误β发生的概率
    1-β:规避第二类错误的概率 - power - 检验效能
    power的大小 - 通过增加样本量来提高 - 【80%/更高水平】
    通过预先设定的显著性水平和检验效能 - 计算出完成试验所需要的最小样本量

简述假设检验中的p-value、显著性水平、置信度、检验效能

p-value: 原假设成立的前提下 - 检验统计量出现当前值/更为极端的值的概率
显著性水平:在假设检验中,犯第一类错误的上限,用α表示
置信度:1-α表示检验的置信度
检验效能:规避第二类错误的概率 - power

z检验和t检验之间有什么区别?

  1. z检验:假设x1 - xn - 一组来自正态分布的样本方差 α - 判断该正态分布的均值μ是否等于μ0
    H0: μ = μ0
    H1:μ != μ0
    在H0成立的前提下 - 构造检验统计量 - 显著性水平α - x均值 服从N(μ0, σ²/n)的正态分布 - 若该检验统计量的值最终落在[α/2, 1-α/2]分位数之外 - p-value小于α - 拒绝原假设 - 反正,无法拒绝原假设
  2. t检验:无需提前知方差 - 样本的方差代替 - 构造检验统计量 (样本平均数 - 期望)/ (样本标准偏差/样本量开根号) - 服从n-1的t分布 - 检验统计量的值落在[α/2, 1-α/2]分位数之外,可以拒绝原假设
    样本标准偏差 - ((样本-算术平均数)平方的和 )/ (样本量 - 1)再开根号