如何解释R中执行逻辑回归输出的Pr(>|z|)

1,684 阅读2分钟

每当你在R中执行逻辑回归时,回归模型的输出将以下列格式显示:

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452   9.165482  -1.924   0.0543 .
disp         -0.004153   0.006621  -0.627   0.5305  
drat          4.879396   2.268115   2.151   0.0315 * 

Pr(>|z|)列表示与z值列中的数值相关的p值。

如果p值小于某个显著性水平(如α=0.05),那么这表明预测变量与模型中的响应变量有统计学上的显著关系。

下面的例子说明了在实践中如何解释逻辑回归模型的Pr(>|z|)列中的数值。

例子:如何解释Pr(>|z|)值

下面的代码显示了如何使用内置的MTCars数据集在R中拟合一个逻辑回归模型

#fit logistic regression model
model <- glm(am ~ disp + drat, data=mtcars, family=binomial)

#view model summary
summary(model)

Call:
glm(formula = am ~ disp + drat, family = binomial, data = mtcars)

Deviance Residuals: 
    Min       1Q   Median       3Q      Max  
-1.5773  -0.2273  -0.1155   0.5196   1.8957  

Coefficients:
              Estimate Std. Error z value Pr(>|z|)  
(Intercept) -17.638452   9.165482  -1.924   0.0543 .
disp         -0.004153   0.006621  -0.627   0.5305  
drat          4.879396   2.268115   2.151   0.0315 *
---
Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1

(Dispersion parameter for binomial family taken to be 1)

    Null deviance: 43.230  on 31  degrees of freedom
Residual deviance: 21.268  on 29  degrees of freedom
AIC: 27.268

Number of Fisher Scoring iterations: 6

下面是如何解释Pr(>|z|)列中的数值:

  • 预测变量 "disp "的p值是0.5305。因为这个值不小于0.05,所以它与模型中的响应变量没有统计学上的显著关系。
  • 预测变量 "drat "的p值是0.0315。因为这个值小于0.05,所以它与模型中的反应变量有统计学上的显著关系。

系数表下的显著性代码告诉我们,0.0315的p值旁边的一个星号(*)意味着p值在α=0.05时具有统计学意义。

Pr(>|z|)是如何计算的?

以下是Pr(>|z|)值的实际计算方法。

步骤1:计算Z值

首先,我们用以下公式计算Z值

  • z值=估计值/标准误差

例如,下面是如何计算预测变量 "drat "的z值:

#calculate z-value
4.879396 / 2.268115

[1] 2.151

第二步:计算P值

接下来,我们计算双尾P值。这表示正态分布的绝对值大于2.151或小于-2.151的概率。

我们可以使用R中的以下公式来计算这个值。

  • p值= 2 * (1-pnorm(z值))

例如,下面是如何计算z值为2.151的双尾p值:

#calculate p-value
2*(1-pnorm(2.151))

[1] 0.0314762

注意,这个p值与上面的回归输出中的p值一致。

其他资源

下面的教程解释了如何在R中拟合各种回归模型:

如何在R中进行Logistic回归
如何在R中进行简单线性回归
如何在R中进行多元线性回归