持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第8天,点击查看活动详情
STATA小白入门第8讲: Logistic回归分析
大家好呀,在第7讲的时候我和大家分享了线性回归的STATA命令,作为第一个进行十分深入的研究的统计学方法,线性回归有一个要求就是因变量为连续型变量。但是,这样会对我们的分析有一定的局限性,因为有时候我们想研究的变量并不全是连续型变量,比如,在先前的分享中,我们知道了如何对变量根据均值和标准差进行二分类。那么如果我们想将收入根据均值进行分类,并且想知道一些因素如何影响收入,这种情况下,线性回归就不适用了。因为此时的变量为二分类变量,应该用Logistic回归模型进行分析。
Logistic回归分析模型要求因变量为二分类变量,而自变量可以是分类变量,也可以是连续型变量。请参考下方的举例说明。
举例,在第7期分析的基础上,经济学中的研究离不开谈及收入,决定收入(income)的因素有很多,现阶段收入根据平均值分为小于等于平均值和大于平均值两类,那么我们想探究这一二分类的收入变量与教育程度education之间的关系,这时应用Logistic如何分析呢
解答:
命令格式:logit 被解释变量 解释变量,那么本例题对应的代码为logit income education
需要注意的是,我们在写Logistic回归分析的相关论文时,需要将结果整理成表格,表格中要出现Odds ratio,但上述得到的结果并不是Odds ratio,所以我们需要用到下方的命令
“logit 被解释变量 解释变量,or”。这样就不需要我们自己求反对数计算OR了。