STATA入门(25)

138 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第25天,点击查看活动详情

软件代码小白入门第25期分享: STATA和R语言在应用上的对比(第三期) 大家好啊,今天继续和大家分享一下我在对软件的不断学习过程中,总结的一些思考。这一期主要和大家说的是STATA和R语言在线性回归和Logistic回归上的异同。相比于上一期分享的R语言在进行频数频率的统计时需要用到两行代码相比,线性回归和Logistic回归在R语言中往往应用一条代码就可以进行分析。下面将会呈现回归分析在线性回归和Logistic回归的异同之处。

举例:假设现在我们想分析性别和年龄分别与心理健康之间的关系,性别为二分类变量,用gender表示,年龄为连续型变量,用age表示,心理健康用专属量表PHQ-9的结果呈现,表示为mentalhealth。基于一些理论基础,探究年龄与心理健康之间的关系可以用线性回归进行分析,研究性别与心理健康之间的关系应该用Logistic回归分析 (因为性别是二分类变量)。

STATA中回归的代码命令: STATA中回归命令一般用一条代码即可实现,线性回归用“reg”, Logistic回归用“logit”。分析时先选择好确定的分析方法然后应用相应的命令即可实现。

1.  线性回归代码:

reg mentalhealth age

2.  Logistic 回归代码

logit mentalhealth gender

logit mentalhealth gender, or (可以直接得到OR)

R语言中回归的代码命令:

R语言小红有关回归的命令也是可以用一行代码进行的,线性回归应用“lm”命令,Logistic回归可以根据GLM Model进行拟合。

1.  线性回归代码

lm(mentalhealth~age, data=data)

2.  Logistic回归代码

glm(mentalhealth~gender, data=data, family=binomial(link=logit)) 还是像之前说的那样,基于相同的统计学原理的基础下,不同的统计软件有着不同的计量思维和习惯,这样在某种程度上是一种互补的作用。