STATA入门(17)

449 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第17天,点击查看活动详情

STATA小白入门第17期分享: 在STATA中,如何自动跑模型? (主要运用gsreg命令)

大家好啊,最近在学习STATA的过程中学到了一种自动跑模型并且筛选最优模型的方法,主要应用的是“gsreg”命令。本期会简要分享gsreg命令的基本执行功能,下一期会和大家分享更加具体细致的应用。这一命令有两个最主要的功能,一个是根据纳入模型分析的命令进行排列组合,并根据所有可能的组合情况创建生成一组集合。第二个主要功能是对创建的集合中的每一种变量的可能组合进行回归。回归的结果也会自动生成一个独立文件保存。并且可以根据每一个组合回归后的调整R平方进行排序,系统会自动筛选出调整后的R平方最大的那一组变量的回归结果。这一组变量模型被视为较优模型。

举例:在下述情况下,有两个候选协变量variable1和variable2,因变量为variable3,应用”gsreg”命令将会对两个协变量组合的所有可能进行回归分析。(如果是两个协变量,那么回归有三种结果,如果有3个协变量,那么回归有6种排列组合,以此类推。)

第一步:下载命令

ssc install gsreg, replace

第二步:应用命令两个协变量和1个因变量所有的排列组合结果进行回归分析

gsreg variable3 variable2 variable1

(可能的排列组合结果如下)

reg variable3 variable2

reg variable3 variable1

reg variable3 variable1 variable2

除此之外,应用该命令会对三个回归分析的结果中调整的R平方进行排序,通常会选择调整的R平方最大的模型,但要注意的是,R平方的大小不是最终模型选择的唯一依据,还需要进行综合考量。