持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第3天,点击查看活动详情
STATA小白入门第3讲 还是接着上两期的变量分类方法,有时候处于分析研究等的需要,我们会对变量进行分类甚至重新生成新的变量进行分类。但是应用上述的分类方法进行分类后,STATA对于类别是用数字表示不同类别的。比如上述新的收入变量pay2,使用tab函数查看变量情况后可以发现,1.小于等于10000;2.大于10000,小于等于30000;3.大于30000小于等于400000。在后续分析的时候,结果的呈现也是以数字的形式,当我们随着任务量的增加,数字对应的具体的类别可能不确定,因此对变量添加标签是一个很好的解决办法。主要用到“label”命令。
举例:三分类收入变量pay3,1.表示小于等于10000;2.表示大于10000,小于等于30000;3.表示大于30000。我们希望通过对变量添加标签,来清晰的呈现变量的分类。
代码: 1.先设定一组标签的命名label1 label define label1 1“pay<=10000” 2“10000<pay<=30000” 3“pay>30000”
2.将上述标签label1应用于pay3中 label value pay3 label1
3.对添加标签的变量进行重命名 (不是必须,视情况而定)这里将pay3重新命名为income rename pay3 income
基于以上的操作,通过对变量添加标签,当再次应用“tab”命令查看变量的分类情况时,曾经用数字表示的1,2,3类,如今都用具体的标签名称代替,表现为“pay<=10000” “10000<pay<=30000” “pay>30000”,这样就可以十分直观的呈现变量的每一类具体是什么,特别有助于当我们的工作量很大的时候,添加标签的变量可以帮助我们更有效率的查看变量,进而节约了很多核对的时间。