STATA入门(1)

197 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第1天,点击查看活动详情

STATA小白入门第一讲 大家好呀,本人由于学业需要学习STATA的用法,在网上自学了很久,觉得很受益,于是自己也想把自己学到的内容整理出来分享给大家,我的笔记特别适合刚入门的小白~ 那么第一节我们就先讲一下如何对变量进行分组。有的时候我们需要对变量进行分组来获得满足研究条件的新的变量。分组可以分成二分类和多分类,对应的代码有一些差别,但是思路都是相通的。这里需要用到 “gen” “egen” “replace” 命令。稍后我会一一详细的说明。大致的思路是,首先生成一个用作分组的新变量,其次用命令对新变量赋值并且替换原来的变量。

举例:假设现有一个定量的变量收入,用pay表示,范围在10000-40000. 现阶段需要生成一个二分类变量和一个三分类变量。二分类变量的分类标准为0.小于等于20000,1.大于20000。三分类变量的分类标准为1.小于等于10000;2.大于10000,小于等于30000;3.大于30000小于等于400000。新生成的二分类变量命名为pay1,新生成的四分类变量命名为pay2。

对于二分类变量的代码如下

  1. 生成用作分组的二分类新变量 pay1 gen pay1=0 2.用replace命令对变量进行替换 replace pay1=1 if pay>=20000 这样就得到了二分类新变量,选项0表示小于等于20000,选项1表示大于20000

对于三分类变量的代码如下

  1. 生成用作分组的二分类新变量 pay2 gen pay2= . 2.用replace命令对变量进行替换 replace pay2=1 if pay<=10000 replace pay2=2 if pay>10000 & pay<=30000 replace pay3=3 if pay>30000 这样就得到了三分类新变量, 1.小于等于10000;2.大于10000,小于等于30000;3.大于30000小于等于400000。