STATA入门(14)

223 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第14天,点击查看活动详情

STATA小白入门第14期分享: 一些STATA软件中常用的基本命令

大家好啊,为了查缺补漏,这一期就和大家分享一下STATA中常见的一些基本命令。方便大家更加系统的入门。本期内容主要包括对连续型变量求均值,标准差,生成新的变量,去除变量,以及作散点图。虽然不是一些复杂的操作,但还是很有用的。

第一部分:汇总功能,sum/summarize 命令, 我们拿到一份数据时,需要大致的了解数据的特征,这一命令可以很直观的呈现变量的整体特征,包括变量观测数(Obs),变量的平均值(Mean),标准差(Std.Dev.),最大值(Max)以及最小值(Min)。 通过直接输入命令:”sum  待研究变量” (比如 sum age,这是对年龄这一变量进行整体特征分布的探究。)

第二部分:生成新变量和去除变量

生成新变量用“generate/gen”命令,这一部分在上述分享中已经涉及。去除变量应用“drop”命令。 举例:比如现在想生成一个变量名称为“apple”的二分类变量和“apple1”的多分类变量。那么命令代码应为“gen apple=0”, “gen apple1= .” 注意在通常情况下,这只是生成新的分类变量的第一步,接下来要用“replace”命令对变量进行重新分类。那么现在想去除上述新生成的二分类变量apple,代码命令应为"drop apple"。

第三部分:作图(散点图)

当我们刚拿到一份数据时,除了需要大致了解变量的分布,分类以及重新分类等操作,还可以是通过作图反应数据的结构。最常见的就是作散点图。主要用到的命令是“scatter 因变量 自变量”命令。例如:现阶段,我们想看一看收入(income)随年份(year)的一个简单的大致变化,我们可以应用下述命令来实现。 “scatter income year”