STATA入门（14）持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第14天，点击查看活动详情 S

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第14天，点击查看活动详情

STATA小白入门第14期分享: 一些STATA软件中常用的基本命令

大家好啊，为了查缺补漏，这一期就和大家分享一下STATA中常见的一些基本命令。方便大家更加系统的入门。本期内容主要包括对连续型变量求均值，标准差，生成新的变量，去除变量，以及作散点图。虽然不是一些复杂的操作，但还是很有用的。

第一部分：汇总功能，sum/summarize 命令, 我们拿到一份数据时，需要大致的了解数据的特征，这一命令可以很直观的呈现变量的整体特征，包括变量观测数(Obs)，变量的平均值(Mean)，标准差(Std.Dev.)，最大值(Max)以及最小值(Min)。通过直接输入命令：”sum 待研究变量” （比如 sum age，这是对年龄这一变量进行整体特征分布的探究。）

第二部分：生成新变量和去除变量

生成新变量用“generate/gen”命令，这一部分在上述分享中已经涉及。去除变量应用“drop”命令。举例：比如现在想生成一个变量名称为“apple”的二分类变量和“apple1”的多分类变量。那么命令代码应为“gen apple=0”, “gen apple1= .” 注意在通常情况下，这只是生成新的分类变量的第一步，接下来要用“replace”命令对变量进行重新分类。那么现在想去除上述新生成的二分类变量apple，代码命令应为"drop apple"。

第三部分：作图（散点图）

当我们刚拿到一份数据时，除了需要大致了解变量的分布，分类以及重新分类等操作，还可以是通过作图反应数据的结构。最常见的就是作散点图。主要用到的命令是“scatter 因变量自变量”命令。例如：现阶段，我们想看一看收入（income）随年份（year）的一个简单的大致变化，我们可以应用下述命令来实现。 “scatter income year”