STATA入门（5）持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第5天，点击查看活动详情 STA

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第5天，点击查看活动详情

STATA小白入门第5讲-描述性统计第二部分

大家好呀，这一期还是着重介绍描述性统计中常见的一些命令的操作，之所以对其进行介绍，是因为在我应用STATA的过程中真的觉得十分有用，对我们的研究十分有帮助。对于我来说我经常用这些代码，已经熟练到可以直接敲出来了，所以在这里也分享给大家。

本期我要向大家分享的是如何对变量进行有条件的删减，需要用到的命令是“bys”命令和”drop”命令。并且需要两步操作。

举例：现在有一份数据库，里面主要包括城市变量city，也就是每个个体来自哪一个城市。样本一共有3000个，对应3000个城市，这3000个城市中肯定是存在重复的，现在我们用”tab” 命令对城市进行分类（STATA操作，“tab city”），呈现出每个城市对应出现的频数，比如北京出现几次，上海出现几次等等，而次数的加和为3000次。

问题：由于我们只想关注频数较多的城市，那么现在研究想删除频数小于6的城市应该怎么做呢？

解答：首先我们新生成设定X为每个城市对应的频数，需要用到“bys”命令。然后用”drop”命令去掉城市频数小于6的城市。代码：

bys city:egen x=count (city)

drop if x<6

这样，上述命令的应用会删除城市频数小于6的城市（city）变量名，操作完上述命令后，重新用”tab” 命令对城市进行分类（STATA操作，“tab city”），我们可以看到频数小于6的城市已经删去，只保留城市频数大于等于6的城市变量，自然而然地，变量总频数也不是原来的总数3000 。以上就是我的分享啦。