持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第5天,点击查看活动详情
STATA小白入门第5讲-描述性统计第二部分
大家好呀,这一期还是着重介绍描述性统计中常见的一些命令的操作,之所以对其进行介绍,是因为在我应用STATA的过程中真的觉得十分有用,对我们的研究十分有帮助。对于我来说我经常用这些代码,已经熟练到可以直接敲出来了,所以在这里也分享给大家。
本期我要向大家分享的是如何对变量进行有条件的删减,需要用到的命令是“bys”命令和”drop”命令。 并且需要两步操作。
举例:现在有一份数据库,里面主要包括城市变量city,也就是每个个体来自哪一个城市。样本一共有3000个,对应3000个城市,这3000个城市中肯定是存在重复的,现在我们用”tab” 命令对城市进行分类 (STATA操作,“tab city”),呈现出每个城市对应出现的频数,比如北京出现几次,上海出现几次等等,而次数的加和为3000次。
问题:由于我们只想关注频数较多的城市,那么现在研究想删除频数小于6的城市应该怎么做呢?
解答:首先我们新生成设定X为每个城市对应的频数,需要用到“bys”命令。然后用”drop”命令去掉城市频数小于6的城市。 代码:
bys city:egen x=count (city)
drop if x<6
这样,上述命令的应用会删除城市频数小于6的城市(city)变量名,操作完上述命令后,重新用”tab” 命令对城市进行分类 (STATA操作,“tab city”),我们可以看到频数小于6的城市已经删去,只保留城市频数大于等于6的城市变量,自然而然地,变量总频数也不是原来的总数3000 。以上就是我的分享啦。