STATA入门(28)

299 阅读2分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第28天,点击查看活动详情

软件代码小白入门第28期分享: STATA 中一些常见的基本操作。大家好啊,这一期会和大家分享一下STATA分析软件中一些常见的基本操作,包括如何查看全部的数据,如何输入组内非重复值的个数等。

第一部分:全体数据的查看

首先如果我们除了想对数据库进行简单的了解,用“summary”命令进行简单的查看外,我们可能在分析的过程中发现有一个变量的数值有一些问题,或者我们在对多个数据库进行合并后,想查看一下数据合并后的样子等等在不同的研究需求下,我们可以直接在STATA上查看整个数据库的所有数据。

首先当我们在导入或者整合好数据后,为了保险起见可以先对数据库选择保存。查看全部数据可以点击“View”,选择“data editor”,再选择“browse“,这样就会自动弹出整体数据库。如果想对数据库的某些数据进行修改的话,可以选择“Edit”,直接修改,修改完毕后需要进行保存。

第二部分:统计变量间非重复的组合数(这一部分参考了连玉君老师的分享)

假设我们现在有variableA和variableB两个变量,我们想看一看这两个变量之间所有的非重复的组合数,以及所有的组合分布。这也可以看作探究变量相关性的其中一步,因为我们有的时候想看一下变量之间的分类组合,甚至在一些特殊的情境下,我们更想了解两个变量之间不重复的搭配组合方式,那么这里主要用“tab” 命令代码。

代码

tab variableA variableB, mis

除此之外,我们也可以使用nvals()命令进行,需要下载egenmore

第一步:ssc install egenmore, replace

第二步: egen newvar=nvals (变量名称)[, by(用于分组的变量名称) missing]