持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第30天,点击查看活动详情
软件代码小白入门第30期分享: STATA 中一些常见的基本操作。(第三期)。大家好啊,这一期继续和大家分享一些STATA软件中的小巧实用的命令代码。 包括如何对数据进行排序,对变量绘制直方图,以及计算变量均值的置信区间等等。
第一部分:对数据进行排序
对数据进行排序是非常实用的一个功能,有的时候为了简便的对数据进行处理,我们可能会对数据进行排序,这样的操作在Excel中可以直接选择,但在STATA中需要用命令进行实现。
命令代码:sort 将要进行排序的变量名 [in] [,stable]
其中[in]代表范围,[,stable]代表如果存在观测值相同的两个值,那么这部分命令在排序的时候要求顺序与之前原本的数据保持一致。
第二部分:对变量绘制直方图
有的时候我们不仅想从数据中得到变量的基本信息,我们也想直观的通过作图呈现。那么我们可以对变量直接做直方图,需要用到histogram命令。
命令代码:histogram 变量名称
第三部分:计算变量均值的置信区间
计算置信区间是回归分析中也很常见的一个分析过程。除了可以直观的看均值所处的一个范围,还可以看回归结果是否显著,见于置信区间是否包括0/1。在某种程度上,置信区间所呈现的信息和p value所呈现的信息是相类似的。因此,有很多学者认为在以表格的形式对回归结果进行呈现的时候,置信区间,和p value可以只选择其一进行呈现。对置信区间的计算见下方命令。
ci means 变量名称, level (#)
其中,我们比较常见95%置信区间,那么在#中可以填入95.