STATA 入门(27)

178 阅读1分钟

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第27天,点击查看活动详情

软件代码小白入门第27期分享: STATA和R语言在应用上的对比(第五期)。 大家好啊,这一期还是继续和大家分享STATA软件和R语言在数据分析应用上的相同点和不同之处。R语言的历史可以追溯到1976年诞生的S语言,被称作是R语言的前身。STATA推出于1984年的美国经济学年会,可见R语言的出现要早于STATA,但两者并没有存在着绝对强弱的区别。STATA比较偏经济学人和经济学家的角度和思维,而R语言更加侧重于统计或者数学的角度。

在之前的统计软件的区别及联系的分享中我也提到过,STATA系统默认只有一个数据集,因此在调用某个变量进行研究的时候不需要指定变量的来源。但R语言是可以存放不同的数据集的,因此R语言在应用时的一个明显的特点就是在导入数据集时首先对其命名,在后续的变量分析时,指定变量所在的数据集 (写法举例:data$education)。

仍值得提出的是,R语言的作图功能十分强大,且其与STATA在此功能上也存在一些区别。对于散点图的绘制,STATA应用“scatter”命令,而R语言会应用“plot”命令。

举例说明:当我们拿到一份数据时,我们可能不会马上有一些研究想法和随即的思路,但我们可以对数据进行初步的探索。作散点图就是一个很好的方向。假设我们现在想对参加者的收入(命名为income)随时间(命名为year)的变化关系做一个探究,我们可以对其进行散点图的绘制。

散点图:

Scatter 纵坐标 横坐标

scatter income year

R语言:

plot 横坐标 纵坐标

plot (datayear, data$income)

需要注意的是不同统计软件中横坐标和纵坐标在代码命令中的顺序。