R语言 | 统计变换stat

69 阅读1分钟

本文内容概括

R语言的统计变换。

简单的条形图

条形图在统计学中可以用来揭露图形中的一些信息,通过geom_bar()函数就可以绘制简单的基本条形图。

代码如下:

R22.png

利用diamonds数据集,构造了一个以cut为x轴的坐标系。

结果如图:

R21.png

可以从条形图看出,高质量切割的钻石比低质量切割的钻石要多一些。但是有一个问题,y轴的count变量是什么?这不是diamonds数据集中的数据。

stat(statistical transformation)统计变换

在绘制这个条形图时,采用了用来计算新数据的stat算法。算法步骤如下:

(1)geom_bar()开始处理diamonds数据集。

(2)geom_bar()按照cut分组,对数量进行统计,形成count值,产生一个新的数据集。

(3)geom_bar()对这个新的数据集进行绘制图形,生成条形图。

几何对象函数和统计变换函数互换使用

不难发现,geom_bar函数的stat默认值是count,也就是说geom_bar()函数使用stat_count()函数进行了统计变换。在一般情况下,几何对象函数和统计变换函数可以互换使用,在这个示例中,我们可以使用stat_count()替换geom_bar()。

R23.png

结束语

统计变换的几个要点介绍完毕,就此结束。