本文内容概括
R语言的统计变换。
简单的条形图
条形图在统计学中可以用来揭露图形中的一些信息,通过geom_bar()函数就可以绘制简单的基本条形图。
代码如下:
利用diamonds数据集,构造了一个以cut为x轴的坐标系。
结果如图:
可以从条形图看出,高质量切割的钻石比低质量切割的钻石要多一些。但是有一个问题,y轴的count变量是什么?这不是diamonds数据集中的数据。
stat(statistical transformation)统计变换
在绘制这个条形图时,采用了用来计算新数据的stat算法。算法步骤如下:
(1)geom_bar()开始处理diamonds数据集。
(2)geom_bar()按照cut分组,对数量进行统计,形成count值,产生一个新的数据集。
(3)geom_bar()对这个新的数据集进行绘制图形,生成条形图。
几何对象函数和统计变换函数互换使用
不难发现,geom_bar函数的stat默认值是count,也就是说geom_bar()函数使用stat_count()函数进行了统计变换。在一般情况下,几何对象函数和统计变换函数可以互换使用,在这个示例中,我们可以使用stat_count()替换geom_bar()。
结束语
统计变换的几个要点介绍完毕,就此结束。