R编程语言中的直方图教程及实例

767 阅读2分钟

简介

在这篇文章中,我们将通过R编程语言中直方图的使用教程。我们将首先介绍hist()函数的语法,然后看到使用该函数在R语言中创建直方图的各种例子。

R语言中直方图hist()函数的语法

hist()函数的基本语法如下

hist(v, main, xlab, xlim, ylim, breaks, col, border)

  • v"这是需要绘制直方图的数值或数据
  • main :用于为图表提供标题。
  • col:用于设置条形图的颜色。
  • xlab: 用于标记水平轴。
  • border:用于设置每个条形图的边框颜色。**用于设置每个条形图的边框颜色。
  • xlim :用于绘制x轴的数值。
  • ylim:用 于绘制Y轴的数值。
  • breaks: 用于设置每个条形图的宽度。用于设置每个条形图的宽度。

直方图在R语言中的例子

加载数据集

在这里,我们将把CSV文件加载到一个数据框架df中,其中包括商场客户,并由流派、年龄、收入和消费分数等列组成。这个数据集将被用于下面所有的直方图例子中。

In[1]:

df <- read.table("mall.csv",header=TRUE,sep=',') 
options( warn = -1 )
head(df)

Out[1]:

顾客ID类型年龄收入分数
1男性191539
2211581
3女性20166
4231677
5女性311740
6女性221776

例1:R语言中的基本直方图

通过将数据框传递给hist()函数并使用'$'符号引用要绘制的列,可以绘制一个基本的直方图。在这个例子中,我们绘制了数据框df中Age列的直方图。

In[2]:

hist(df$Age)

输出[2]:

Example of Histogram in R Programming

例2:在R语言中为柱状图添加标题

我们可以使用主参数为直方图添加标题,此外,我们使用lab来标记x轴。

在[3]中:

hist(df$Age,
main="MALL CUSTOMERS", xlab="INCOME",
xlim=c(15,75))

Out[3]:

Histogram in R Programming

例3:给直方图添加颜色

通过使用col参数可以为直方图添加颜色,如下例所示,我们传递了橙色。

在[4]中:

hist(df$Age,
main="MALL CUSTOMERS", xlab="INCOME",
xlim=c(15,75),
col="orange")

输出[4]:

Example of Histogram in R Programming

例四:在直方图中添加阴影填充图案

在下面的例子中,我们创建了一个带有45°斜线的阴影填充直方图。

在[5]中:

hist(df$Age,
main="MALL CUSTOMERS", xlab="INCOME",
     col="dodgerblue3",
     density=25,
     angle=45)

Out[5]:

Histogram in R Language

例五:设置X轴和Y轴的限制

为了给X轴和Y轴设置限制,我们使用参数xlim和ylim,传递给这两个参数的范围将设置直方图的坐标轴。让我们看一下下面的实现。

In[6]:

hist(df$Age, xlim=c(30,70), ylim=c(0,70),col='pink')

Out[6]:

Histogram in R Language

例6:在直方图的顶部添加数值

现在我们将使用text()函数在直方图的顶部打印数值,这将使我们的直方图更直观,更容易将Y轴上的数值可视化。

In[7]:

 m<-hist(df$Age,
main="MALL CUSTOMERS", xlab="INCOME",, ylab ="Frequency", 
        col = "royalblue", border = "pink")  
  
# Setting labels  
text(m$mids, m$counts, labels = m$counts, adj = c(0.5, -0.5)) 

Out[7]:

Histogram in R Language

例7:带断点的直方图

断点选项有助于控制直方图的bin或bar。在下面的例子中,我们设置了一个范围,在0到80之间,大小为5的断点。

In [8]:

hist(df$Age,breaks=seq(0,80,by=5),col='lightgreen')

Out[8]:

例8:用密度线叠加直方图

要在直方图上添加密度曲线,你可以使用lines函数来绘制曲线,使用密度函数来计算分布的基本非参数(核)密度。

In[9]:

hist(df$Age,
     col="lightblue1",
     freq = FALSE)
lines(density(df$Age))
polygon(density(df$Age),
        col=rgb(1,0,1,.2))

Out[9]:

The postTutorial of Histogram in R Programming Language with Examplesappeared first onMLK - Machine Learning Knowledge.