无涯教程-Seaborn - 绘制分类数据

87 阅读1分钟

在前面的章节中,无涯教程了解了散点图,六边形图和kde图,这些图用于分析研究中的连续变量。

当研究中的一个或两个变量是分类变量时,使用诸如slotlot(),swarmplot()等图,Seaborn提供了这样做的界面。在本节中,将学习分类散点图。

stripplot()

当所研究的变量之一是分类变量时,将使用stripplot()。它代表沿任一轴排序的数据。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset(iris)
sb.stripplot(x="species", y="petal_length", data=df)
plt.show()
Box

在上图中无涯教程可以清楚地看到每种物种的 petal_length 的差异。但是,上述散点图的主要问题是散点图上的点是重叠的。使用"Jitter"参数来处理。

Jitter会给数据增加一些随机噪声。此参数将调整沿分类轴的位置。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset(iris)
sb.stripplot(x="species", y="petal_length", data=df, jitter=Ture)
plt.show()
Dots

现在,可以轻松看到点的分布。

Swarmplot()

swarmplot()是可以替代"Jitter"的另一个选项。此函数将散点图的每个点定位在分类轴上,从而避免了点重叠-

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset(iris)
sb.swarmplot(x="species", y="petal_length", data=df)
plt.show()
Shades

参考链接

www.learnfk.com/seaborn/sea…