无涯教程-Seaborn - 观察值分布

79 阅读2分钟

在上一章中处理的类别散点图中,该方法在它可以提供的有关每个类别中值的分布的信息方面受到限制,现在,让无涯教程看看什么可以进行类别比较。

Box Plots

Box Plots是通过四分位数可视化数据分布的便捷方法,Box Plots通常具有从框延伸的垂直线,称为晶须。

这些晶须表示上下四分位数之外的变异性,因此,Box Plots也称为箱须图和箱须图,数据中的所有异常值均作为单个点绘制。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset(iris)
sb.swarmplot(x="species", y="petal_length", data=df)
plt.show()
Compressed

Violin Plots

Violin Plots 是箱形图与内核密度估计值的组合,因此,这些图更易于分析和理解数据的分布。

让无涯教程使用称为的技巧数据集来了解更多关于Violin Plots的信息,该数据集包含与餐厅顾客提供的小费相关的信息。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset(tips)
sb.violinplot(x="day", y="total_bill", data=df)
plt.show()
Stages


上图显示了一周中四天的total_bill分布,但是,除此之外,如果想了解性别分布的行为,请在下面的示例中进行探讨。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset(tips)
sb.violinplot(x="day", y="total_bill",hue=sex, data=df)
plt.show()
Difference

现在无涯教程可以清楚地看到男性和女性之间的消费行为。可以很容易地说,通过观察情节,男人比女人赚更多的钱。

而且,如果色相变量只有两个类别,可以通过在给定的一天将每个Violin Plots 分成两个而不是两个Violin Plots 来美化图表。Violin Plots 的任何部分都引用hue变量中的每个类。

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df=sb.load_dataset(tips)
sb.violinplot(x="day", y="total_bill",hue=sex, data=df)
plt.show()
Multistages

参考链接

www.learnfk.com/seaborn/sea…