hist()函数被定义为了解数据集中某些数字变量分布的一种快速方法。它将数字变量中的值划分为" bins "。它计算落入每个箱柜中的检查次数。这些集合负责通过可视化集合来快速直观地了解变量中值的分布。
无涯教程可以使用 DataFrame.hist()方法创建直方图,该方法是matplotlib pyplot API的包装器。
语法
DataFrame.hist(data, column=None, by=None, grid=True, xlabelsize=None, xrot=None, ylabelsize=None, yrot=None, ax=None, sharex=False, sharey=False, figsize=None, layout=None, bins=10, **kwds)
参数
- data - 一个DataFrame。 这是一个PandasDataFrame对象,用于保存数据。
- column - 是指字符串或序列。 如果传递,它将用于将数据限制为列的子集。
- by - 这是一个可选参数。如果通过,它将用于形成独立组的直方图。
- grid - 它也是可选参数。用于显示轴网格线。默认值为True。
- xlabelsize - 是指整数值。默认值无。用于指定x轴标签大小的更改。
- xrot - 是指浮点值。用于旋转x轴标签。默认值None。
- ylabelsize - 是指整数值。用于指定y轴标签大小的更改。
- yrot - 是指浮点值。用于旋转y轴标签s。默认值None。
- ax - Matplotlib轴对象。 它定义了无涯教程需要绘制直方图的轴。默认值None。
- sharex - 是布尔值。如果ax为None,则默认值为True。否则为False。
Note: 在轴和sharex中都传递true,它将更改所有子图的所有x轴标签。
- sharex - 默认值为False。如果子图为True,则它共享y轴并将一些y轴标签设置为不可见。
- figsize - 是指要创建图形的英寸尺寸。默认情况下,它使用 matplotlib.rcParams 中的值。
- layout - 这是一个可选参数。返回直方图布局的(行,列)元组。
- bins - 默认值10。它是指要使用的直方图集合的数量。如果给出整数值,则它将返回bin +1 bin边缘的计算值。
- ** kwds - 引用要传递给matplotlib.pyplot.hist()的所有其他绘图关键字参数。
返回值
它返回matplotlib.AxesSubplot或numpy.ndarray。
import pandas as pd info = pd.DataFrame({ length: [2, 1.7, 3.6, 2.4, 1], width: [4.2, 2.6, 1.6, 5.1, 2.9] }) hist = info.hist(bins=4)
输出