一文看懂 Pandas 中的透视表

透视表在一种功能很强大的图表，用户可以从中读取到很多的信息。利用excel可以生成简单的透视表。本文中讲解的是如何在pandas中的制作透视表。

读取数据

注：本文的原始数据文件，可以在公号「Python数据之道」后台回复 “透视表”获取。

import pandas as pd
import numpy as np
df = pd.read_excel("./sales-funnel.xlsx")  # 当前目录下的文件
df.head()

使用 category数据类型，按照想要查看的方式设置顺序

不严格要求，但是设置了顺序有助于分析，一直保持所想要的顺序

df["Status"] = df["Status"].astype("category")
df["Status"].cat.set_categories(["won","pending","presented","declined"],inplace=True)  # 设置顺序

pd.pivot_table(df,index=["Manager","Rep"])  # index表示索引

2. 使用index和values两个参数

3. 使用aggfunc参数，指定多个函数

4.使用columns参数，指定生成的列属性

5. 解决数据的NaN值，使用fill_value参数

6. 查看总数据，使用margins=True

7. 不同的属性字段执行不同的函数

8. Status排序作用的体现

当通过透视表生成了数据之后，便被保存在了数据帧中

查询指定的字段值的信息

网上有一张关于利用pivot_table函数的分解图，大家可以参考下

本文的原始数据文件，可以在公号「Python数据之道」后台回复 “透视表”获取。\

作者简介

Peter，硕士毕业僧一枚，从电子专业自学Python入门数据行业，擅长数据分析及可视化。喜欢数据，坚持跑步，热爱阅读，乐观生活。

个人格言：不浮于世，不负于己

---------End---------****