Pandas 缺失数据

102 阅读1分钟

目录:

一. 处理缺失数据

二. 滤除缺失数据

三. 填充缺失数据

 

一. 处理缺失数据

方法说明
dropna根据各标签的值中是否存在缺失数据对轴标签进行过滤,可通过阈值调节对缺失值的容忍度
fillna用指定值或插值方法(如 ffill 或 bfill)填充缺失数据
isnull返回一个含有布尔值的对象,这些布尔值表示哪些值时缺省值 \ NA,该对象的类型与源类型一样
notnullisnull 的否定式

 

二. 滤除缺失数据

dropna()

1. Series:dropna 返回一个仅含非空数据和索引值的 Series

2. DataFrame:

行:dropna默认丢弃任何含有缺失值的行,传入 how = 'all' 将值丢弃权威 NA 的那些行。

列:传入 axis = 1,如 data.dropna(axis = 1, how = 'all')

 

三. 填充缺失数据

fillna()

1. df.fillna(0),用 0 填充空值

2. 通过字典调用 fillna,可以实现对不同的列填充不同的值:

df.fillna({1:0.5, 3:-1})

3. fillna 默认会返回新对象,但也可以对现有对象进行就地修改:

_ = df.fillna(0, inplace = True)

 

以上整理自《利用Python进行数据分析》。