目录:
一. 处理缺失数据
二. 滤除缺失数据
三. 填充缺失数据
一. 处理缺失数据
| 方法 | 说明 |
|---|---|
| dropna | 根据各标签的值中是否存在缺失数据对轴标签进行过滤,可通过阈值调节对缺失值的容忍度 |
| fillna | 用指定值或插值方法(如 ffill 或 bfill)填充缺失数据 |
| isnull | 返回一个含有布尔值的对象,这些布尔值表示哪些值时缺省值 \ NA,该对象的类型与源类型一样 |
| notnull | isnull 的否定式 |
二. 滤除缺失数据
dropna()
1. Series:dropna 返回一个仅含非空数据和索引值的 Series
2. DataFrame:
行:dropna默认丢弃任何含有缺失值的行,传入 how = 'all' 将值丢弃权威 NA 的那些行。
列:传入 axis = 1,如 data.dropna(axis = 1, how = 'all')
三. 填充缺失数据
fillna()
1. df.fillna(0),用 0 填充空值
2. 通过字典调用 fillna,可以实现对不同的列填充不同的值:
df.fillna({1:0.5, 3:-1})
3. fillna 默认会返回新对象,但也可以对现有对象进行就地修改:
_ = df.fillna(0, inplace = True)
以上整理自《利用Python进行数据分析》。