Pandas:如何对特定的列使用fillna()

5,811 阅读2分钟

你可以使用以下方法和fillna()来替换 pandas DataFrame 中特定列的 NaN 值:

方法1:在一个特定列中使用fillna()

df['col1'] = df['col1'].fillna(0)

方法2:在多个特定列中使用fillna()

df[['col1', 'col2']] = df[['col1', 'col2']].fillna(0) 

本教程解释了如何在以下pandas DataFrame中使用这个函数:

import numpy as np
import pandas as pd

#create DataFrame with some NaN values
df = pd.DataFrame({'rating': [np.nan, 85, np.nan, 88, 94, 90, 76, 75, 87, 86],
                   'points': [25, np.nan, 14, 16, 27, 20, 12, 15, 14, 19],
                   'assists': [5, 7, 7, np.nan, 5, 7, 6, 9, 9, 5],
                   'rebounds': [11, 8, 10, 6, 6, 9, 6, 10, 10, 7]})

#view DataFrame
df

        rating	points	assists	rebounds
0	NaN	25.0	5.0	11
1	85.0	NaN	7.0	8
2	NaN	14.0	7.0	10
3	88.0	16.0	NaN	6
4	94.0	27.0	5.0	6
5	90.0	20.0	7.0	9
6	76.0	12.0	6.0	6
7	75.0	15.0	9.0	10
8	87.0	14.0	9.0	10
9	86.0	19.0	5.0	7

例子1:在一个特定列中使用 fillna()

下面的代码显示了如何使用 **fillna()**将 "评级 "列中的 NaN 值替换为零

#replace NaNs with zeros in 'rating' column
df['rating'] = df['rating'].fillna(0)

#view DataFrame 
df

	rating	points	assists	rebounds
0	0.0	25.0	5.0	11
1	85.0	NaN	7.0	8
2	0.0	14.0	7.0	10
3	88.0	16.0	NaN	6
4	94.0	27.0	5.0	6
5	90.0	20.0	7.0	9
6	76.0	12.0	6.0	6
7	75.0	15.0	9.0	10
8	87.0	14.0	9.0	10
9	86.0	19.0	5.0	7

请注意,NaN值只在 "评级 "列中被替换,其他每一列都没有动过。

例2:使用fillna() 有几个特定列

下面的代码显示了如何使用**fillna()**将 "评级 "和 "积分 "两列中的NaN值替换为零:

#replace NaNs with zeros in 'rating' and 'points' columns
df[['rating', 'points']] = df[['rating', 'points']].fillna(0)

#view DataFrame
df

	rating	points	assists	rebounds
0	0.0	25.0	5.0	11
1	85.0	0.0	7.0	8
2	0.0	14.0	7.0	10
3	88.0	16.0	NaN	6
4	94.0	27.0	5.0	6
5	90.0	20.0	7.0	9
6	76.0	12.0	6.0	6
7	75.0	15.0	9.0	10
8	87.0	14.0	9.0	10
9	86.0	19.0	5.0	7

注意,NaN值在 "评级 "和 "积分 "列中被替换了,但其他列仍未被触动。

:你可以在这里找到pandas**fillna()**函数的完整文档。

其他资源

下面的教程解释了如何在pandas中执行其他常见操作:

如何在Pandas中计算缺失值
如何在Pandas中删除有NaN值的行
如何在Pandas中删除包含特定值的行