使用Pandas替换数据集中的多个值教程

404 阅读2分钟

在本教程中,我们将看到如何使用pandas replace()方法来改变数据集中的多个值。Pandas是一个用于数据处理和分析的python库,它提供了广泛的功能,使数据集可以使用。

替换数据集中的多个值

按照下面的步骤,使用pandas库替换数据集中的多个值。

1.导入Pandas

首先,将Pandas导入你的代码中。

import pandas as pd

2.示例数据

我们将以下面的数据集为例,在Pandas DataFrame中实现它,其中'列'代表数据集的列标题,如DataFrame中定义的那样。

import pandas as pd
data = pd.DataFrame([    ['Jack',25,'USA'],
    ['Rohan',20,'India'],
    ['Sam',23,'France'],
    ['Rini',19,'UK'],
    ['Tywin',16,'Ireland']],

columns=['Name','Age', 'Country'])

当程序被执行,并且使用打印方法打印DataFrame时,上述代码会产生以下输出--有3列 "姓名"、"年龄 "和 "国家"。

print (data)

替换多个值的数据样本

3.使用replace()方法替换数值

在pandas中使用replace()方法可以将一个指定的值替换成另一个指定的值。在我们创建的样本数据集中,我们希望在 "国家 "列中把美国改为印度

new_data = data.replace({'Country':{'USA':'India'}})

print (new_data)

替换数据框中的单个值

现在,如果我们试图在数据框架中一次替换多个值,比如年龄列中的25到23,16到18,名字列中的'Tywin'到'Stark',下面是代码的样子。

updated_data = new_data.replace({'Age': {25:23, 16:18}, 'Name':{'Tywin':'Stark'}})

print(updated_data)

改变所需值后的最终输出:

替换数据框中的多个值

替换数据框中多个值的完整代码

试试下面的代码,看看Python中的replace()方法如何工作。

import pandas as pd
data = pd.DataFrame([
    ['Jack',25,'USA'],
    ['Rohan',20,'India'],
    ['Sam',23,'France'],
    ['Rini',19,'UK'],
    ['Tywin',16,'Ireland']],

columns=['Name','Age', 'Country'])
print (data)

print('\n')

new_data = data.replace({'Country':{'USA':'India'}})

print (new_data)

updated_data = new_data.replace({'Age': {25:23, 16:18}, 'Name':{'Tywin':'Stark'}})

print('\n')
print(updated_data)


总结

这就是本教程的内容。希望你已经很好地学习了如何用Python替换Pandas数据框架中的多个值。请继续关注AskPython,了解更多此类教程。