Pandas 按照两列分组后只选排序第一名

226 阅读1分钟

1、问题背景

每日有多条信息,即 updateTime 栏每天有多条,现需要按照国家、日期分组,只保留最后更新的一条数据。

2、代码

import pandas as pd

data = pd.read_csv('test.csv',header = 0)
df = pd.DataFrame(data)
df = df.sort_values('updateTime', ascending=False).groupby(['countryName','date']).first().reset_index()

以上,问题解决~