Pandas 数据重复处理 duplicated()和drop_duplicates()

2021-02-11 253 阅读1分钟

duplicated()和drop_duplicates()

import pandas as pd
import numpy as np

x=np.array([[1,2,3],[3,4,5],[1,2,3],[1,2,3]])
x=pd.DataFrame(x)
x

在这里插入图片描述

返回每行数据是否重复

x.duplicated()

在这里插入图片描述

x.duplicated().sum()

在这里插入图片描述

删除重复值

x=x.drop_duplicates()
x

在这里插入图片描述