unique()和nunique()的区别

289 阅读1分钟

unique()nunique() 都是用于处理 Series 或 DataFrame 中唯一值的方法,但它们有一些不同之处。让我通过一个示例来说明它们的区别。

假设我们有一个包含重复值的 Series:

import pandas as pd

# 创建一个示例 Series
data = pd.Series([1, 2, 2, 3, 3, 3, 4, 4, 4, 4])

现在,我们可以使用 unique() 方法来获取 Series 中的唯一值数组:

unique_values = data.unique()
print("唯一值数组:")
print(unique_values)

这将输出:

唯一值数组:
[1 2 3 4]

而如果我们使用 nunique() 方法,则可以获取 Series 中的唯一值的数量:

unique_count = data.nunique()
print("唯一值数量:")
print(unique_count)

这将输出:

唯一值数量:
4

所以,unique() 返回一个包含 Series 中唯一值的数组,而 nunique() 返回唯一值的数量。在实际应用中,你可以根据需求选择使用哪一个方法。