
pandas Unique Values简介
熊猫的独特值功能是在分解信息时使用的;通常情况下,客户需要看到特定片段的特殊品质。例如,经常,当在pandas中处理一个主要的信息大纲时,你可能会有一个包含字符串/字符的段,你需要定位该段中存在的新奇成分的数量。Python中的Pandas库可以方便地让你找到有趣的品质。因此,我们将首先利用Panda的卓越能力来获得一个段的特殊估计,然后利用Panda的能力来获得一个段的有趣估计。
语法和参数
dataframe.unique()
它使用Pandas库返回该特定行或列的所有numpy数组和唯一值。
唯一值在Pandas中是如何工作的?
现在我们看到各种例子,说明唯一值是如何在Pandas中工作的。
例子#1
从列 "N "中找到唯一值
代码: import pandas as pd
info = {
'S':['S1', 'S2', 'S3', 'S4', 'S5'],
'P':['P1', 'P2', 'P3', 'P4', 'P4'],
'A':['A1', 'A2', 'A3', 'A3', 'A3'],
'N':['N1', 'N2', 'N2', 'N2', 'N2'],
'D':['D1', 'D1', 'D1', 'D1', 'D1'] }
df = pd.DataFrame(info)
df.N.unique()
print(df.N.unique())
输出:

在上面的程序中,我们首先将熊猫库导入为pd,然后创建字典或数据框架。在创建数据框架后,我们在数据框架中分配数值。最后,我们使用unique()函数,只打印特定列'N'的唯一值,这样就不会多次打印同一个值。这样,程序就实现了,输出结果如上面的快照所示。
例子#2
使用unique()函数来计算'D'列的唯一值。
代码: import pandas as pd
info = {
'S':['S1', 'S2', 'S3', 'S4', 'S5'],
'P':['P1', 'P2', 'P3', 'P4', 'P4'],
'A':['A1', 'A2', 'A3', 'A3', 'A3'],
'N':['N1', 'N2', 'N2', 'N2', 'N2'],
'D':['D1', 'D1', 'D1', 'D1', 'D1'] }
df = pd.DataFrame(info)
df.D.unique()
print(df.D.unique())
输出:

这里,与之前的代码类似,我们找到了不同列'D'的唯一值。像往常一样,我们将熊猫库导入为pd,然后定义数据框架并在特定的行和列中分配值。定义完数值后,我们使用unique()函数,只显示D列的数值。这样,代码就实现了,结果就如上面的快照所示。
另一个有点不直观的方法是利用Pandas中的drop_duplicates()工作,来获得段的非凡估计。Pandas的drop_duplicates()工作在一个变量/段上驱逐所有复制的质量,并返回一个Pandas排列。Pandas的unique()工作比numpy.unique更有优势,因为在这里我们同样可以有NA值,而且它几乎更快。unique()的工作依赖于哈希表。唯一性的返回是根据它们在信息集合中的出现情况排列的。
pandas的unique()工作从数据集中挤出非凡的信息。novel()技术不采取边界,并返回该部分的特殊品质的numpy集群。在我们剖析大量信息的时候,通常,我们需要一种信息来管理这种问题;我们使用Pandas unique()技术,它从一个给定的信息索引中返回非凡的信息。
在我们多次传递('y', 'x')的时候,然而,在收益率中,它只给出一次。这意味着pd.unique()工作已经筛选了复制的元组。回想一下,非凡()策略只对排列方式起作用,而不是对DataFrames起作用。如果你在DataFrame上调用one-of-a-kind()技术,在这一点上,它将会出现相应的失误。pd.unique()策略将NULL或None或NaN的值作为一个特殊值。如果你还没有引入numpy,那么请引入numpy并将numpy导入记录中。
在Pandas中处理DataFrame时,你必须找到该段中存在的特殊组件。为了做到这一点,我们需要利用interesting()策略,从段中分离出显著的品质。Python中的Pandas库可以毫无保留地帮助我们发现有趣的信息。段落中存在的非同寻常的品质将按其事件排列返回。这并不对请求的外观进行分类。同样的,这个策略也依赖于哈希表。它从根本上比numpy.unique()策略更快,而且还包括了无效的品质。
总结
最后,我们总结说,Python是一种用于进行信息调查的不可思议的语言,这主要是由于Python的信息驱动捆绑包的强大环境。Pandas就是其中之一,它使信息的引入和剖析变得更加简单。我们可以利用熊猫的独特价值对感兴趣的部分进行分析。此外,它还会返回NumPy展区,对该段进行显著的估计。这种技术只对排列方式起作用,而不是对数据帧起作用。正如收益率中出现的那样,这种技术将NULL激励作为一种新的价值。