Pandas唯一值、值计数以及成员资格

225 阅读1分钟
方法说明
isin计算一个表示 “Series各值是否包含于传入的值序列中”的布尔型数组
unique计算 Series 中的唯一值数组,按发现的顺序返回
value_counts返回一个 Series,其索引为唯一值,其值为频率,按计数值降序排列

isin() 函数应用:

import pandas as pd

# 处理数据,选择 B 列中有 name 值的行,并将结果写入 out.csv 文件中
def data_process():    
    data = pd.read_excel('test.xlsx',header = 0)
    data = data[['A','B', 'C','D']]
    df = pd.DataFrame(data)
    df = df[df.B.isin(['name'])]
    df.to_csv('out.csv')

 

表格内容整理自《利用 Python进行数据分析》。