Python数据分析之 Pandas Series对象操作

740 阅读2分钟

一起养成写作习惯!这是我参与「掘金日新计划 · 4 月更文挑战」的第6天,点击查看活动详情

这篇文章主要说一下Series对象的基本操作。

Series 常用属性

  • index:获取索引
  • values:获取数组
  • size:获取元素数量
  • dtype:获取对象的数据类型

获取索引及修改索引

data = ["a", "b", "c", "d"]
s = pd.Series(data)
print(s.index)
s.index = ["A", "B", "C", "D"]
print(s.index)

结果输出如下:

RangeIndex(start=0, stop=4, step=1)
Index(['A', 'B', 'C', 'D'], dtype='object')

指定索引对应元素的获取、修改及删除
Series 通过索引获取、修改及删除对应元素和Python字典的操作有些类似,具体使用方法如下:

# 获取数据
print(s["A"])  
# 修改数据
s['A'] = 99  
# 删除数据
s = s.drop("B")  
s

另外,Series 也支持通过筛选条件获取数据,例如获取能被2整除的数据:

data = np.array([1, 2, 3, 4])
s = pd.Series(data)
s[s%2==0]

Series 切片
Series 切片操作同Python列表的切面也是类似的,如下:

s[0:3] 

表示取第0、1、2个数据。
也可以使用索引值来进行切片,例如获取索引值B-D的值:

s["B":"D"]

Series 常用方法

  • head(n):返回前n行数据,默认前5行
  • tail(n):返回后n行数据,默认后5行
  • isnull()&nonull():判断是否为空,返回True和False
  • sort_values():排序,通过传递ascending参数来确定升序or降序,默认为True,表示升序
  • dropna():删除空值

Series 运算

统计信息
可以通过describe()方法获取统计信息,如下:

image.png 也可以通过如下方法分别获取:

  • min():获取最小值
  • max():获取最大值
  • mean():获取均值
  • median():获取中位数
  • sum():获取总和
  • count():获取总数
  • ······ 四则运算
s+2  # 对每个元素进行+2
s*100  # 对每个元素乘100

也可以调用如下方法进行:加法add()、减法sub()、乘法mul()、除法div()

原创不易,如果小伙伴们觉得有帮助,麻烦点个赞再走呗~

最后,感谢女朋友在工作和生活中的包容、理解与支持 !