Pandas数据分析面试基础题(二)

386 阅读2分钟

Offer 驾到,掘友接招!我正在参与2022春招打卡活动,点击查看活动详情

上篇文章我们简单介绍了 Pandas 及其数据结构,还有两个创建 Series 对象的试题,下面我们接着通过试题的形式学习一下 Series 对象的具体操作。

试题一:Series 常用属性和方法有哪些?

(难度:easy)

分析 常用属性如下:

属性 说明
values    获取数组
index    获取索引
size    获取元素数量
dtype 获取对象的数据类型

常用方法如下:

方法 说明
head()返回前 n 行数据,默认5行
tail()返回后 n 行数据,默认5行
isnull()&nonull()检测缺失值
sort_values()排序,通过ascending参数来确定升序降序

试题二:如何修改 Series 索引?

(难度:easy)

分析 Series.index属性可用于获取或设置指定的索引标签。
代码

data = ["a", "b", "c", "d"]
s1 = pd.Series(data)
print(s1.index)
s1.index = ['A', 'B', 'C', 'D']
print(s1.index)

输出结果为:

RangeIndex(start=0, stop=4, step=1)
Index(['A', 'B', 'C', 'D'], dtype='object')

试题三:Series 如何获取、修改、删除指定索引元素?

(难度:easy)

分析 Series 获取、修改、删除指定索引元素类似于Python的字典,直接通过索引操作即可。
代码

print(s1['A'])  # 获取索引为'A'的值
s1 = s1.drop('D')  # 删除索引为 e 的值
s1['A'] = 100  # 修改索引为 A 的值 = 6
s1

输出结果为:

a
A    100
B      b
C      c
dtype: object

试题四:Series 如何进行切片?

(难度:easy)

分析 Series 切片操作与Python列表切片操作类似,例如访问s1的前2个数据: 代码

s1[:2]

试题五:Series 常用运算函数有哪些,如何使用?

(难度:easy)

分析 Series 四则运算分别是加法add()、减法sub()、乘法mul()、除法div(),均按照索引计算,如果索引不同则填充为 NaN(空值)。 代码

data = {'a' : 0, 'b' : 1, 'c' : 2}
s3 = pd.Series(data)

data = {'a' : 4, 'b' : 5, 'c' : 6, 'd': 7}
s4 = pd.Series(data)
s4
s3.add(s4)

结果输出为:

a    4.0
b    6.0
c    8.0
d    NaN
dtype: float64

除了四则运算,Series 还有一些其他的运算,例如求和sum()、求最大值max()、求最小值min()等等。

原创不易,如果小伙伴们觉得有帮助,麻烦点个赞再走呗~

最后,感谢女朋友在工作和生活中的包容、理解与支持 !