「这是我参与2022首次更文挑战的第10天,活动详情查看:2022首次更文挑战」。
Python的第三方库就像手机上的各类APP,当你想搭建网站可以用Django,写小游戏用pygame;今天我们要学的Pandas主要是用来做数据分析的。
这里主要介绍一维数组和二维数组,分别对应Series和DataFrame.
Series的使用
在使用pandas库时,需要先导入pandas库,也很简单,输入以下代码即可:
import pandas as pd
一维数组,是由数字组成的以单纯的排序结构排列的结构单一的数组,是计算机程序中最基本的数组。在pandas中我们用通过创建Series对象来构造。例如:
import pandas as pd
list = ['fizz','kathy']
data = pd.Series(data = list)
print(data)
请看下面,创建Series时会生成索引。
那么我们可以修改这个索引吗?可以的,用index修改索引的名称即可,拿刚才的例子看看,我们将0,1改为boy,gril,我们在上面的代码后面加上两行:
data.index = ['boy','gril']
print(data)
不同的series也可以进行拼接,我们再一个名字,通过append拼接到data中:
import pandas as pd
list = ['fizz','kathy']
data = pd.Series(data = list)
data.append('jame')
print(data)
报错了,因为jame不是一个series。我们要将他转化为series
我们不能直接data.append('jame'),需要将jame转成series
可以看到我们上面的索引有两个为0的,这是什么情况呢?我们试试将索引为0的元素删除,看看会发生什么,这里用到的是drop,
data3 = data3.drop(0)
print(data3)
我们再打印出来看看。
可以看出来,是允许索引相同的,我们在使用的时候要注意这个问题。
回到第一个例子,我们如何通过索引来查找值呢?例如,我们要查boy是谁,直接用data['boy'] 即可。
import pandas as pd
list = ['fizz','kathy']
data = pd.Series(data = list)
data.index = ['boy','gril']
print(data['boy'])
