开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第19天,点击查看活动详情
Pandas
Pandas是十分实用的一个库,它比较适合处理结构化的数据,如序列数据,表格数据等,例如csv文件,利用pandas可以快速的对数据进行复杂的转换过滤等操作。
安装Pandas库
选择设置
搜索Pandas库
安装即可
终端输入指令:pip install pandas
Pandas常用的数据类型
Series: 一维数组,类似于Python中的基本数据结构list,区别是Series只允许存储相同的数据类型。DataFrame: 二维的表格型数据结构。
Series
Pandas创建Series函数
import pandas as pd
pd.Series(data,index)
data 是值部分,index 是索引部分
举个例子:
import pandas as pd
lis_1 = [i for i in "python"]
lis_2 = [i for i in range(len("python"))]
ser_1 = pd.Series(index=lis_1,data=lis_2)
print(f"Series可以设置index和data:\n{ser_1}")
结果:
DataFrame
DataFrame是一个表格型的数据结构,是以一个或多个二维块存放的数据表格(层次化索引),DataFrame既有行索引还有列索引,它有一组有序的列,每列既可以是不同类型(数值、字符串、布尔型)的数据,或者可以看做由Series组成的字典。
Pandas创建DataFrame函数
import pandas as pd
pd.DataFrame(data= dict,index,columns)
data 一般为字典形式,index 是行索引(竖直方向),columns 是列索引(水平方向)
举个例子:
lis_3 = [[i for i in range(5)],[j for j in range(5,0,-1)]]
dframe_1 = pd.DataFrame(lis_3)
dframe_2 = pd.DataFrame(lis_3 ,index =["one","two"])
dframe_3 = pd.DataFrame(data=lis_3,columns=["one","two","three","four","five"])
dic_1 = {"language":["Chinese","English","Spanish"],"id":[i+1 for i in range(3)]}
dframe_4 = pd.DataFrame(dic_1)
print(f"创建DataFrame时使用list\n未设置任何索引:\n{dframe_1}")
print("==========================")
print(f"设置index行索引:\n{dframe_2}")
print("==========================")
print(f"设置index行索引和columns列索引:\n{dframe_3}")
print("==========================")
print(f"创建DataFrame时使用字典:\n字典的键直接变成columns列索引\n{dframe_4}")
结果: