Python学习第十九天,Pandas学习(一)

204 阅读2分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第19天,点击查看活动详情

Pandas

Pandas是十分实用的一个库,它比较适合处理结构化的数据,如序列数据,表格数据等,例如csv文件,利用pandas可以快速的对数据进行复杂的转换过滤等操作。

安装Pandas库

image.png

选择设置 image.png

搜索Pandas库

image.png

安装即可 image.png

终端输入指令:pip install pandas

image.png

Pandas常用的数据类型

  • Series: 一维数组,类似于Python中的基本数据结构list,区别是Series只允许存储相同的数据类型。
  • DataFrame: 二维的表格型数据结构。

Series

Pandas创建Series函数

import pandas as pd
pd.Series(data,index)
data 是值部分,index 是索引部分

举个例子:

import pandas as pd
lis_1 = [i for i in "python"]
lis_2 = [i for i in range(len("python"))]
ser_1 = pd.Series(index=lis_1,data=lis_2)
print(f"Series可以设置index和data:\n{ser_1}")

结果:

image.png

DataFrame

DataFrame是一个表格型的数据结构,是以一个或多个二维块存放的数据表格(层次化索引),DataFrame既有行索引还有列索引,它有一组有序的列,每列既可以是不同类型(数值、字符串、布尔型)的数据,或者可以看做由Series组成的字典。

Pandas创建DataFrame函数

import pandas as pd
pd.DataFrame(data= dict,index,columns)
data 一般为字典形式,index 是行索引(竖直方向),columns 是列索引(水平方向)

举个例子:

lis_3 = [[i for i in range(5)],[j for j in range(5,0,-1)]]
dframe_1 = pd.DataFrame(lis_3)
dframe_2 = pd.DataFrame(lis_3 ,index =["one","two"])
dframe_3 = pd.DataFrame(data=lis_3,columns=["one","two","three","four","five"])
dic_1 = {"language":["Chinese","English","Spanish"],"id":[i+1 for i in range(3)]}
dframe_4 = pd.DataFrame(dic_1)
print(f"创建DataFrame时使用list\n未设置任何索引:\n{dframe_1}")
print("==========================")
print(f"设置index行索引:\n{dframe_2}")
print("==========================")
print(f"设置index行索引和columns列索引:\n{dframe_3}")
print("==========================")
print(f"创建DataFrame时使用字典:\n字典的键直接变成columns列索引\n{dframe_4}")

结果:

image.png