python

70 阅读2分钟

一、series对象

Series是一种一维标记数组,可存储任意数据类型(整数、字符串、浮点数、Python 对象等)。它类似于带标签的列表或字典,每个元素都有一个与之关联的索引(标签),通过索引可以快速访问或修改元素。

import pandas as pd


#创建一个字典
dc={"name":"张三","age":18,"birth":"2025-10-1"}
indexs=["name","city"]
s1=pd.Series(dc)
print("Series:",s1) #属性

print(s1.shape)  #形状
print(s1.dtype)  #元素类型
ls=s1.values #返回series对象取名
print(ls)
print(type(ls))
s1.name="test"  #为series对象取名
print(s1)
s1.index.name="index_name"  #为索引取名
print(s1.size) #元素个数
print(s1.ndim) #维度
print(s1.nbytes) #大小

image.png

print(s1["name"])

ls=[1,2,3,4]
s2=pd.Series(ls)
print(s2[2:4])

image.png

二、DataFrame对象

DataFrame 是一个二维表格型数据结构**,类似于 Excel 表格、SQL 表或 R 语言中的 data.frame。它包含行和列,每行代表一条记录,每列代表一个特征(或字段),且每列可以是不同的数据类型(整数、字符串、布尔值等)。 **

# 创建dataframe对象
alist=[[1,2,3,4],[5,6,7,8]]
indexs=['one','two']
columns=['one','two','three','four']
df1=pd.DataFrame(alist,index=indexs,columns=columns)
print(df1)
#使用字典构建dataframe对象
adict={
    "name":['张三','李四','王五'],
    'age':[18,19,20],
    'city':['上海','北京','武汉']
}
df2=pd.DataFrame(adict)
print(df2)
#使用嵌套字典构建dataframe对象
adict1={
    "name":{1 :'张三',2 :'李四',3 :'王五'},
    'age':{1:18,2:19,3:20},
    'city':{1:'上海',2:'北京',3:'武汉'}
}
df3=pd.DataFrame(adict1)
print(df3)

image.png

#列索引访问
print(df3["name"])
print(type(df3["name"]))

#列索引+行索引
print(df3["name"][1])
#切片
print(df3[0:2]) #获取前两行
print(df3["name"][0:2]) #先确定某一列,再去切片

image.png

#属性
print(df3.dtypes)
print(df3.values)
print(df3.index)  #返回的行索引构成的数组
print(df3)
new_df3=df3.rename(columns={'name':'n','age':'a','city':'c'})
print(new_df3)
print(df3)
#修改行索引名
new_df3=df3.rename(index={1:10,2:20,3:30})
print(new_df3)
print()
print(df3)
print()
#为索引添加名
df3.index.name="test"
print(df3)
print()
print(df3.shape) #形状
print(df3.size) #元素个数
print(df3.ndim) #维度

image.png

三、pandas常用方法