开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第20天,点击查看活动详情
DataFrame的属性
| 属性 | 描述 |
|---|---|
| values | 查看所有元素的值 |
| dtypes | 查看所有元素的类型 |
| index | 查看所有行名、重命名行名 |
| columns | 查看所有列名、重命名列名 |
| T | 行列数据转换 |
| head | 查看前N条数据,默认5条 |
| tail | 查看后N条数据,默认5条 |
| shape | 查看行数和列数shape[0] 表示行,shape[1] 表示列 |
| info | 查看索引、数据类型和内存信息 |
几个常用的属性:
import pandas as pd
lis_1 = [[i for i in range(5)],[j for j in range(4,-1,-1)]]
df_1 = pd.DataFrame(lis_1,columns=[" one"," two"," three"," four"," five"],index =[ "第一行","第二行"])
print(df_1)
print(f"value属性显示的是DataFrame的值部分:\n{df_1.values}")
df_1.index = ["Python","Java"]
print(f"更改index行索引可以直接进行赋值(columns列索引同理):\n{df_1}")
lis_2 = [[i for i in range(5)],[j for j in range(4,-1,-1)],[i for i in range(5)],[j for j in range(4,-1,-1)],[i for i in range(5,10)],[j for j in range(2,7)]]
df_2 = pd.DataFrame(lis_2)
print(df_2)
print("====================")
print(f"head查看前5项\n{df_2.head()}")
print("====================")
print(f"tail查看后5项\n{df_2.tail()}")
结果:
DataFrame的基础函数
| 属性 | 描述 |
|---|---|
| describe() | 查看每列的统计汇总信息,DataFrame类型 |
| count() | 返回每一列的非空值的个数 |
| sum() | 返回每一列的和,无法计算返回空值 |
| max() | 返回每一列的最大值 |
| min() | 返回每一列的最小值 |
举例:
lis_3 = [['中国',1400,21],['美国',7000,25],['俄罗斯',1000,18]]
column=['国家','数量','GDP']
df_3 = pd.DataFrame(data=lis_3,columns=column)
print(df_3)
print(f"count(计数):{df_3['国家'].count()}")
print(f"sum(求和):{df_3['数量'].sum()}")
print(f"max(最大):{df_3['数量'].max()}")
print(f"min(最小):{df_3['数量'].min()}")
结果: