Python 教程之 Pandas(2)—— 创建 Pandas 数据框

2,263 阅读2分钟

携手创作,共同成长!这是我参与「掘金日新计划 · 8 月更文挑战」的第 32 天,点击查看活动详情

在现实世界中,将通过从现有存储中加载数据集来创建 Pandas DataFrame,存储可以是 SQL 数据库、CSV 文件和 Excel 文件。Pandas DataFrame 可以从列表、字典和字典列表等中创建。

Dataframe 是一种二维数据结构,即数据在行和列中以表格方式对齐。在按行和列排列的数据帧数据集中,我们可以在数据帧中存储任意数量的数据集。我们可以对这些数据集执行许多操作,例如算术运算、列/行选择、列/行加法等。

Pandas DataFrame 可以通过多种方式创建。让我们一一讨论创建DataFrame的不同方法。
创建空数据 
框:可以创建的基本数据框是空数据框。只需调用数据框构造函数即可创建空数据框。

# import pandas as pd
import pandas as pd

# 调用 DataFrame 构造函数
df = pd.DataFrame()

print(df)

输出 : 

Empty DataFrame
Columns: []
Index: []

  
使用 List 创建数据框: 
可以使用单个列表或列表列表创建数据框。

# import pandas as pd
import pandas as pd

# 字符串列表
lst = ['Geeks', 'For', 'Geeks', 'is',
			'portal', 'for', 'Geeks']

# 在列表中调用 DataFrame 构造函数
df = pd.DataFrame(lst)
print(df)

输出: 

从 ndarray/lists 的 dict创建 DataFrame : 
要从 narray/list 的 dict 创建 DataFrame,所有的 narray 必须具有相同的长度。如果传递了索引,则长度索引应等于数组的长度。如果没有传递索引,则默认情况下,索引将是 range(n),其中 n 是数组长度。

# Python 代码演示了从 dict narray / lists 默认地址创建 DataFrame。

import pandas as pd

# 初始化列表的数据。
data = {'Name':['Tom', 'nick', 'krish', 'jack'], 'Age':[20, 21, 19, 18]}

# 创建数据框
df = pd.DataFrame(data)

# 打印输出。
print(df)

输出: 

使用字典从列表中创建熊猫数据框:  使用字典从列表中创建熊猫数据框可以通过不同的方式实现。我们可以使用 pandas.DataFrame 使用字典从列表中创建 pandas 数据框。通过 Pandas 中的这种方法,我们可以将列表字典转换为数据框。

# importing pandas as pd
import pandas as pd

# 列表字典
dict = {'name':["aparna", "pankaj", "sudhir", "Geeku"],
		'degree': ["MBA", "BCA", "M.Tech", "MBA"],
		'score':[90, 40, 80, 98]}

df = pd.DataFrame(dict)

print(df)

输出: