大多数情况下,我们以CSV、excel或文本文件中的DataFrames形式使用或存储数据。但是我们也可以把数据保存为Pickle文件。Pickle 是一种在磁盘上表示 Python 对象的方式。它们以一种序列化的格式存储对象,以后可以用来重构对象。Pickles 对于存储需要快速和容易访问的数据是很有用的。在这篇文章中,我们将学习如何在Pandas中从pickle文件中存储和读取数据。让我们开始吧!
使用Pandas读取Pickle文件
Pandas提供了一种读取和写入pickle文件的方法。读取pickle文件的最基本方法是使用read_pickle()函数。这个函数把pickle文件的名字作为参数,并返回一个pandas DataFrame。
人们可以在Python中使用read_pickle()函数来读取pickle文件。
该函数的语法
pd.read_pickle(path, compression='infer')
与read_csv()函数类似,这个函数也会返回一个Pandas DataFrame作为输出。
比如说
df = pd.read_pickle('data.pkl')
现在让我们看看如何在python中保存一个数据到pickle文件。我们将从创建一个DataFrame开始。
import pandas as pd
data = {
'Name': ['Microsoft Corporation', 'Google, LLC', 'Tesla, Inc.',\
'Apple Inc.', 'Netflix, Inc.'],
'Icon': ['MSFT', 'GOOG', 'TSLA', 'AAPL', 'NFLX'],
'Field': ['Tech', 'Tech', 'Automotive', 'Tech', 'Entertainment'],
'Market Shares': [100, 50, 160, 300, 80]
}
df = pd.DataFrame(data)
# print dataframe
print(df)
输出
Name Icon Field Market Shares
0 Microsoft Corporation MSFT Tech 100
1 Google, LLC GOOG Tech 50
2 Tesla, Inc. TSLA Automotive 160
3 Apple Inc. AAPL Tech 300
4 Netflix, Inc. NFLX Entertainment 80
现在让我们把DataFrame保存到一个pickle文件中。
df.to_pickle('company info.pkl')
现在让我们来读一下这个pickle文件。
df2 = pd.read_pickle('company info.pkl')
# print the dataframe
print(df2)
输出
Name Icon Field Market Shares
0 Microsoft Corporation MSFT Tech 100
1 Google, LLC GOOG Tech 50
2 Tesla, Inc. TSLA Automotive 150
3 Apple Inc. AAPL Tech 200
4 Netflix, Inc. NFLX Entertainment 80
总结
综上所述,我们学习了如何使用Pandas的read_pickle()函数读取pickle文件。人们也可以使用read_pickle()函数来读取序列化为pickled对象的DataFrames。Pickle文件是存储数据的好帮手,但要确保如果你使用来自pickle文件的数据,它是来自一个可信赖的来源。