如何在Pandas中读取Pickle文件?

1,389 阅读2分钟

大多数情况下,我们以CSV、excel或文本文件中的DataFrames形式使用或存储数据。但是我们也可以把数据保存为Pickle文件。Pickle 是一种在磁盘上表示 Python 对象的方式。它们以一种序列化的格式存储对象,以后可以用来重构对象。Pickles 对于存储需要快速和容易访问的数据是很有用的。在这篇文章中,我们将学习如何在Pandas中从pickle文件中存储和读取数据。让我们开始吧!

使用Pandas读取Pickle文件

Pandas提供了一种读取和写入pickle文件的方法。读取pickle文件的最基本方法是使用read_pickle()函数。这个函数把pickle文件的名字作为参数,并返回一个pandas DataFrame。

人们可以在Python中使用read_pickle()函数来读取pickle文件。

该函数的语法

pd.read_pickle(path, compression='infer')

read_csv()函数类似,这个函数也会返回一个Pandas DataFrame作为输出。

比如说

df = pd.read_pickle('data.pkl')

现在让我们看看如何在python中保存一个数据到pickle文件。我们将从创建一个DataFrame开始。

import pandas as pd
data = {
    'Name': ['Microsoft Corporation', 'Google, LLC', 'Tesla, Inc.',\
             'Apple Inc.', 'Netflix, Inc.'],
    'Icon': ['MSFT', 'GOOG', 'TSLA', 'AAPL', 'NFLX'],
    'Field': ['Tech', 'Tech', 'Automotive', 'Tech', 'Entertainment'],
    'Market Shares': [100, 50, 160, 300, 80]
           }
df = pd.DataFrame(data)
# print dataframe
print(df)

输出

  Name  Icon          Field  Market Shares
0  Microsoft Corporation  MSFT           Tech            100
1            Google, LLC  GOOG           Tech             50
2            Tesla, Inc.  TSLA     Automotive            160
3             Apple Inc.  AAPL           Tech            300
4          Netflix, Inc.  NFLX  Entertainment             80

现在让我们把DataFrame保存到一个pickle文件中。

df.to_pickle('company info.pkl')

现在让我们来读一下这个pickle文件。

df2 = pd.read_pickle('company info.pkl')
# print the dataframe
print(df2)

输出

   Name  Icon          Field  Market Shares
0  Microsoft Corporation  MSFT           Tech            100
1            Google, LLC  GOOG           Tech             50
2            Tesla, Inc.  TSLA     Automotive            150
3             Apple Inc.  AAPL           Tech            200
4          Netflix, Inc.  NFLX  Entertainment             80

总结

综上所述,我们学习了如何使用Pandas的read_pickle()函数读取pickle文件。人们也可以使用read_pickle()函数来读取序列化为pickled对象的DataFrames。Pickle文件是存储数据的好帮手,但要确保如果你使用来自pickle文件的数据,它是来自一个可信赖的来源。