无涯教程-Seaborn - 导入数据和库

145 阅读2分钟

在本章中,无涯教程将讨论如何导入数据集和库。首先了解如何导入库。

导入库

从导入Pandas开始,Pandas是用于管理关系数据集, Seaborn在处理DataFrames时非常方便,DataFrames是用于数据分析最广泛使用的数据结构。

以下命令将帮助您导入Pandas-

# Pandas for managing datasets
import pandas as pd

现在,导入Matplotlib库,它可以帮助无涯教程自定义绘图。

# Matplotlib for additional customization
from matplotlib import pyplot as plt

将使用以下命令导入Seaborn库-

# Seaborn for plotting and styling
import seaborn as sb

导入数据集

已经导入了所需的库,在本节中将了解如何导入所需的数据集,Seaborn随附了库中的一些重要数据集,安装Seaborn后,数据集将自动下载。

您可以使用任何这些数据集进行学习,借助以下函数,您可以加载所需的数据集

load_dataset()

导入数据框

无涯教程将导入数据集。默认情况下,此数据集作为Pandas DataFrame加载,如果Pandas DataFrame中有任何函数,则可以在此DataFrame上使用。

以下代码行将帮助您导入数据集-

# Seaborn for plotting and styling
import seaborn as sb
df=sb.load_dataset(tips)
print df.head()

上面的代码行将生成以下输出-

   total_bill  tip   sex    smoker day  time   size
0    16.99    1.01   Female  No    Sun  Dinner  2
1    10.34    1.66   Male    No    Sun  Dinner  3
2    21.01    3.50   Male    No    Sun  Dinner  3
3    23.68    3.31   Male    No    Sun  Dinner  2
4    24.59    3.61   Female  No    Sun  Dinner  4

要查看Seaborn库中的所有可用数据集,可以将以下命令与 get_dataset_names()函数一起使用,如下所示-

import seaborn as sb
print sb.get_dataset_names()

上面的代码行将返回可用作以下输出的数据集列表

[uanscombe, uattention, ubrain_networks, ucar_crashes, udots, 
uexercise, uflights, ufmri, ugammas, uiris, uplanets, utips, 
utitanic]

DataFrames 以矩形网格的形式存储数据,通过该网格可以轻松查看数据,矩形网格的每一行都包含一个的值,网格的每一列都是一个向量,用于保存特定变量的数据。这意味着DataFrame的行不需要包含相同数据类型的值,它们可以是数字,字符,逻辑等。

参考链接

www.learnfk.com/seaborn/sea…