`pandas.head`()函数:访问一个数据框架或序列的前n行的方法

149 阅读3分钟

pandas.head()函数用于访问一个数据框架或序列的前n行。它返回一个带有前几条记录的较小版本的调用者对象。

在这篇文章中,你将学习如何使用python head函数,自定义条目数和另外两个以不同方式完成相同工作的函数。

pandas.head

  • 语法pandas.head(n=5)
  • 目的: 返回前n行。这个函数根据位置返回对象的前n行。它对于快速测试你的对象中是否有正确的数据类型非常有用。
  • 参数:
    • n: int (默认5) 要选择的行数。
  • 返回与调用者相同的类型
    • 调用者对象的前n行。
# Import packages
import pandas as pd

Pandas或Python Head函数

Head函数返回带有前几行(默认为5行)的数据框或序列。要执行这个函数,请将.head() 函数链接到数据框架或序列。

1.系列上的头部函数

head 函数应用于系列对象时,其结果也会以系列的形式返回。

# Create a Series
seriesA = pd.Series(list(range(1,100)))

# Apply head function
seriesA.head()
0    1
1    2
2    3
3    4
4    5
dtype: int64

2.数据框架上的头部函数

当对一个数据框架应用head 函数时,其结果也会以数据框架的形式返回,其行数较少。

数据框架的长度

# Create a dataframe
df = pd.DataFrame({
                    'Subject_1_Marks': list(range(1,100)),
                    'Subject_2_Marks': list(range(1,100)),
                    'Subject_3_Marks': list(range(1,100)),
                    }
                 )

# check the length of the dataframe
len(df)   # or df.shape[0]
99

应用Head函数

df.head()

如何控制输出中的行数?

默认情况下,head 函数只返回数据集的前5行。为了控制这种行为,你可以使用n 参数。它接收你想显示的行数。

# Applying head function with n=10
df.head(n=10)

如果n是负数怎么办?

如果在行数参数n 中传递了一个负值,那么该函数会返回所有的行,除了最后的n 行。这与使用df[:-n] 赋值类似。

# Head function with n=-10 
df.head(n=-10)

其他函数

head函数返回从数据集开始的行。你可以使用函数tail ,从结尾处获取行。另外,sample 函数从整个数据集中返回一个随机行。让我们分别来实现它们。

尾部函数

它的工作方式与head函数相同,但返回最后几行。它也可以选择性地接受要显示的行数。

# tail function with n=7
df.tail(n=7)

采样函数

sample函数从整个数据集中返回一个随机行。默认情况下,它将返回一条随机行,但你可以使用n 参数指定要返回的行数。

注意:n 应该小于或等于数据集的长度,如果样本函数的replace=False (默认情况)。

# sample function with n=2
df.sample(n=3)

实用提示

  1. 无论位置如何,查看数据集的某些行是一个好的做法。你可以检查第一行,最后一行,或者任何随机的行。
  2. Head函数对于快速测试数据集是否包含正确的数据类型非常有用。

测试你的知识

Q1: Head函数可以接受负值。真的还是假的?

答案: 是的。该函数返回所有的行,除了最后的n 行。

Q2:头部和尾部函数的区别是什么?

答案: 尾部函数从数据集的末端返回行,而头部函数从开始返回行。