在Python中处理数据框架的行和列

89 阅读3分钟

在这篇文章中,让我们看看如何使用Python创建类似表格的结构,并处理它们的行和列。当我们创建需要处理大量数据的数据科学应用时,这将是非常有用的。让我们看看我们如何使用Python执行基本的功能,如创建、更新和删除行/列。

什么是数据框?

Python,作为一种广泛用于数据分析和处理的语言,有必要以结构化的形式存储数据,比如在我们传统的表格中以行和列的形式存储。我们使用Python的Pandas库中的DataFrame对象来实现这一点。在内部,数据是以二维数组的形式存储的。让我们在本文中进一步了解DataFrame的行和列。

创建一个简单的DataFrame

让我们通过一个例子来学习如何创建一个简单的DataFrame

import pandas as pd

data = {
  "TotalScore": [420, 380, 390],
  "MathScore": [50, 40, 45]
}

#load data into a DataFrame object:
df = pd.DataFrame(data)

print(df) 

结果

       

有选择地打印一个数据框架的列

让我们看看如何在python中选择所需的列。考虑到我们有一个数据框架,如上面的案例所示。我们可以通过他们的列来选择所需的列。

print(df[['MathScore']])

上面的代码将只是打印'MathScore'列的值。

在Python中向数据框架添加列

现在,有时我们可能想增加一些列作为我们数据收集的一部分。我们可以通过声明一个新的列表并将其转换为数据框架中的一个列来为我们的数据框架增加更多列。

# creating  a new list called name.
name = ['Rhema', 'Mehreen', 'Nitin']
  
# Using 'Name' as the column name
# and equating it to the list
df['Name'] = name
  
# Observe the result
print(df)

输出

   

删除一个列

我们可以使用pandas数据框架中的drop()方法来删除某一列。

# dropping passed columns
df.drop(["Name"], axis = 1, inplace = True)

现在,"Name "列将从我们的数据框架中被删除。

使用数据框架的行

现在,让我们试着了解一下在行上执行这些操作的方法。

选择一个行

要从数据框架中选择行,我们可以使用loc[]方法或iloc[]方法。在loc[]方法中,我们可以使用行的索引值来检索行。我们也可以使用iloc[]函数来检索行,使用整数位置到iloc[]函数。

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv", index_col ="Name")
  
# retrieving row by loc method
first = data.loc["Shubham"]
second = data.loc["Mariann"]
  
  
print(first, "\n\n\n", second)

在上面的代码中,我们正在加载一个CSV文件作为一个数据框架,并将列 "名称 "作为其索引值分配。之后我们使用行的索引来检索它们。

在Python中创建一个数据框架行

要在我们的数据框架中插入一个新的行,我们可以在数据框架中使用append()函数、concat()函数或loc[]函数。

#adding a new row using the next index value.
df.loc[len(df.index)] = ['450', '80', 'Disha'] 
  
display(df)

#using append function

new_data = {'Name': 'Ripun', 'MathScore': 89, 'TotalScore': 465}
df = df.append(new_data, ignore_index = True)

#using concat function

concat_data = {'Name':['Sara', 'Daniel'],
        'MathScore':[89, 90],
        'TotalScore':[410, 445]
       }
  
df2 = pd.DataFrame(concat_data)

  
df3 = pd.concat([df, df2], ignore_index = True)
df3.reset_index()
  
print(df3)

输出

Using loc[] method

删除一个行

我们可以使用drop()方法来删除行。我们必须将行的索引值作为参数传递给该方法。

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("employees.csv", index_col ="Name" )
  
# dropping passed values
data.drop(["Shubham", "Mariann"], inplace = True)


总结

因此,在这篇文章中,我们已经讨论了在Python中处理行和列的各种方法。总的来说,数据框架是Python中的二维结构,我们可以用它来存储数据和执行其他各种功能。

参考资料

在这里找到数据框架的官方文档 - pandas.pydata.org/docs/refere…