【python pandas】读取和操作 csv 文件内容【python pandas】读取和操作 Excel 表格内容

本文已参与「新人创作礼」活动，一起开启掘金创作之路。

因为 csv文件和excel表格用 excel打开是完全相同的，二者的数据类型都是 DataFrame，所以pandas操作csv文件和excel表格的方法是完全相同的。唯一的不同是读取文件时的函数不同：

读取excel：data = pd.read_excel(file_path) 读取csv：data = pd.read_csv(file_path)

测试文件（test.csv）如下：

学生姓名,学生学号,考试成绩
猪小明,ST001,98
妹大爷,ST002,75
冷檬,ST003,85
闰土,ST004,75
王炸,ST005,93
茅台,ST006,75
球球,ST007,63

计算所有学生的平均成绩（保留两位小数）：

import pandas as pd

score_data = pd.read_csv('test.csv', usecols=['考试成绩'])
score_sum, score_num = 0, 0
for index in score_data.index:
    score_sum += score_data.loc[index].values.item()
    score_num += 1
print(f"平均成绩： {score_sum / score_num :.2f}")
# 平均成绩： 80.57

通过实验发现，处理excel表格非常耗时间，而处理csv文件非常快，所以我们应当优先使用csv文件格式进行存储。