本文已参与「新人创作礼」活动,一起开启掘金创作之路。
参考:【python pandas】读取和操作 Excel 表格内容
因为 csv文件和excel表格用 excel打开是完全相同的,二者的数据类型都是 DataFrame,所以pandas操作csv文件和excel表格的方法是完全相同的。唯一的不同是读取文件时的函数不同:
读取excel:data = pd.read_excel(file_path) 读取csv:data = pd.read_csv(file_path)
测试文件(test.csv)如下:
学生姓名,学生学号,考试成绩
猪小明,ST001,98
妹大爷,ST002,75
冷檬,ST003,85
闰土,ST004,75
王炸,ST005,93
茅台,ST006,75
球球,ST007,63
计算所有学生的平均成绩(保留两位小数):
import pandas as pd
score_data = pd.read_csv('test.csv', usecols=['考试成绩'])
score_sum, score_num = 0, 0
for index in score_data.index:
score_sum += score_data.loc[index].values.item()
score_num += 1
print(f"平均成绩: {score_sum / score_num :.2f}")
# 平均成绩: 80.57
通过实验发现,处理excel表格非常耗时间,而处理csv文件非常快,所以我们应当优先使用csv文件格式进行存储。