每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。
所有记录都有完全相同的字段序列,通常都是纯文本文件。
建议用nodepad++、sublime等编辑器进行编辑。
csv格式规则
- 开头是不留空,以行为单位。
- 可含或不含列名,含列名则居文件第一行。
- 一行数据不跨行,无空行。
- 以半角逗号(即,)作分隔符,列为空也要表达其存在。
- 列内容如存在半角引号(即"),替换成半角双引号("")转义,即用半角引号(即"")将该字段值包含起来。
- 文件读写时引号,逗号操作规则互逆。
- 内码格式不限,可为 ASCII、Unicode 或者其他。
- 不支持特殊字符
Python csv模块
csv模式是python内置的标准模块,用于读写csv格式的文件。
在csv模块中提供了reader、writer来读写csv格式的文件,下面我们一起看下这个两个函数使用示例。
示例功能:
- 先使用writer函数写一个csv文件
- 使用reader函数读取上述步骤写的csv文件内容,并在console中输出
#-\*- coding:utf-8 -\*-
import csv
if \_\_name\_\_ == "\_\_main\_\_":
print("python csv文件写读操作示例")
# 写csv文件
print("写入一些简单数据到csv\_data.csv文件中")
with open('csv\_data.csv', 'w', newline='') as csvfile:
spamwriter = csv.writer(csvfile, # 为打开要写的文件对象
delimiter=',' # 分隔符
)
spamwriter.writerow(['csv\_demo'] \* 5 + ['DeepTest'])
spamwriter.writerow(['hello',
'Study Python3', 'Auto Testing'])
csvfile.close()
print("读取csv\_data.csv问内容")
with open('csv\_data.csv', 'r') as f:
reader = csv.reader(f, delimiter=',')
for row in reader:
print("row的类型: ", type(row))
print(row)
# 遍历每行中每个数据项
for data in row:
print(data, " ")
f.close()
在Python csv模块中还提供了另外一种方式来读写csv文件,就是通过字典方式来读写,其提供的主要方法为:DictReader、DictWriter,下面我们一起一个基本的示例,大家可以根据这个示例与上面的示例进行对比,看看有什么不同。
#-\*- coding:utf-8 -\*-
import csv
if \_\_name\_\_ == "\_\_main\_\_":
print("python csv文件字典写读操作示例")
# 写csv文件
print("写入一些简单数据到csv\_dict\_data.csv文件中")
with open('csv\_dict\_data.csv', 'w') as csvfile:
# 写csv头
fieldnames = ['first\_name', 'last\_name']
writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
writer.writeheader()
# 写csv内容
writer.writerow({'first\_name': 'Baked',
'last\_name': 'Beans'})
writer.writerow({'first\_name': 'Lovely',
'last\_name': 'Spam'})
writer.writerow({'first\_name': 'Wonderful',
'last\_name': 'Spam'})
print("读取csv\_dict\_data.csv问内容")
with open('csv\_dict\_data.csv') as csvfile:
reader = csv.DictReader(csvfile)
for row in reader:
# 遍历每行中的数据
print(row['first\_name'], row['last\_name'])