pandas系列之导出为.xlsx文件(一)

1,322 阅读1分钟

本文所用表格内容如下:

商品信息表

image-20210801112646658.png

1.设置导出路径

设置文件导出路径就是保存为.xlsx文件时的文件路径,通过调整excel_writer的值即可实现.

import pandas as pd
​
goods_df = pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')
goods_df.to_excel(excel_writer='test.xlsx')

result:

保存前:

image-20210802104949102.png

保存后:

image-20210802105112677.png

需要注意的是:如果同一导出文件已经在本地打开,则不能再次运行导出代码,需要将本地文件关闭以后再次运行导出代码。

2.设置Sheet名称

.xlsx格式的文件有多个Sheet,Sheet的默认命名方式是Sheet后加阿拉伯数字,通常从1往上递增,我们也可以对默认的Sheet名字进行修改,只要修改sheet_name参数即可

goods_df = pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')
goods_df.to_excel(excel_writer='test.xlsx', sheet_name='测试文件')

result:

运行前:

image-20210802111844359.png

运行后:

image-20210802112002675.png

3.设置索引

上面导出文件中关于索引的参数都是默认的,也就是没有对索引有什么限制,但是我们可以看到index索引使用的是从0开始的默认自然数索引,这种索引可以通过设置参数index=False在导出时去掉该索引、

goods_df = pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')
goods_df.to_excel(excel_writer='test.xlsx', sheet_name='测试文件', index=False)

result:

设置前:

image-20210802112002675.png

设置后:

image-20210802112406256.png

4.设置要导出的列

有的时候一个表的列数很多,只需要导出部分列的内容。这个时候可以通过设置columns参数来指定要导出的列

goods_df = pd.read_excel(r'C:\Users\viruser.v-desktop\Desktop\商品信息表.xlsx')
goods_df.to_excel(excel_writer='test.xlsx', sheet_name='测试文件', index=False,columns=['分类', '名称'])

result:

设置导出列之前:

image-20210802112406256.png

设置导出列之后:

image-20210802133712953.png