如何避免 Pandas 读取 CSV 文件时自动添加行号?

199 阅读1分钟

Pandas

1、导语

你是否曾经使用 Pandas 的 read_csv 方法读取过 CSV 文件,却发现它自动添加了一列行号,让你头疼不已?我懂你的痛苦!今天,我将向你展示如何解决这个问题,并分享一些其他有用的小技巧。

2、问题描述

让我们先来看一个例子。假设你有一个名为 test.csv 的文件,内容如下:

 姓名,年龄
 stormsha,8
 yara,13

现在,你使用以下 Python 代码读取这个文件:

 import pandas as pd
 ​python
 dataframe = pd.read_csv("test.csv")
 print(dataframe)

运行结果却让你大吃一惊:

    姓名  年龄
 0  stormsha   8
 1  yara  13

看到了吧?Pandas 自动添加了一列行号!

3、解决办法

如果你不想要这一列,该怎么办呢?别担心,解决方案超级简单!只需在调用 read_csv 方法时,添加一个参数 index_col=0。修改后的代码如下:

 dataframe = pd.read_csv("test.csv", index_col=0)
 print(dataframe)

现在运行结果就如你所愿了:

 姓名 年龄
 stormsha   8
 yara  13

行号已经消失,世界再次和平!

4、扩展

另外,如果你打算将这个 CSV 文件导入到 Excel 中,记得保存为 ANSI 编码格式,以避免乱码。同时,你可能需要在调用 read_csv 方法时指定编码格式,比如 encoding="gbk"。这样 Python 才能正确读取文件内容。

更多pandas操作技巧请阅读《Python中pandas有哪些功能技巧》