1、导语
你是否曾经使用 Pandas 的 read_csv 方法读取过 CSV 文件,却发现它自动添加了一列行号,让你头疼不已?我懂你的痛苦!今天,我将向你展示如何解决这个问题,并分享一些其他有用的小技巧。
2、问题描述
让我们先来看一个例子。假设你有一个名为 test.csv 的文件,内容如下:
姓名,年龄
stormsha,8
yara,13
现在,你使用以下 Python 代码读取这个文件:
import pandas as pd
python
dataframe = pd.read_csv("test.csv")
print(dataframe)
运行结果却让你大吃一惊:
姓名 年龄
0 stormsha 8
1 yara 13
看到了吧?Pandas 自动添加了一列行号!
3、解决办法
如果你不想要这一列,该怎么办呢?别担心,解决方案超级简单!只需在调用 read_csv 方法时,添加一个参数 index_col=0。修改后的代码如下:
dataframe = pd.read_csv("test.csv", index_col=0)
print(dataframe)
现在运行结果就如你所愿了:
姓名 年龄
stormsha 8
yara 13
行号已经消失,世界再次和平!
4、扩展
另外,如果你打算将这个 CSV 文件导入到 Excel 中,记得保存为 ANSI 编码格式,以避免乱码。同时,你可能需要在调用 read_csv 方法时指定编码格式,比如 encoding="gbk"。这样 Python 才能正确读取文件内容。
更多pandas操作技巧请阅读《Python中pandas有哪些功能技巧》