持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第29天,点击查看活动详情
如果你有使用python进行上传文件的话,那么下面这篇文章会给你带来意想不到的惊喜,在这篇文章中,我们会探讨如何使用 Filestack在 python 中上传 CSV 文件。
什么是 CSV,为什么它在 Python 上传文件中很重要?
CSV 也叫“逗号分隔值”,对于程序员更常见于数据库的备份或者导入导出,它可以像 Excel 文件一样查看编辑,是以表格形式将数据存储为纯文本的一种形式。尤其在科学计算大数据中使用的尤其广泛,毕竟科学计算大数据,最基础的东西就是数据。
在 Python中,Pandas 是数据科学中最关键的库。
下面我将会说在pandas中导入csv文件的几种不同的方法。
例如我们需要将一些销售数据导入到csv中
1、首先需要知道 CSV 文件的完整路径。
例如,假设 CSV 文件存储在以下路径中:
C:\Users\Ron\Desktop\Clients.CSV
这里需要注意的地方时,千万不要写错文件名,不然会找不到,另外注意文件扩展名一定要是.csv.
2、编写python代码
代码很简单,只要将下面的这些代码放到你的解释器里,或者放到指定文件中即可,注意文件路径哦
import pandas as pd
df = pd.read_csv (r'C:\Users\Ron\Desktop\Clients.csv')
print (df)
3、运行这一部分代码
想要看到效果那必须运行代码才可以,下面就来看看运行代码得到的效果吧
python3 test.py
可选步骤:我需要选择列的子集吗? 如果要从 CSV 文件中选择列的子集,我们需要做什么?
例如,您只想选择 Person Name 和 Country 列。在这种情况下,您可以指定这些列的名称,如下所示:
import pandas as pd
data = pd.read_csv (r'C:\Users\Ron\Desktop\Clients.csv')
df = pd.DataFrame(data, columns= ['Person Name','Country'])
print (df)
您必须确保代码中指定的列名与 CSV 文件中的列名完全匹配。否则,您将获得 NaN 值。
一旦你准备好了,运行代码(在调整文件路径之后),你将只得到 Person Name 和 Country 列