pandas模块(二)读取与操作数据pd.pd.pd.numpy数据.numpy数据.打印 pf.data[:5] 前

import pandas as pd

一、读取数据

pd.read_csv(参数1,sep参数,encoding参数)

参数1为文件路径 sep参数为分隔符 encoding参数为编码格式(存取的时候用的编码方式和读取的必须一致)

pd.read_table(参数1,sep参数,encoding参数)

ps：必须指定sep参数

pd.read_excel(路径参数)

保存为csv文件

numpy数据.to_csv(文件路径,index参数)

index参数=False 取消行索引

保存问excel文件

numpy数据.to_excel(文件路径,index参数)

用pf作为读取出来的数据

打印 pf.columns 查看所有行索引名称

pf[行索引名称] 返回series结构其中一列

data = pf[行索引]

data[:5] 前五行 data.head()

data[-5:] 后五行 data.tail()

data[10:21] 第十行到第二十行

pf[[行索引1,行索引2,行索引3]][:10] 三行十列

pf.loc[行名称,列名称]

pf.iloc[行下标,列下标]

pf.ix[行名称,列名称] pf.ix[行下标,列名称] pf.ix[行名称,列下标]