【python-数据分析-numpy】文件操作&读取csv文件&NAN NF

636 阅读2分钟

【python-数据分析-numpy】文件操作&读取csv文件&NAN NF

文件操作

在这里插入图片描述

savetxt(文件名,数组,数据格式,分隔符)

存储

在这里插入图片描述
在这里插入图片描述

读取

在这里插入图片描述
在这里插入图片描述

numpy独有的存储方式:save & load 可以读取多维数组,但是要求表格内的格式较为统一

在这里插入图片描述
在这里插入图片描述

读取csv文件

csv文件

在这里插入图片描述

读取csv文件reader()

在这里插入图片描述
略过标题数据:
在这里插入图片描述
在这里插入图片描述

转成字典,以key的方式索引:DictReader()

之前通过行标列标,假如移动行列就索引不到了,用字典就不用担心这种问题。
在这里插入图片描述

在这里插入图片描述

写入

writerow()

在这里插入图片描述

问题:乱码&每行中间有空行

在这里插入图片描述

解决方式

newline=‘’
在这里插入图片描述
在这里插入图片描述

以字典方式写入:DictWriter

记得表头自己导入
在这里插入图片描述

NAN NF(为str类型)

简介

在这里插入图片描述

NAN注意事项

1.NAN与任何NAN不相等
2.NAN与任何值做运算,结果仍为NAN

处理NAN

删除缺失值

在这里插入图片描述

布尔索引

在这里插入图片描述
在这里插入图片描述

用其他值进行替换

根据不同情形进行相应替换
在这里插入图片描述
在这里插入图片描述
有缺失值怎么办
1.使用字符串类型进行解析dtype=np.str
把不能转换成数字的数据转换成NAN,转换完之后再转换成浮点类型
在这里插入图片描述

例题

注:除了delete函数,axis=1都代表为行,=0代表为列;delete函数正好相反。
总分可以将某个人的某科目分设置为0.
平均值的时候要将缺失值设置为平均值

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述