数据分析

93 阅读1分钟

一、数据分析概述

二、科学计算库Numpy

三、数据分析工具Pandas

四、数据预处理

1.数据清洗

1.1.空值和缺失值的处理

image.png

isnull()

image.png

notnull()

image.png

dropna()

image.png

fillna()

image.png

1.2.重复值的处理

image.png

duplicated()

image.png

drop_duplicated()

image.png

1.3.异常值的处理

boxplot()

image.png

image.png

2.数据合并

2.1.轴向堆叠数据

concat()

image.png image.png

2.2.主键合并

merge()

image.png

image.png

2.3.行索引合并

join()

image.png

2.4.合并重叠数据

combine_first(other)

image.png

3.数据重塑

3.1重塑层次化索引

stack()和unstack()

image.png

image.png

image.png

3.2轴向旋转

pivot()

image.png

4.数据转换

4.1重命名轴索引

rename()

image.png

4.2离散化连续数据

cut()

image.png

4.3哑变量处理类别型数据

get_dummies()

image.png