数据分析
一、数据分析概述
二、科学计算库Numpy
三、数据分析工具Pandas
四、数据预处理
1.数据清洗
1.1.空值和缺失值的处理

isnull()

notnull()

dropna()

fillna()

1.2.重复值的处理

duplicated()

drop_duplicated()

1.3.异常值的处理
boxplot()


2.数据合并
2.1.轴向堆叠数据
concat()

2.2.主键合并
merge()


2.3.行索引合并
join()

2.4.合并重叠数据
combine_first(other)

3.数据重塑
3.1重塑层次化索引
stack()和unstack()



3.2轴向旋转
pivot()

4.数据转换
4.1重命名轴索引
rename()

4.2离散化连续数据
cut()

4.3哑变量处理类别型数据
get_dummies()
