pandas系列之回顾总结篇 不思量自难忘 2021-08-21 165 阅读1分钟 到昨天为止,pandas基础系列算是全部完成了。这一篇是对pandas系列做一个整体的归纳整理,形成一个完整的体系,便于后面回顾。 1.两种基本数据结构 1.1 Series数据结构 1.2 DataFrame数据结构 2.获取数据 2.1 导入数据 2.1.1 xlsx文件的基本操作 2.1.2 csv文件的基本操作 2.1.3 txt文件的基本操作 2.1.4 sql文件的基本操作 2.2 数据熟悉 2.2.1 熟悉数据结构和基本特征 3.数据预处理 3.1 缺失值的处理 3.2 重复值的处理 3.3 异常值的处理 3.4 数据类型转换 3.5 索引设置 4.数据选择 4.1 按列选择数据 4.2 按行选择数据 4.3 行列同时选择数据 5.数值操作 5.1 数值替换 5.2 数值排序 5.3 数值排名 5.4 数值删除 5.5 数值计数 5.6 数值查找 5.7 区间切分 5.8 唯一值获取 5.9 行列互换 5.10 索引重塑 5.11 长宽表转换 5.12 apply()与applymap函数 5.13 插入新的行或列 6.数据运算 6.1 算术运算 6.2 比较运算 6.3 汇总运算 6.3.1 count非空值计数 6.3.2 sum求和 6.3.3 平均值 6.3.4 中位数 6.3.5 最大值 6.3.6 最小值 6.3.7 方差 6.3.8 标准差 6.3.9 众数 6.3.10 分位数 6.4 相关性运算 7.时间处理 7.1 时间索引 7.2 时间偏移 8.数据分类 8.1 数据分组 8.1.1 按照列名分组 8.1.2 按照Series分组 8.1.3 分组后的汇总方式设置和索引重置 8.2 数据透视表 9.数据拼接 9.1 横向拼接 9.1.1 连接表的类型 9.1.2 连接键的类型 9.1.3 连接方式 9.1.4 重复列名处理 9.2 纵向拼接 10.数据导出 10.1 导出为xlsx文件(一) 10.2 导出为xlsx文件(二) 10.3 导出为CSV文件