还在苦苦寻觅用Python控制、处理、整理、分析结构化数据的完整教程?
今天给大家分享的这份利用Python进行数据分析,含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy、pandas、matplotlib以及IPython等)高效地解决各式各样的数据分析问题。
由于作者Wes McKinney是pandas库的主要作者,所以本书也可以作为利用Python实现数据密集型应用的科学计算实践指南。本资料适合刚刚接触Python的分析人员以及刚刚接触科学计算的Python程序员。
【领取方式见文末!!】
【领取方式见文末!!】
目录
1、准备工作
2、引言
3、IPython:一种交互式计算和开发环境
4、NumPy基础:数组和矢量计算
5、pandas入门
6、数据加载、存储与文件格式
7、数据规整化:清理、转换、合并、重塑
8、绘图和可视化
9、数据聚合与分组运算
10、时间序列
11、金融和经济数据应用
12、NumPy高级应用
3、IPython:一种交互式计算和开发环境
- IPython基础
- 内省
- 使用命令历史
- 与操作系统交互
- IPython HTML Notebook
- 利用IPython提高代码开发效率的几点提示
- 高级IPython功能
- 致谢
5、pandas入门
- pandas的数据结构介绍
- 基本功能
- 汇总和计算描述统计
- 处理缺失数据
- 层次化索引
- 其他有关pandas的话题
7、数据规整化:清理、转换、合并、重塑
合并数据集
重塑和轴向旋转
数据转换
字符串操作
示例:USDA食品数据库
9、数据聚合与分组运算
- GroupBy技术
- 数据聚合
- 分组级运算和转换
- 透视表和交叉表
- 示例:2012联邦选举委员会数据库
12、NumPy高级应用
- ndarray对象的内部机理
- 高级数组操作
- 广播
- ufunc高级应用
- 结构化和记录式数组
- 更多有关排序的话题
- NumPy的matrix类
- 高级数组输入输出
- 性能建议
这份资料对新手来说绝对是福音,因为每看完一点就可以马上将自己手上的工作直接拿来当例子练手,学习效果立竿见影。
注:资料来源网络,侵删。