本文推荐数据分析的必备材料:Python官方中文文档和《利用python进行数据分析第二版》。本站认为,看完这两份材料,看懂代码,90%以上的数据分析问题都能解决。
一、Python官方中文文档
首先推荐Python官方文档,注意,这是一份中文文档!可以当做工具书查询。
常见问题和常见术语等都在里面:
入门教程
python标准库
术语对照表
二、《利用python进行数据分析第二版》
其次推荐《利用python进行数据分析第二版》,看懂这本书的代码,模仿书上代码解决数据分析问题,据说90%以上的数据分析问题都可以解决!
《利用python进行数据分析》第1版出版于2012年,彼时基于Python的开源数据分析库(例如pandas)仍然是一个发展迅速的新事物。本书第2版中,作者在一些章节内进行了修改,以解释过去5年中发生的不兼容的变更、弃用和一些新特性,并且使用了python3.6。此外,还添加了新内容,用以介绍在2012年还不存在或者不成熟的工具。作者认为本版内容4-5年内不过时。
本站搜集的本书的原版代码进行中文翻译和注释,并作了一定的笔记。
文末提供下载。
代码笔记目录
- CHAPTER 1:Preliminaries(预备知识)
- Chapter 2: Python Language Basics, IPython, and Jupyter Notebooks (Python语言基础,Ipython和Jupyter Notebooks)
- Chapter 3: Built-in Data Structures, Functions, and Files (内建数据结构,函数和文件)
- Chapter 4: NumPy Basics: Arrays and Vectorized Computation(NumPy基础:数组和向量化计算)
- Chapter 5: Getting Started with pandas(开始使用pandas)
- Chapter 6: Data Loading, Storage, and File Formats(数据加载,存储,文件格式)
- Chapter 7: Data Cleaning and Preparation(数据清洗和准备)
- Chapter 8: Data Wrangling: Join, Combine, and Reshape(数据加工:加入, 结合, 变型)
- Chapter 9: Plotting and Visualization(绘图和可视化)
- Chapter 10: Data Aggregation and Group Operations(数据汇总和组操作)
- Chapter 11: Time Series(时间序列)
- Chapter 12: Advanced pandas(高级pandas用法)
- Chapter 13: Introduction to Modeling Libraries in Python(Python中建模库的介绍)
- Chapter 14: Data Analysis Examples(数据分析实例)
代码截图
代码下载地址:
可以不看书,直接看代码和注释,本站提供代码和原版电子书下载。
下载链接:pan.baidu.com/s/1tW8a8IXl…
提取码:5qp1
若被和谐,请在公众号回复“3344”获取最新链接。
总结
本文推荐两个数据分析的必备材料:Python官方中文文档和《利用python进行数据分析第二版》,并提供代码下载。
备注:公众号菜单包含了整理了一本 AI小抄,非常适合在通勤路上用学习。
往期精彩回顾
适合初学者入门人工智能的路线及资料下载机器学习在线手册深度学习在线手册AI基础下载(第一部分)备注:加入本站微信群或者qq群,请回复“加群”获取一折本站知识星球优惠券,请回复“知识星球”
喜欢文章,点个 在看