数据分析知识总结
本篇文章主要总结在学习python数据分析及可视化这门课时,需要识记的内容,以备以后查验
-
什么是数据分析
数据分析是指使用适当的统计分析方法(如聚类分析、相关分析等)对收集来的大量数据进行分析,从中提取有用的信息和形成结论,并加以详细研究和概括总结的过程。
-
数据分析的分类
在统计学领域中,数据分析可分为如下三类
- 描述性数据分析:从一组数据中可以摘要并且描述这份数据中离散和集中的情形
- 探索性数据分析:从海量数据中找出规律,并产生分析模型和研究假设
- 验证性数据分析:验证科研测试所需的条件是否达到,以保证验证性分析的可靠
-
初级数据分析与高级数据分析
- 描述性数据分析隶属于初级数据分析,常见的分析方法有对比分析法,平均分析法、交叉分析法。
- 探索性和验证性数据分析属于高级数据分析,常见的分析方法有相关分析法,因子分析法、回归分析法等,
-
Anaconda
Anaconda提供了对conda、python在内的180多个扩展包的管理。conda是一个在Windows、macOS、Linux上运行的开源软件包管理系统和环境管理系统,可以快速的安装、运行和更新软件包及其依赖项
-
conda常用的命令
-
查看包
# -
查找包
-
安装包
-
卸载包
-
更新包
-
-
Numpy
Numpy是高性能科学计算和数据分析的基础库,可完成对数组的矢量计算