数据分析期末备考-七日打卡-day7

117 阅读2分钟

数据分析知识总结

本篇文章主要总结在学习python数据分析及可视化这门课时,需要识记的内容,以备以后查验

  1. 什么是数据分析

    数据分析是指使用适当的统计分析方法(如聚类分析、相关分析等)对收集来的大量数据进行分析,从中提取有用的信息和形成结论,并加以详细研究和概括总结的过程。

  2. 数据分析的分类

    在统计学领域中,数据分析可分为如下三类

    1. 描述性数据分析:从一组数据中可以摘要并且描述这份数据中离散和集中的情形
    2. 探索性数据分析:从海量数据中找出规律,并产生分析模型和研究假设
    3. 验证性数据分析:验证科研测试所需的条件是否达到,以保证验证性分析的可靠
  3. 初级数据分析与高级数据分析

    1. 描述性数据分析隶属于初级数据分析,常见的分析方法有对比分析法,平均分析法、交叉分析法。
    2. 探索性和验证性数据分析属于高级数据分析,常见的分析方法有相关分析法,因子分析法、回归分析法等,
  4. Anaconda

    Anaconda提供了对conda、python在内的180多个扩展包的管理。conda是一个在Windows、macOS、Linux上运行的开源软件包管理系统和环境管理系统,可以快速的安装、运行和更新软件包及其依赖项

  5. conda常用的命令

    1. 查看包

      #
      
    2. 查找包

    3. 安装包

    4. 卸载包

    5. 更新包

  6. Numpy

    Numpy是高性能科学计算和数据分析的基础库,可完成对数组的矢量计算