Python数据分析(1)

105 阅读2分钟

Python数据分析课程复习

数据分析是一种将原始数据转换成有用信息的过程。它包括使用各种工具和技术来收集、处理、评估、解释和呈现数据。数据分析可以帮助企业或组织做出更好的决策,这些决策可能会影响到如何分配资源、开展业务和满足客户需求等方面。 以下是数据分析的几个应用领域:

  1. 商业决策:针对市场调研结果、经济指标、销售数据以及用户反馈等,为企业提供关键性战略建议,通过运用数据分析将关键业务、产品和服务领跑于同行。
  2. 销售和营销领域:结合市场研究数据,同时基于大量客户数据,进行目标客户群体划分,从而优化营销计划,提高市场竞争力。
  3. 海量数据处理与利用:运用数据挖掘和机器学习等领域技术,通过对超大规模、高维度的数据进行有效处理,进而分析数据信息并为公司决策提供落地执行计划。
  4. 人力资源管理:数据分析可用于统计员工离职率、工资状况、时间管理情况等关键指标,并为HR部门或公司提供制定更好的立体化管理策略及方案等。

基本工具

Python3.9,pycharm2023

基本数据结构

| 数据结构 | 是否可变 | 是否有序 | 定义的符号 | 访问方式 | | 列表 | 可变 | 有序 | [] | 索引 | | 元组 | 不可变 | 有序 | () | 索引 | | 字典 | 键不可变 | 有序 | {} | 键值 |

Python语法

  1. 注意缩进
  2. 单行注释:# 这是注释
  3. 多行注释:''' 这是注释 '''
  4. 循环:for、while
  5. 选择:if-else if-else、match-case
  6. 序列解包:使用元组接收函数返回的多个值
  7. 传参:关键字收集、可变参数收集、逆向参数收集
  8. 方法也是对象,可传递、可作为形参、返回值

第三方库

以下库使用于python的科学运算和数据分析

  1. Numpy:科学计算,特殊函数、积分、优化、信号处理和图像处理等高级函数
  2. pandas:数据读取
  3. SciPy:建立在Numpy之上,高级科学和工程,特殊函数、积分、优化、信号处理和图像处理等高级函数
  4. Scikit:数据挖掘和机器学习
  5. Matplotlib:绘制图形

数据分析流程

确定问题——数据收集——数据预处理——探索性数据分析——建模和分析——解析和评估分析结果——传播和应用