数据可视化

237 阅读2分钟

这是我参与8月更文挑战的第16天,活动详情查看:8月更文挑战

数据可视化的作用是什么?

图表的作用是为了更直观的展示出结果,以方便得出结论。因此要知道每个视图背后的目的是什么

  1. 用户是谁?
  2. 想给他们呈现什么?
  3. 需要突出数据怎样的特点?
  4. 采用哪种视图进行呈现?
    具体可以分为9种情况:
  5. 分布
  6. 时间相关
  7. 局部/整体
  8. 偏差
  9. 相关性
  10. 排名
  11. 量级
  12. 地图
  13. 流动

可视化视图有哪些?

分为4类:比较、联系、构成、分布

  1. 散点图 - 两个或多个变量之间的关系
  2. 折线图 - 数据随着时间变化的趋势
  3. 直方图 - 横坐标等分成一定数量的小区间 “箱子”,区间内用矩形条展示该箱子的箱子数 - 变量的数值分布
  4. 条形图 - 类别的特征
  5. 箱线图 - 盒式图 - 最大值、最小值、中位数、上下四分位数 - 数据的差异性、离散程度、异常值
  6. 饼图 - 统计学模块 - 各部分大小与总和之间的比例
  7. 热力图 - 不同颜色代表不同的值 - 通过颜色只管地知道某个位置上数值的大小 - 多元变量分析方法
  8. 蜘蛛图 - 一对多的关系 - 一个变量相对于另一个变量的显著性是清晰可见的
  9. 二元变量分布 - 散点图、核密度图、Hexbin图
  10. 成对关系 - sns.pairplot()函数 - 每对变量的关系

可视化工具有哪些?

  1. 商业智能分析 - Tableau、powerBI、Tableau
  2. 可视化大屏 - DataV、FineReport

前端可视化组件

Web渲染技术

  1. Canvas - 位图 - 2D图形技术 - Echarts
  2. SVG - 可缩放矢量图 - XML格式定义 - 图标和图表上
  3. WebGL - 3D绘图协议 - Three.js

可视化组件

  1. Echarts
  2. D3
  3. three.js
  4. AntV

编程语言

  1. Python - Matplotlib、Seaborn【基于matplotlib】