这是我参与8月更文挑战的第16天,活动详情查看:8月更文挑战
数据可视化的作用是什么?
图表的作用是为了更直观的展示出结果,以方便得出结论。因此要知道每个视图背后的目的是什么
- 用户是谁?
- 想给他们呈现什么?
- 需要突出数据怎样的特点?
- 采用哪种视图进行呈现?
具体可以分为9种情况: - 分布
- 时间相关
- 局部/整体
- 偏差
- 相关性
- 排名
- 量级
- 地图
- 流动
可视化视图有哪些?
分为4类:比较、联系、构成、分布
- 散点图 - 两个或多个变量之间的关系
- 折线图 - 数据随着时间变化的趋势
- 直方图 - 横坐标等分成一定数量的小区间 “箱子”,区间内用矩形条展示该箱子的箱子数 - 变量的数值分布
- 条形图 - 类别的特征
- 箱线图 - 盒式图 - 最大值、最小值、中位数、上下四分位数 - 数据的差异性、离散程度、异常值
- 饼图 - 统计学模块 - 各部分大小与总和之间的比例
- 热力图 - 不同颜色代表不同的值 - 通过颜色只管地知道某个位置上数值的大小 - 多元变量分析方法
- 蜘蛛图 - 一对多的关系 - 一个变量相对于另一个变量的显著性是清晰可见的
- 二元变量分布 - 散点图、核密度图、Hexbin图
- 成对关系 - sns.pairplot()函数 - 每对变量的关系
可视化工具有哪些?
- 商业智能分析 - Tableau、powerBI、Tableau
- 可视化大屏 - DataV、FineReport
前端可视化组件
Web渲染技术
- Canvas - 位图 - 2D图形技术 - Echarts
- SVG - 可缩放矢量图 - XML格式定义 - 图标和图表上
- WebGL - 3D绘图协议 - Three.js
可视化组件
- Echarts
- D3
- three.js
- AntV
编程语言
- Python - Matplotlib、Seaborn【基于matplotlib】