这是我参与「第四届青训营 」笔记创作活动的第8天
本课程主要分为四个方面:
- 定义
- 原理
- 案例
- 学习
定义
什么是可视化: 以计算机图形学及图像处理技术为基础,将数据转换为图形或图像形式显示到屏幕上,并进行交互处理的理论、方法和技术
\
原理
流程
- abstract Data
- Visualization Design
- Rendering and Display
- Interactivity
- 数据采集:数据通过机器采样、调查记录等方式进行采集
- 数据处理:为了提高数据质量。通过包含数据清洗、数据集成以及数据转换等步骤
- 可视化映射:用于把不同数据之间的联系映射为可视化视觉通道中的不同元素
- 用户感知:从可视化结果中提取有用的信息、知识和灵感
数据
数据和数据集
表格:
多维表格:
数据
可视化的方法:
- 折线图或者柱状图
-
- 柱状图:使用垂直或水平的柱子显示类别之间的数值比较
- 折线图:显示数据在一个连续的时间间隔或者时间跨度上的变化。
- 文本可视化
-
- 文本信息挖掘,通过分词、抽取、归一化等操作提取出文本词汇及相关内容。有文本预处理、文本特征处理、文本特征度量过程。
- 视图绘制,将文本分析后的数据用视觉编码的形式来处理。有图元设计、图元布局过程。
- 交互设计,使用户通过可视化有效地发现文本信息的特征和规律
ECharts与pyecharts数据可视化
import pyecharts.options as opts
from pyecharts.charts import Scatter
x_data=[4,18,8,8,66]
y_data=[12,48,18,12,58]
(
Scatter(init_opts=opts.InitOpts(width="1024px",height="768px"))
.add_xaxis(xaxis_data=x_data)
.add_yaxis(
series_name="",y_axis=y_data,
symbol_size=20,label_opts=opts.LabelOpts(is_show=False),
# 标记大小
)
.set_global_opts(
xaxis_opts=opts.AxisOpts(
type_="value",splitline_opts=opts.SplitLineOpts(is_show=True)#背景分割线
),
yaxis_opts=opts.AxisOpts(
type_="value",splitarea_opts=opts.SplitLineOpts(is_show=True)
),
title_opts=opts.TitleOpts(title='散点图',pos_top="20px",pos_left='center'),
)
.render("basic_scatter_chart.html")
)
数据可视化的意义:
1、更快地带来见解
数据可视化可以轻松发现趋势并更快地识别异常值。这些信息有助于了解业务的表现以及正在发展的机遇和风险。使每个人都能够快速,轻松地将数据转换为洞察力。
2、做出更明智,更快速的决策
通过理解信息并与他人合作以更快地激发洞察力和发现数据模式,组织可以快速做出基于数据数据驱动的决策。告别那种依靠直觉做出无把握决策的日子。
3、通过高级分析为每个人提供支持
现在,您的组织可以从易于使用的交互式仪表板中受益,该仪表板具有内置的地理空间,联动和钻取分析,可以开发更深入的见解,发现隐藏的模式,并对高价值的商业机会采取行动。
4、提高产品或服务的价值
数据具有令人难以置信的价值,但大多数用户没有时间或耐心去学习专业的商业智能工具。通过在你的应用和业务流程中嵌入便捷的自助式分析能力,为用户提供方便,直观的数据。