大数据可视化理论与案例分析|青训营笔记

132 阅读3分钟

这是我参与「第四届青训营 」笔记创作活动的第8天


本课程主要分为四个方面:

  • 定义
  • 原理
  • 案例
  • 学习

定义

什么是可视化: 以计算机图形学及图像处理技术为基础,将数据转换为图形或图像形式显示到屏幕上,并进行交互处理的理论、方法和技术

\

原理

流程

  • abstract Data
  • Visualization Design
  • Rendering and Display
  • Interactivity
  • 数据采集:数据通过机器采样、调查记录等方式进行采集
  • 数据处理:为了提高数据质量。通过包含数据清洗、数据集成以及数据转换等步骤
  • 可视化映射:用于把不同数据之间的联系映射为可视化视觉通道中的不同元素
  • 用户感知:从可视化结果中提取有用的信息、知识和灵感

数据

数据和数据集

表格:

多维表格:

数据

可视化的方法:

  • 折线图或者柱状图
    • 柱状图:使用垂直或水平的柱子显示类别之间的数值比较
    • 折线图:显示数据在一个连续的时间间隔或者时间跨度上的变化。
  • 文本可视化
    • 文本信息挖掘,通过分词、抽取、归一化等操作提取出文本词汇及相关内容。有文本预处理、文本特征处理、文本特征度量过程。
    • 视图绘制,将文本分析后的数据用视觉编码的形式来处理。有图元设计、图元布局过程。
    • 交互设计,使用户通过可视化有效地发现文本信息的特征和规律

ECharts与pyecharts数据可视化

import pyecharts.options as opts
from pyecharts.charts import Scatter

x_data=[4,18,8,8,66]
y_data=[12,48,18,12,58]

(
    Scatter(init_opts=opts.InitOpts(width="1024px",height="768px"))
    .add_xaxis(xaxis_data=x_data)
    .add_yaxis(
        series_name="",y_axis=y_data,
        symbol_size=20,label_opts=opts.LabelOpts(is_show=False),
        # 标记大小
    )
    .set_global_opts(
        xaxis_opts=opts.AxisOpts(
            type_="value",splitline_opts=opts.SplitLineOpts(is_show=True)#背景分割线
        ),
        yaxis_opts=opts.AxisOpts(
            type_="value",splitarea_opts=opts.SplitLineOpts(is_show=True)
        ),
        title_opts=opts.TitleOpts(title='散点图',pos_top="20px",pos_left='center'),
    )
    .render("basic_scatter_chart.html")


)

数据可视化的意义:

1、更快地带来见解

数据可视化可以轻松发现趋势并更快地识别异常值。这些信息有助于了解业务的表现以及正在发展的机遇和风险。使每个人都能够快速,轻松地将数据转换为洞察力。

2、做出更明智,更快速的决策

通过理解信息并与他人合作以更快地激发洞察力和发现数据模式,组织可以快速做出基于数据数据驱动的决策。告别那种依靠直觉做出无把握决策的日子。

3、通过高级分析为每个人提供支持

现在,您的组织可以从易于使用的交互式仪表板中受益,该仪表板具有内置的地理空间,联动和钻取分析,可以开发更深入的见解,发现隐藏的模式,并对高价值的商业机会采取行动。

4、提高产品或服务的价值

数据具有令人难以置信的价值,但大多数用户没有时间或耐心去学习专业的商业智能工具。通过在你的应用和业务流程中嵌入便捷的自助式分析能力,为用户提供方便,直观的数据。

参考:zhuanlan.zhihu.com/p/378556448

blog.csdn.net/qq_45725767…