大数据笔记|青训营笔记

74 阅读3分钟

这是我参与「第四届青训营 」笔记创作活动的的第20天。

本节课程主要分为 4 个方面:

   1.定义
   2.原理
   3.案例
   4.学习

一.定义

 1.1.什么是可视化
        ◉ 可视化是用于创建图像、图表或动画来传达信息的任何技术。
 1.2.什么是数据可视化
        ◉ 任何可以将数据转换为可视化表示的东西(如图表、图形、地图,有时甚至只是表格)
 1.3.数据可视化作用
        ◉ 直观展示
        ◉ 数据探索
        ◉ 沟通媒介

二.原理

   ◉ 流程/Process
          ◌ 数据处理(Abstract Data)
          ◌ 可视化设计与表达(Visualization Design)
          ◌ 可视化渲染(Rendering and Display)
          ◌  可视化渲染(Rendering and Display)             

image.png

2.1.数据/Data
    2.1.1.定义
       ◼ 数据被定义为一个有意义的事实的集合,它可以被计算机或人类存储和处理。
    2.1.2.数据和数据集
        ◼ 数据可以被分为以下五种类别:
            ◌ Items:具体的每一条数据
            ◌ Attributes:条目的每个字段的属性
            ◌ Links:数据之间的关系
            ◌ Positions:位置
            ◌ Grids:网格
        ◼ 数据集被分为以下五种类别:
            ◌ Tables:表格数据
            ◌ Networks & Trees:层次结构数据
            ◌ Fields:场数据
            ◌ Geometry:几何数据
            ◌ 其他集合类型:Clusters,Sets,Lists                    

image.png

    2.1.3.表格
        ◼ 表格是使用行、列和单元格的概念来存储数据的结构,每一行是一条数据,每一列都有一个统一的属性定义。                    

image.png

    2.1.4.多维表格
        ◼ 多维表格数据和普通表格数据组织形式上最大的不同的点在于key 的数量。通常一个普通表格的key 就是行号
    2.1.5.网络和树
         ◼ 网络和树数据,核心概念就是“关系”。必须要显示的定义数据条目之间的关联关系才能绘制出网络图和树图。
    2.1.6.场
        ◼ 场数据,用于描述磁场、电场、风场等数据,存储结构是网格(grid),每个网格中一般是向量、标量或者张量。             

image.png

    2.1.7.几何数据
         ◼ 几何数据集是几何图形数据的几何,通常用来描述地理信息。
    2.1.8.属性分类
       ◼ 数据集中的数据条目都会包含一个或者多个属性(Attribute),属性分为分类(Categorical)和排序(Ordered)属性。排序属性又分为顺序(Ordinal)和定量(Quantitative)两种类别。
2.2.编码/Encode
    2.2.1.认知/Cognition
         ◼ Perception of raw visual signals,e.g. color, shape, etc. 原始信号感知
         ◼ Pattern recognition 模式识别
         ◼ Reasoning and Analysis 推理分析
    2.2.2.图元/Marks
         ◼ Items / Nodes
         ◼ Links
    2.2.3.通道/Channels
         ◼觉通道是控制标记外观的一种方法                 

image.png

    2.2.4.编码/Encode
         ◼ 从数据到视觉通道的转换过程,被称之为视觉编码(Visual Encoding)。
    2.2.5.编码有效性/D、Effectiveness
           ◼ 预感知图形
           ◼ 有效性排序
           ◼ 格式塔理论
                 ◌ 领近原则 
                 ◌ 相似原则
                 ◌ 连通性原则
                 ◌ 连续性原则
                 ◌ 封闭的原则
                 ◌ 共同命运原则
2.3.交互/Interaction
    2.3.1.分类/Interaction Categories
         ◼ Change改变
         ◼ Juxtapose并列
         ◼ Filter过滤
         ◼ Select选择
         ◼ Partition拆分
         ◼ Aggregate聚合
         ◼ Navigate导航
         ◼ Superimpose叠加
         ◼ Embed镶嵌

三.案例/Cases

   ✔ 过多的分类会使得饼图的视觉效果趋于混乱
   ✔ 同样的数据,如果使用柱形图来显示,分类之间的对比就会明显很多

四.学习/Learning

  4.1.综合/Comprehensive
         ◯ 设计
         ◯ 数学与算法
         ◯ 编程
         ◯ 技术
4.2.理论

image.png

  4.3.编程
  4.4.前沿
  4.5.实践
        ◯ 数据集接入
        ◯ 数据查询
        ◯ 可视化展现
  4.6.我们在做的事情
        ◯  Narrative:Capability Characteristics
        ◯ Intelligent:User Experience
        ◯ Serviceable:Capability Output Mode