文章规划为七篇,本篇是第一篇. 主要介绍数据模型的作用和价值。
数据模型不止是一种工作和职业,它还是一种思想,一种无价的过程和生活方式,但请尽量保持其简单实用的特性。数据视图依赖数据模型来体现。
1. 什么是数据模型?
-
释义: 可以通过类比法去解释这个问题,比如地图是对复杂地理景观的简化,数据模型是由符号与文本组成的对复杂信息景观的简化。这么说可能过于抽象,我们也可以用路径搜寻来代替,这个解释包含了搜寻过程中使用的所有技术和工具,以实现从一个地点到达另一个地点的目的,比如北斗系统,司南,地图。数据模型作为一种导航工具广泛的存在于信息系统中。
-
形式: 数据模型的表现形式多样化,一般具有如下特征
- 模型只包含类型: 为避免信息过载,模型应只对事物对应的概念或者类型做出解释,比如冰淇淋大小而不是大中小,比如冰淇淋口味而不是巧克力或者香草。
- 模型包含相互作用: 相互作用即关系。
- 模型需要提供一个简单的交流媒介:模型需要存在一个表现形式,能够被看到或者更轻松地理解与交流。
-
数据建模: 数据建模是为了明确组织结构极其操作,运用技术和实施活动,提出一些信息解决方案,从而实现组织目标。
2. 为什么需要数据模型?
-
数据模型能为企业带来核心价值
- 交流性:能有效达成理解并记录最终协调不同观点的作用(不止在建模过程完成后,在建模过程中协调交流也发挥着巨大的作用)。
- 准确性:具备清晰和无二义性的特点,使用统一的标准符号和语言,不会在理解上产生歧义。
- 利于理解已有应用程序和业务
-
存在降低数据模型精确性的情况
- 弱定义: 含糊其辞的定义,缺乏根据或者不存的定义,缺乏现实意义表述的定义。
- 伪数据: 不符合定义的数据会破坏业务规则。例如电话号码不存在就设置为0000或表示为空等。
- 模糊或缺失的标签: 数据模型应该具备完整的句子结构,名词动词的使用应当十分规范。
3. 生活中的数据模型都有哪些?
使用数据模型观察业务,抽象信息系统的过程可以完整的映射为使用相机拍摄画面的过程,比如变焦,对焦,定时器与滤镜类比范围,抽象,时间,功能和格式上,同理底片可存储于胶片上,数字媒介上的情况则 可类比模型的维度同时存在于概念,逻辑,物理的细节层次上。
-
变焦与范围(类比调整景物大小)
- 确认建模范围是第一步应该做的事情
-
部门
- 数据集
- 应用
- 预定系统
-
组织
- 数仓
- 客户管理系统
-
行业
- 制造业
- 银行业
-
- 确认建模范围是第一步应该做的事情
-
对焦与抽象(对比钝化或锐化消除模糊)
- 在范围内通过对属性,实体,关系进行合并得到通用概念,去除部分细节而保留重要属性,概念或主题,从而扩展适用性,消除分歧,清晰的展示内容是第二步应该做的事情
- 业务云
- 数据库云
- 地面上
- 在范围内通过对属性,实体,关系进行合并得到通用概念,去除部分细节而保留重要属性,概念或主题,从而扩展适用性,消除分歧,清晰的展示内容是第二步应该做的事情
-
定时器与时间(随时间变化的业务)
- 表示不同时间的业务状态
- 当前
- 未来
- 表示不同时间的业务状态
-
滤镜与功能(滤镜可以加重某一方面的色彩类比建模的视角问题)
- 允许切换视角,突出某一方面
- 功能视角
- 业务视角
- 允许切换视角,突出某一方面
-
格式
- 相机有存储介质的细节差异,模型也有在不同细节的表现形式。
-
概念模型:仅仅包含最为基本和关键的概念
- 基本:被多次提及
- 关键:若没有概念无法完整表示业务含义或被业务含义被极大改变。
-
逻辑模型:概念模型的实例化,一种业务解决方案。
-
物理模型:逻辑模型的实例化,增强,补充逻辑模型,对逻辑模型处于特定环境的优化。
-
- 相机有存储介质的细节差异,模型也有在不同细节的表现形式。