数据仓库之模型评审

940 阅读3分钟

知识关键点

  • 数据模型记分卡是一种积极,有效的数据模型质量评价方法。
  • 在数据建设初期使用记分卡可以有效降低返工几率,即便一些新手也可以对数据模型提出改进意见。
  • 记分卡并非专用性技术,可以在任何项目中加以应用。

  在数据质量管理中经常容易被忽略的一个问题就是数据模型的质量。在项目开发过程中,我们经常以数据库设计为单一目标,而进行快速的数据模型构建,然而数据模型的意义却是深远,持久的。数据模型质量影响着数据结构的实现,影响着数据模型的适应能力,影响着数据的理解和交流,影响着数据质量规则的定义等,而且高质量的数据模型是架构健壮性应用系统的基础。所以,需要一个客观的评测方法来判断数据模型的优劣。

1. 理解数据模型记分卡

  数据模型记分卡是一种积极,有效的数据模型质量评价方法。记分卡具有以下4个基本特征。

  1. 不仅会凸显需要改进的地方,而且还会强调可取之处。
  2. 提供一个外部的,客观的视角。
  3. 提供简单,直观的审查方法。
  4. 支持所有类型的模型。

2. 记分卡模板

如下是为适用于各种模型评审者使用的记分卡模板。

编号计分项总分模型得分百分比备注
1模型对于项目需求的表达如何15
2模型的完整性如何15
3模型与其规划的匹配如何10
4模型的结构健壮性如何15
5模型的通用结构化设计如何5
6模型中的标准化命名如何5
7模型的可阅读性如何5
8模型中的定义如何10
9模型与企业数据模型的一致性如何5
10元数据与数据的匹配情况如何10
总分100

  每个计分项的总分表示该计分项对整个模型的影响程度。最终由于希望得到一个百分比,所以各项总分累计为100.模型得分列为特定的模型评审结果。百分比 则存储了模型得分除以对应计分项总分的结果。备注栏中记录关于模型得分的细节,以及修改模型可以采取的行动。备注栏中记录的简要性说明正式计分卡非常有益的关键所在,即便模型在某一项不存在问题,仍然可以在备注栏中注明该项获得满分的原因,最后一行为模型总分,是各计分项得分求和的结果,该值反映出某特定评审对模型的总体评价。

3. 记分卡简介

  以下是对10个计分项的简要介绍。

  1. 模型对于项目需求的表达如何?
  2. 模型的完整性如何?
  3. 模型与其规划的匹配如何?
  4. 模型的结构健壮性如何
  5. 模型的通用结构化设计如何
  6. 模型中的标准化命名如何
  7. 模型的可阅读性如何?
  8. 模型中的定义如何?
  9. 模型与其他数据模型的一致性如何?
  10. 元数据与数据的匹配情况如何?