DAMA数据管理知识体系指南 第一章 数据管理&第二章 数据处理伦理

309 阅读7分钟

第一章:数据管理

问题解答

名词解释

DAMA 国际数据管理协会

DMBOK (Data Management Body of Knowledge) 数据管理知识体系

CDMP (Certified Data Management Professional) 数据管理专业人士认证

CDGA (Certified Data Governance Associate) 数据治理工程师

CDGP (Certified Data Governance Professional) 数据治理专家

什么是数据?

数据是对其代表的对象的解释,也是必须解释的对象。

数据和信息的区别?

数据和信息可以相互转化,信息是数据的提炼,产生的有价值的数据,本质还是数据

什么是数据管理框架?

每个组织都有一套功能框架(或者叫做各个部门的管理平台或者其他能够产生业务数据的平台),将这些数据进行统一的跟踪协调管理的框架(也可以叫做模型),叫做数据管理框架

为什么要做数据管理?

目的是提高数据质量,发现数据价值,给组织创造收益

数据管理和数据治理的区别

数据治理是数据管理的核心,数据治理是为了实现数据管理框架各个功能的一致性和平衡性。数据治理是车轴,其他知识领域(数据体系结构,数据建模等)是车轮的组成部分。具体可以参考车轮图。

为什么数据是一种资产?

高质量的客户,产品,服务,运营数据信息,可以帮助组织做出更好的决策,创造收益

什么是SIPOC 组织系统模型

是一门最有用,而且最常用的,用于流程管理和改进的技术。是过程管理和改进的常用技术,作为识别核心过程的首选方法。Supplier 供应者,Input 输入,Process 流程,Output 输出,Customer 客户。

数据管理原则有哪些?

  1. 数据管理是对数据质量的管理
  2. 需要有元数据来管理数据
  3. 数据管理是对数据生命周期的管理
  4. 数据管理需要规划
  5. 想要管理组织所有数据,需要技术能力,非技术能力,协作能力
  6. 想做好组织的所有数据管理需要企业级的视角
  7. 数据管理需要多角度思考问题
  8. 有效的数据管理需要领导层承担责任,因为有一些协调,协作的工作,需要管理层完成

什么是语境关系图?

解释:描述知识领域的细节,对某个知识点进行归纳式的讲解和说明,包括人员,流程和技术相关细节

语境关系图的组成

定义 : 本节知识领域的简要定义 目标 : 每个知识领域内指导活动执行的目的,基本原则

活动:实现知识领域目标所需的行动和任务,分为一下4步

  • 计划活动(P):为实现数据管理目标设定战略和战术工作
  • 控制活动(C) : 持续的确保数据质量,数据存取和使用的完整性,可靠性,安全性
  • 开发活动(D):围绕开发生命周期(SDLC) 开展分析,设计,构建,测试,准备部署等活动。
  • 运营活动(O): 支持系统和流程的使用,维护和增强。通过这些系统和流程进行数据的存取和使用。

输入:每个知识领域其活动所需要的有形物质

交付成果:知识领域内活动的产出。每个只能部门负责生产的有形事物。

角色和职责:描述个人或者团队如何为知识领域内的活动做出贡献

供给者:负责提供活动输入的人员

消费者:直接受益于数据管理活动产生主要交付成果的消费方

参与者:执行,管理或批准知识领域活动的人员

工具:实现知识领域目标的应用程序或者其他技术

方法:产生可交付结果的方法和程序

度量指标:为了衡量或评估绩效,进度,质量,效率或其他影响的标准

参考图(后面每一章都有一个对应的知识领域语境关系图):

2022-05-25-22-36-07-image.png

数据管理挑战

数据质量管理

低数据质量成本

  1. 报废和返工
  2. 组织效率低下或生产力低下
  3. 客户不满意
  4. 机会成本,包括无法创新
  5. 声誉成本

高数据质量的好处

  1. 改善用户体验
  2. 提高生产力
  3. 降低风险
  4. 快速响应商机
  5. 增加收入
  6. 洞察客户,产品,流程和商机,获得竞争优势

数据生命周期管理重点

  1. 数据的创建和数据使用是数据生命周期中的关键点
  2. 数据质量管理必须贯穿整个数据生命周期
  3. 元数据质量管理必须贯穿整个数据生命周期
  4. 数据管理还需要包括确保数据安全,降低数据相关风险,比如数据丢失,被盗,误用。
  5. 数据管理工作应该聚焦于关键数据

不同种类数据管理

  • 按数据类型划分(第十章:参考数据和主数据)

    • 交易数据
    • 参考数据
    • 主数据
    • 元数据
  • 按数据内容划分(第五章:数据建模和设计)

    • 数据域
    • 主题区域

数据管理框架

环境因素六边形图

显示了人,过程,技术之间的关系,是理解DMBOK语境关系图的关键

DAMA-DMBOK数据管理框架(DAMA车轮图)

2022-05-25-22-17-01-image.png

第二章 数据处理伦理

本章讲述了关于数据及其应用过程中,数据伦理规范再促进信息透明,社会责任决策中的核心作用

数据伦理语境关系图

2022-05-26-00-00-18-image.png

数据伦理的三个准则

  1. 尊重他人
  2. 行善原则:不伤害。利益最大化,伤害最小化
  3. 公正

数据伦理的核心概念

  • 对人的影响
  • 滥用的可能
  • 数据的经济价值

数据隐私法

欧盟通用数据保护条例GDPR

  • 公平,合法,透明
  • 目的限制
  • 数据最小化
  • 准确性
  • 存储限制
  • 诚信和保密
  • 问责制度

个人信息保护及电子文件发PIPEDA

  • 问责制度
  • 目的明确
  • 授权
  • 收集,使用,披露和留存限制
  • 准确性
  • 保障措施
  • 透明度
  • 个人访问
  • 合规挑战

美国隐私方案标准

  • 发布/告知
  • 选择/许可
  • 访问/参与
  • 诚信/安全
  • 执行/纠正

在线数据伦理环境

  • 数据所有权
  • 被遗忘的权利
  • 身份
  • 在线言论自由

违反伦理原则的数据实践活动

  • 时机选择
  • 可视化误导
  • 定义不清晰或无效的比较
  • 偏见
    • 预设结论的数据采集
    • 预感和搜索:分析师有一种预感,而且想要满足这种预感,选择能证实这种直觉的数据
    • 片面抽样方法
    • 背景和文化差异导致的偏见,因此需要中立看待事物
  • 转换和集成数据
    • 对数据和血缘来源不了解
    • 质量差的数据
    • 不可靠的元数据
    • 没有数据修订历史的数据
  • 数据混淆和修订
    • 数据聚合
    • 数据标记
    • 数据脱敏

建立数据伦理文化

  1. 评审现有的数据处理方式
  2. 识别原则,时间,风险因素: 原则应与风险(如果不遵守原则可能发生的坏事情)和实践(正确的做法以避免风险)保持一致,应通过控制来支持实践。
  3. 制定合乎伦理的数据处理策略和路线图
  4. 采用对社会负责的伦理风险模型