DAMA第二章:数据伦理

169 阅读2分钟
  • 引言
  • 伦理,建立在是非观念上的行为准则。
    
  • 伦理准则:公平、尊重、责任、诚信、质量、可靠性、透明度、信任。
    
  • 核心概念:对人的影响、滥用的可能、数据的经济价值。
    
  • 业务驱动因素
  • 爱德华戴明,“在没有人注意的情况下正确做事”
    
  • 基本概念
  • 数据伦理准则:尊重他人、行善原则(不伤害、利益最大化、伤害最小化)、公正、尊重法律和公众利益。
    
  • 四大支柱: 1.面向未来的数据处理条例、尊重隐私权、数据保护权利。2.确定个人信息处理的责任人。3.数据处理产品、服务设计、工程过程中的隐私意识。4.增加个人的自主权。
    
  • 欧盟-GDPR; 加拿大-PIPEDA; 美国-FTC
    
  • 在线数据的伦理环境:1.数据所有权。2.被遗忘的权利。3.身份。4.在线言论自由。
    
  • 违反伦理原则的数据实践活动:1.时机选择。2.可视化误导。3.定义不清晰、无效比较。4.偏见。5.转换、集成数据。6.数据混淆、修订
    
    • 偏见偏差类型:1.预设结论的数据采集。2.预感、搜索。3.片面抽样方法。4.背景、文化。
      
    • 转换、集成数据:1.对数据来源血缘了解有限。2.数据质量差。3.元数据不可靠。4.文档没有数据修订历史。
      
    • 数据混淆、修订:1.数据聚合data aggregation。2.数据标记data marking。3.数据脱敏data masking。
      
  • 建立数据伦理文化:1.评审现有数据处理方法。2.识别原色、实践、风险因素。3.制定合乎伦理的数据处理策略、路线图。4.采用对社会负责的伦理风险模型