梧桐db数据脱敏功能调研介绍数据库脱敏是一种采用专门的脱敏算法对敏感数据进行变形、屏蔽、替换、随机化、加密，并将敏感数据

脱敏功能调研介绍

数据库脱敏是一种采用专门的脱敏算法对敏感数据进行变形、屏蔽、替换、随机化、加密，并将敏感数据转化为虚构数据的技术。

按照作用位置、实现原理不同，数据脱敏可以划分为静态数据脱敏（Static Data Masking，SDM）和动态数据脱敏（Dynamic Data Masking，DDM）

一般用于非生产环境，在不能将敏感数据存储于非生产环境的场合中，通过脱敏程序转换生产数据，使数据内容及数据间的关联能够满足测试、开发中的问题排查需要，同时进行数据分析、数据挖掘等分析活动。
技术原理主要通过内置规则来自动识别敏感数据，通过内置的脱敏算法进行数据的漂白。识别敏感数据有两种方式，第一种是通过人工指定，比如通过正则表达式来指定敏感数据的格式（Oracle公司开发的Oracle DataMasking Pack中就使用了这一种方法来指定）；第二种方式为自动识别，该方式是基于敏感数据的特征来进行敏感数据的自动识别。识别出敏感数据之后，就需要使用脱敏算法来进行脱敏。在比较常见的数据脱敏系统中，算法的选择一般是通过手工指定，可对常见数据如姓名、证件号等敏感数据进行脱敏。常见的内置脱敏算法有同义替换、部分数据遮蔽、混合屏蔽、确定性屏蔽、可逆脱敏等。

通常用于生产环境，在敏感数据被低权限个体访问时才对其进行脱敏，并能够根据策略执行相应的脱敏方法。在大数据环境中，数据的海量、异构、实时处理将成为常态，能够在不影响数据使用的前提下，在用户层面实现数据屏蔽、加密、隐藏、审计或内容封锁的动态脱敏具有更强的优势。

Anon基于pg 12引入的特性: Security Label，Event Triggers。

在当前数据库中，如果发生了建表/新建mask规则(通过 SECURITY LABEL), 就会执行

mask_update。mask_update就是从security lable 中扫描masking规则，将每个

anon.sourceschema下面的表，在anon.maskschema下建立对应的视图。

Step1. 创建一个schema, 将其设置为需要脱敏的schema，设置一个脱敏的目标的

schema(不存在后续会自动创建)

Step2. 打开动态脱敏

SELECT anon.start_dynamic_masking();

Step3. 创建一个读取脱敏信息的用户，给他标记

Step4. 创建表格，插入数据

CREATE TABLE people ( id TEXT, firstname TEXT, lastname TEXT, phone TEXT)

DISTRIBUTED BY (id);

INSERT INTO people VALUES ('T1','Sarah', 'Conor','0609110911');

Step5. 声明脱敏规则

Step6. 另一个用户登录，select 得到脱敏后数据

另一个用户查询到的是视图，视图在anon.maskschema下。

select * from anon.pg_masking_rules;