管理动态脱敏策略

在数据安全组件创建动态脱敏策略后，系统会将动态脱敏策略同步到数据源服务，由数据源对数据列按照指定规则进行动态脱敏。当策略中指定的用户和用户组在访问敏感数据时，系统会直接返回由数据源动态脱敏后的数据，保护敏感数据不被泄露。

值得注意的是，动态脱敏策略为DataArts Studio实例级别配置，各工作空间之间数据互通，全局可见并生效。

前提条件

新建MRS Hive脱敏策略前，已完成如下操作：
- 在管理中心创建MapReduce服务（MRS Ranger）类型的数据连接，请参考创建DataArts Studio数据连接。
- 已完成用户同步，将IAM上的用户信息同步到数据源上，详见同步IAM用户到数据源。
新建DWS脱敏策略前，已完成如下操作：
- 已在管理中心创建数据仓库服务（DWS）类型的数据连接，请参考创建DataArts Studio数据连接。
- 已完成用户同步，将IAM上的用户信息同步到数据源上，详见同步IAM用户到数据源。
- 已修改DWS集群“feature_support_options”参数的CN参数值和DN参数值均为“enable_data_redaction”，用于启用DWS动态脱敏能力，修改操作详见修改DWS集群GUC参数。如果DWS集群没有feature_support_options参数，请联系DWS服务处理。
- 数据连接中的账户要具备待控制表的GRANT权限（数据库对象创建后，默认只有对象所有者或者系统管理员可以通过GRANT命令将对象的权限授予其他用户）。
MRS Hive和DWS动态脱敏策略为指定用户/用户组在数据源上关联策略，因此如果希望在DataArts Studio数据开发执行脚本、测试运行作业时，使用当前用户身份认证鉴权以实现动态脱敏策略生效，则需要启用细粒度认证。
如果希望创建脱敏策略时能够查看哪些字段为敏感字段，则需要提前完成敏感数据发现任务，并通过“敏感数据分布”修正敏感数据字段的数据状态为“有效”。详情请参考发现敏感数据和查看敏感数据分布。

约束与限制

仅DAYU Administrator、Tenant Administrator用户或者数据安全管理员可以创建、修改或删除动态脱敏策略，其他普通用户无权限操作。
MRS Hive和DWS动态脱敏策略为指定用户/用户组在数据源上关联策略，因此如果希望在DataArts Studio数据开发执行脚本、测试运行作业时，使用当前用户身份认证鉴权以实现动态脱敏策略生效，则需要启用细粒度认证。
当前动态脱敏策略仅支持MRS Hive、DWS数据源。
当前动态脱敏策略不支持连接串模式的MRS Hive数据源。
单条动态脱敏策略的配置维度为表级别，即一个表只允许绑定一个策略，一个策略也是只允许绑定一个表。只有处于“同步成功”状态的策略才能生效。
MRS Hive动态脱敏时，MRS Ranger支持对同一列配置不同规则，按照配置的时间顺序先后匹配，因此可以配置多条同集群、同库表列的不同内容的脱敏策略。
当前MRS服务支持的脱敏规则如表2所示，但对中文字符仅支持NULL掩盖和哈希掩盖两种脱敏方式，如果选择其他脱敏方式则脱敏不生效。
DWS动态脱敏不支持DWS逻辑集群，脱敏前需启用DWS动态脱敏能力（修改DWS集群“feature_support_options”参数的CN参数值和DN参数值均为“enable_data_redaction”，修改操作详见修改DWS集群GUC参数，如果集群没有feature_support_options参数，则需联系DWS服务处理），且DWS数据连接中的账户要具备待脱敏表的GRANT权限（数据库对象创建后，默认只有对象所有者或者系统管理员可以通过GRANT命令将对象的权限授予其他用户）。
当前DWS服务支持的脱敏规则如表3所示，不支持中文脱敏，如果对含有中文字符的数据进行脱敏则可能会出现乱码。

创建动态脱敏策略

登录DataArts Studio管理控制台。

详情请参考访问DataArts Studio实例控制台。
在DataArts Studio控制台首页，选择对应工作空间的“数据安全”模块，进入数据安全页面。
单击左侧导航树中的“隐私保护管理 > 动态脱敏”，进入动态脱敏页面。

图1 进入动态脱敏页面

单击“新建”，进入新建动态脱敏策略页面，参数配置参考表1。

点击放大

创建动态脱敏策略参数配置说明：

表1 配置策略参数
参数名	参数说明
*策略名称	动态脱敏策略的唯一标识，DataArts Studio实例内的名称唯一。为便于策略管理，建议名称中标明要脱敏的对象和脱敏规则。
*数据源类型	当前支持MRS Hive、DWS数据源。
MRS Hive
*用户组/用户	指定当前工作空间成员中的用户或用户组。当指定对象在数据开发组件中查询或导出敏感数据时，系统会对敏感数据进行动态脱敏，保护敏感数据不被泄露。
*数据连接	从下拉列表中选择数据连接类型中已创建的数据连接，若未创建请参考创建DataArts Studio数据连接新建连接。
*集群名称	无需选择，自动匹配数据连接中的数据源集群。
*数据库	选择敏感数据所在的数据库。
*数据表	选择敏感数据所在的数据表。
*数据列	您需要勾选一个或多个待脱敏列，并根据不同数据列的数据类型，选择合适的脱敏规则。各类数据源中不同数据类型支持的脱敏规则不同，详见参考：动态脱敏规则介绍。另外，如果选中的库表列有进行过敏感数据发现并且敏感数据字段的数据状态为“有效”，则将密级和数据分类显示在数据列区域中。
DWS
*用户组/用户	指定当前工作空间成员中的用户或用户组。当指定对象在数据开发组件中查询或导出敏感数据时，系统会对敏感数据进行动态脱敏，保护敏感数据不被泄露。
*数据连接	从下拉列表中选择数据连接类型中已创建的数据连接，若未创建请参考创建DataArts Studio数据连接新建连接。
*集群名称	无需选择，自动匹配数据连接中的数据源集群。
*数据库	选择敏感数据所在的数据库。
*schema	选择敏感数据所在的schema。
*数据表	选择敏感数据所在的数据表。
*数据列	您需要勾选一个或多个待脱敏列，并根据不同数据列的数据类型，选择合适的脱敏规则。各类数据源中不同数据类型支持的脱敏规则不同，详见参考：动态脱敏规则介绍。另外，如果选中的库表列有进行过敏感数据发现并且敏感数据字段的数据状态为“有效”，则将密级和数据分类显示在数据列区域中。

单击“确定”，完成动态脱敏策略创建。动态脱敏策略创建完成后，需要手动单击“同步”，将该策略同步到数据源中。

参考：动态脱敏规则介绍

MRS Hive动态脱敏规则由MRS Ranger组件提供，当前支持的规则如表2所示。
DWS动态脱敏规则由DWS提供，当前支持的规则如表3所示。

表2 MRS动态脱敏规则
数据类型	掩盖英文字符和数字	保留后四位	保留前四位	哈希掩盖	掩盖月份和日期	NULL掩盖
TINYINT	位数不变，将数值全部替换为1	无变化，最大值为127	无变化，最小值为-128	值变为NULL	位数不变，将数值全部替换为1	值变为NULL
SMALLINT	位数不变，将数值全部替换为1	无变化，最大值为12767	无变化，最大值为-32768	值变为NULL	位数不变，将数值全部替换为1	值变为NULL
INT	位数不变，将数值全部替换为1	保留后四位	保留前四位	值变为NULL	位数不变，将数值全部替换为1	值变为NULL
BIGINT	位数不变，将数值全部替换为1	保留后四位	保留前四位	值变为NULL	位数不变，将数值全部替换为1	值变为NULL
BOOLEAN	值变为NULL	值变为NULL	值变为NULL	值变为NULL	值变为NULL	值变为NULL
FLOAT	值变为NULL	值变为NULL	值变为NULL	值变为NULL	值变为NULL	值变为NULL
DOUBLE	值变为NULL	值变为NULL	值变为NULL	值变为NULL	值变为NULL	值变为NULL
STRING	英文字母变为x，数字变为n	中文无变化，字母等变为X	中文无变化且占一位，字母等变为X	全部被hash到64长度	中文无变化且占一位，字母等变为X	值变为NULL
TIMESTAMP	值变为NULL	值变为NULL	值变为NULL	值变为NULL	值变为NULL	值变为NULL
CHAR	英文字母变为x，数字变为n	字母数字变为X，后面4位保留(定长有空格)	字母数字变为X，前面4位保留(定长有空格)	全部被hash到64长度	中文无变化且占一位，字母等变为X	值变为NULL
VARCHAR	英文字母变为x，数字变为n	后四位被保留(中文无变化且占一位)，字母等变为X	前四位被保留(中文无变化且占一位)字母等变为X	全部被hash到64长度	中文无变化且占一位，字母等变为X	值变为NULL
DATE	年月日变为0001-01-01	年月日变为0001-01-01	年月日变为0001-01-01	值变为NULL	year保留，其他数值变为01	值变为NULL

表3 DWS动态脱敏规则
数据类型	全掩码	保留后4位，其余脱敏为‘*’	保留前2位，其余脱敏为‘*’	自定义
字符类型 bpchar、varchar、text、inet、macaddr、uuid、char、txt	全部脱敏为空。	后四位被保留，其余脱敏为“*”	前两位被保留，其余脱敏为“*”	自定义脱敏开始和结束位置，脱敏字符
数值类型 numeric、int2、int8、money、float8、float4、interval、decimal、double precision、real、integer、smallint、bigint	全部脱敏为“0”	不支持	不支持	自定义脱敏开始和结束位置，脱敏字符
时间类型 timestamp、time、timetz、timestamptz、date、time without time zone、timestamp without time zone、time without time zone、timestamp without time zone	全部脱敏为固定值	不支持	不支持	自定义勾选脱敏目标为年、月、日等
其他类型	全部脱敏为固定值	不支持	不支持	不支持