更新时间:2025-12-19 GMT+08:00
数据入湖脱敏(高级特性)
通过配置数据入湖脱敏策略,可以实现在数据开发进行Migration算子数据迁移时,对迁移后的敏感数据按照对应脱敏算法脱敏。
前提条件
- 已完成数据密级定义,请参见定义数据密级。
- 已创建识别规则,请参考定义识别规则(部分高级特性)。
- 已配置内置脱敏算法或者已自定义脱敏算法,请参考管理脱敏算法。
约束与限制
- 仅DAYU Administrator、Tenant Administrator用户或者数据安全管理员可以创建、修改或删除数据入湖脱敏策略,其他普通用户仅支持查看。
- 数据入湖脱敏策略最多支持新建100个,单个策略最多配置100个规则。
- 数据入湖脱敏策略只支持扫描内容的规则,包括内置规则,以及新建的扫描内容规则。如不选择扫描规则,则默认脱敏。
- 数据入湖脱敏策略不支持涉及样本库脱敏的算法,不支持DWS专用脱敏算法,不支持KMS加密类算法。
- 请确保数据开发离线集成作业中CDM集群为25.3.0及以上版本。
配置数据入湖脱敏策略
- 在DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
- 单击左侧导航树中的,在脱敏策略页面选择“数据入湖脱敏策略”,进入数据入湖脱敏策略页签。
- 在数据入湖脱敏策略页面单击“新建”,创建数据入湖脱敏策略。
图1 创建数据入湖脱敏策略
- 在弹出的创建策略页面中,输入策略名称和描述,在扫描规则处选配置识别规则以及对应的脱敏算法。
图2 配置数据入湖脱敏策略
- 策略配置完成后,单击“确定”,完成数据入湖脱敏策略的配置。
- 在数据开发组件页面,选择“数据开发 > 作业开发”,配置离线集成作业。
可以选择以下任意一种方式配置离线集成作业。
- 新建离线处理类型的集成作业后,进入配置页面。
- 新建Pipeline模式的作业后,拖动Data Migration算子至画布,再单击“配置”。
图3 在数据开发侧配置离线集成作业
- 在配置页面,完成类型配置、源端配置和目的端配置后,在字段映射区域为源端待脱敏的字段设置转换器,启用数据入湖脱敏策略。转换器类型选择“复杂脱敏”,复杂脱敏策略选择步骤4中创建的数据入湖脱敏策略。
图4 在数据开发侧启用数据入湖脱敏策略
相关操作
- 编辑数据入湖脱敏策略:在数据入湖脱敏策略页面,单击对应策略操作栏中的“编辑”,即可修改脱敏策略各项参数。
- 编辑数据入湖脱敏策略状态:新增的数据入湖脱敏策略默认为启用状态。当数据入湖脱敏策略为关闭状态时,表示该策略将不生效。
- 需要修改数据入湖脱敏策略状态时,在数据入湖脱敏策略页面单击对应脱敏策略中的
或
,即可启用或关闭数据入湖脱敏策略。
- 删除数据入湖脱敏策略:在数据入湖脱敏页面,单击对应任务操作栏中的“删除”,在弹窗中再次确认后,即可删除策略。
删除操作无法撤销,请谨慎操作。
父主题: 隐私保护管理