更新时间:2025-07-18 GMT+08:00
配置数据入湖检测规则(高级特性)
数据入湖检测规则可用于如下场景的实时敏感信息检测:
- 数据集成(离线作业)进行表数据迁移时的“敏感数据检测”,详见配置离线处理集成作业。

在新版本模式下仅当使用企业版时,才支持配置数据入湖检测规则。旧版本模式使用基础版及更高版本时即可支持。
前提条件
- 识别规则创建完成,请参考定义识别规则(部分高级特性)。
约束与限制
- 数据集成(离线作业)的表数据迁移和数据安全敏感数据发现中的推荐识别场景下,仅支持MRS Hive、DWS、DLI和RDS MySQL数据源。
- 数据集成(离线作业)的表敏感数据检测对表内容格式要求如下:
- 表字段数量至多为500。
- 对于字符串类型的表字段,仅会检测前1000个字符的敏感信息,超过1000字符部分会被截断。
- 识别规则仅支持规则类型为正则表达式的内置规则或自定义规则,识别规则至多可以配置50条。
配置作业上移策略
如需将数据入湖检测规则应用到数据集成(离线作业)的表敏感数据实时检测中,则需开启并配置作业上移策略。
- 在DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
- 单击左侧导航树中的 ,在数据识别规则页面中单击“数据入湖检测规则”,进入数据入湖检测规则页签。
- 在数据入湖检测规则页面中,作业上移策略配置参数说明请参见表1。
图1 配置数据入湖检测规则
配置文件检测策略
文件检测策略默认开启。如果您需要自定义配置,请参考如下步骤进行修改。
- 在DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
- 单击左侧导航树中的 ,在数据识别规则页面中单击“数据入湖检测规则”,进入数据入湖检测规则页签。
- 数据入湖检测规则页面中,文件检测策略配置参数说明请参见表2。
图2 配置数据入湖检测规则
配置识别规则
- 在DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
- 单击左侧导航树中的 ,在数据识别规则页面中单击“数据入湖检测规则”,进入数据入湖检测规则页签。
- 在“数据入湖检测规则”页面中,单击配置规则。
图3 数据入湖检测规则页面图4 配置数据入湖检测规则
- 在弹出的规则配置窗口中,选择所需的识别规则,单击“提交”完成规则选择。
图5 配置规则
相关操作
- 删除数据入湖检测规则:在数据入湖检测规则页面,单击对应识别规则操作栏中的“删除”,即可删除识别规则。当需要批量删除时,可以在勾选识别规则后,在列表上方单击“批量删除”。
删除操作无法撤销,请谨慎操作。
父主题: 敏感数据识别