检测文件敏感数据(高级特性)
通过创建文件敏感数据检测任务,可以快速识别文件中的敏感信息。

在新版本模式下仅当使用企业版时,才支持检测文件敏感数据功能,旧版本模式使用基础版及更高版本时即可支持。文件敏感数据当前在北京四、上海一内测(其他region后续会逐步放开,敬请期待!),但需申请白名单后才能使用。如需使用该特性,请联系客服或技术支持人员。
前提条件
- 已将待检测的CSV文件上传至OBS桶中。
- 已配置数据入湖检测规则,详见配置数据入湖检测规则(高级特性)。
约束与限制
- 当前仅支持检测OBS桶中CSV文件。
- 文件敏感数据检测对CSV文件格式要求如下:
- 文件为UTF-8格式编码
- 行分割符使用换行符 '\n'
- 字段分隔使用英文逗号 ','
- 首行将被识别为列名
- 若CSV字段值中包含特殊字符(例如字段分隔符、引号字符或行分隔符字符串中的任何字符),请使用英文双引号'"'包裹
- CSV文件字段数量至多为500
- CSV文件大小限制为1G
创建文件敏感数据检测任务
- 在DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
- 单击左侧导航树中的
,在敏感数据发现页面选择“文件敏感数据检测”,进入文件敏感数据检测页签。图1 文件敏感数据检测页面
- 在文件敏感数据检测页面,单击“新建”,创建文件敏感数据检测任务。在弹出的窗口中填写任务名称,选择文件。
图2 文件敏感数据检测页面
- 单击“确定”,任务自动运行。等待任务运行完成,即可查看检测结果。
图3 查看检测结果