配置推荐识别(高级特性)
推荐识别主要用于直接检测数据源表中的敏感数据,支持入湖检测规则和AI推荐识别两种方式。

在新版本模式下仅当使用企业版时,才支持推荐识别功能,旧版本模式使用基础版及更高版本时即可支持。推荐识别功能当前在北京四、上海一内测(其他region后续会逐步放开,敬请期待!),但需申请白名单后才能使用。如需使用该特性,请联系客服或技术支持人员。
前提条件
- 已在管理中心创建数据仓库服务(DWS)、数据湖探索(DLI)、MapReduce服务(MRS Hive)和RDS MySQL类型的数据连接,请参考创建DataArts Studio数据连接。
- AI识别结果同步前,需要在数据目录组件对数据进行过元数据采集,详见元数据采集任务,否则会导致同步失败。
约束与限制
- 入湖检测规则检测方式仅支持DWS、DLI、MRS Hive和RDS MySQL类型的数据源。
- AI识别检测方式仅支持DWS、DLI和MRS Hive类型的数据源。
- AI识别结果同步依赖于元数据采集任务。如果未对数据进行元数据采集,则会同步失败。
基于入湖检测规则识别敏感信息
- 在DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
- 单击左侧导航树中的
,在敏感数据发现页面选择“推荐识别”,进入推荐识别页签。图1 推荐识别页面
- 在页面中选择待识别敏感信息数据表,配置采样行数,识别方式选择为“入湖检测规则”。
图2 配置入湖检测
- 手动刷新获取扫描结果,等待扫描状态为“成功”后 ,扫描结果返回。注意入湖检测规则识别方式为异步识别,需要手动刷新。
图3 扫描结果
基于AI识别敏感信息
- 在DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
- 单击左侧导航树中的
,在敏感数据发现页面选择“推荐识别”,进入推荐识别页签。图4 推荐识别页面
- 在页面中选择待识别敏感信息数据表,配置采样行数,识别方式选择为“AI识别”。AI识别方式可以自动识别,实时得到推荐结果。
图5 配置AI识别
- 如果想要将AI识别结果同步到数据地图组件,可以勾选字段,将分类信息和密级信息同步至数据地图。
图6 AI识别结果同步
- 点击同步后,可以在“AI推荐识别结果”页面查看同步结果。注意同步为异步操作,若同步失败,可以查看原因,修正后再次进行同步。
图7 查看同步结果
相关操作
- 删除AI推荐识别结果:在AI推荐识别结果页面,单击对应识别结果操作栏中的“删除”,即可删除识别结果。当需要批量删除时,可以在勾选识别结果后,在列表上方单击“批量删除”。
删除操作无法撤销,请谨慎操作。
- 同步AI推荐识别结果:在AI推荐识别结果页面,单击对应识别结果操作栏中的“同步”,即可同步识别结果到数据地图。当需要批量同步时,可以在勾选识别结果后,在列表上方单击“批量同步”。