更新时间:2025-04-30 GMT+08:00
分享

配置推荐识别(高级特性)

推荐识别主要用于直接检测数据源表中的敏感数据,支持入湖检测规则和AI推荐识别两种方式。

在新版本模式下仅当使用企业版时,才支持推荐识别功能,旧版本模式使用基础版及更高版本时即可支持。推荐识别功能当前在北京四、上海一内测(其他region后续会逐步放开,敬请期待!),但需申请白名单后才能使用。如需使用该特性,请联系客服或技术支持人员

前提条件

  • 已在管理中心创建数据仓库服务(DWS)、数据湖探索(DLI)、MapReduce服务(MRS Hive)和RDS MySQL类型的数据连接,请参考创建DataArts Studio数据连接
  • AI识别结果同步前,需要在数据目录组件对数据进行过元数据采集,详见元数据采集任务,否则会导致同步失败。

约束与限制

  • 入湖检测规则检测方式仅支持DWS、DLI、MRS Hive和RDS MySQL类型的数据源。
  • AI识别检测方式仅支持DWS、DLI和MRS Hive类型的数据源。
  • AI识别结果同步依赖于元数据采集任务。如果未对数据进行元数据采集,则会同步失败。

基于入湖检测规则识别敏感信息

  1. DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
  2. 单击左侧导航树中的敏感数据发现,在敏感数据发现页面选择“推荐识别”,进入推荐识别页签。

    图1 推荐识别页面

  3. 在页面中选择待识别敏感信息数据表,配置采样行数,识别方式选择为“入湖检测规则”。

    图2 配置入湖检测

  4. 手动刷新获取扫描结果,等待扫描状态为“成功”后 ,扫描结果返回。注意入湖检测规则识别方式为异步识别,需要手动刷新。

    图3 扫描结果

基于AI识别敏感信息

  1. DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
  2. 单击左侧导航树中的敏感数据发现,在敏感数据发现页面选择“推荐识别”,进入推荐识别页签。

    图4 推荐识别页面

  3. 在页面中选择待识别敏感信息数据表,配置采样行数,识别方式选择为“AI识别”。AI识别方式可以自动识别,实时得到推荐结果。

    图5 配置AI识别

  4. 如果想要将AI识别结果同步到数据地图组件,可以勾选字段,将分类信息和密级信息同步至数据地图。

    图6 AI识别结果同步

  5. 点击同步后,可以在“AI推荐识别结果”页面查看同步结果。注意同步为异步操作,若同步失败,可以查看原因,修正后再次进行同步。

    图7 查看同步结果

相关操作

  • 删除AI推荐识别结果:在AI推荐识别结果页面,单击对应识别结果操作栏中的“删除”,即可删除识别结果。当需要批量删除时,可以在勾选识别结果后,在列表上方单击“批量删除”。

    删除操作无法撤销,请谨慎操作。

  • 同步AI推荐识别结果:在AI推荐识别结果页面,单击对应识别结果操作栏中的“同步”,即可同步识别结果到数据地图。当需要批量同步时,可以在勾选识别结果后,在列表上方单击“批量同步”。

相关文档