更新时间:2026-01-29 GMT+08:00
分享

导入敏感数据

用户可以通过Excel模板批量导入敏感数据发现结果,简化敏感数据的管理流程,提高数据脱敏的灵活性和效率。

前提条件

  • 已具备“敏感数据分布导入”的相关权限,可前往DataArts Studio实例的角色管理查看和配置。
  • 已在管理中心新建数据湖探索(DLI)、 数据仓库服务(DWS)、MapReduce服务(MRS Hive)的数据连接,请参考创建DataArts Studio数据连接
  • 请先下载导入模板,按照模板要求填写表格数据,每一行为一条数据,导入不区分中英文模板。

约束限制

  • 导入文件仅支持.xlsx格式,大小不超过1MB。
  • 每个租户只能同时运行一个导入任务。
  • 数据连接仅支持DLI、 DWS、MRS Hive(暂不支持连接串模式)。
  • 导入表格总共8列,表标题顺序严格是:“数据识别规则名称”“数据密级名称,”“数据分类名称”“数据库名”“模式名”“表名”“字段名称”“是否有效(Y/N)”,不得擅自修改或删除。

  • 导入表格中“数据识别规则名称”“数据密级名称”“数据库名”“表名”“字段名称”“是否有效(Y/N)”列为必填项,内容缺失将导致数据导入失败。

导入敏感数据

  1. DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
  2. 单击左侧导航树中的敏感数据识别 > 敏感数据分布,进入敏感数据分布页面。
  3. 单击数据导入页签,进入数据导入页面。

    图1 数据导入

  4. 单击“本地导入”,在对话框中配置参数。参数说明请参考表1

    表1 本地导入参数

    参数名

    参数说明

    数据连接

    选择数据连接。当前仅支持DLI、 DWS、MRS Hive(暂不支持连接串模式)数据连接。

    重复数据策略

    导入的敏感数据与当前系统中的敏感数据发生重复时,所需采取的处理策略。支持替换和跳过两种策略。

    选择文件

    请选择需要导入的本地文件。仅支持.xlsx格式,且大小不超过1MB。

    允许部分失败

    勾选后,若失败条数小于或等于设置阈值,则上传任务成功,超出阈值则上传任务失败。不勾选,若存在失败条数,则上传任务失败。

    忽略失败条数

    导入任务允许失败条数阈值,当勾选了“允许部分失败”时设置。输入值必须在10到20之间,若输入值大于导入总条数,则设置阈值不生效,忽略失败条数默认为0。

  5. 单击“确认导入”,开始导入任务。

    系统会对导入文件进行校验,当校验无错误,或者错误条数小于等于“忽略失败条数”,则开始导入数据。导入任务成功后,可以前往“敏感数据分布”页面查看导入结果。

相关操作

  • 查看导入数据:单击“敏感数据分布”页签,查看敏感数据导入结果。
  • 查看任务状态:在导入敏感数据页面“状态”列,查看任务导入状态。

    导入状态包括:导入中、导入成功、导入失败。当任务状态为“导入失败”,鼠标悬浮到问号上查看任务失败原因。

  • 查看任务详情:在导入敏感数据页面,单击任务名称,进入任务详情页,查看任务详情。
    • 导入详情:查看“导入总数”、“成功”、“失败”、“覆盖/跳过”等导入信息。
    • 基础信息:查看任务基础信息。
    • 任务配置:查看任务配置信息。
    • 导入失败列表:当任务状态为“导入成功”,但存在部分导入失败的数据时,可以在导入失败列表中查看导入失败数据和导入失败原因。
  • 删除任务:在导入敏感数据页面,单击操作栏中的“删除”,删除单个任务,或者勾选待删除的任务后再单击列表上方的“删除”,批量删除任务。删除任务时不会同步删除导入的敏感数据。导入中的任务不支持删除。
  • 取消任务:当状态为“导入中”,可以单击操作列中的“取消导入”,取消导入任务。

相关文档