导入敏感数据
用户可以通过Excel模板批量导入敏感数据发现结果,简化敏感数据的管理流程,提高数据脱敏的灵活性和效率。
前提条件
- 已具备“敏感数据分布导入”的相关权限,可前往DataArts Studio实例的角色管理查看和配置。
- 已在管理中心新建数据湖探索(DLI)、 数据仓库服务(DWS)、MapReduce服务(MRS Hive)的数据连接,请参考创建DataArts Studio数据连接。
- 请先下载导入模板,按照模板要求填写表格数据,每一行为一条数据,导入不区分中英文模板。
约束限制
- 导入文件仅支持.xlsx格式,大小不超过1MB。
- 每个租户只能同时运行一个导入任务。
- 数据连接仅支持DLI、 DWS、MRS Hive(暂不支持连接串模式)。
- 导入表格总共8列,表标题顺序严格是:“数据识别规则名称”、“数据密级名称,”、“数据分类名称”、“数据库名”、“模式名”、“表名”、“字段名称”和“是否有效(Y/N)”,不得擅自修改或删除。
- 导入表格中“数据识别规则名称”、“数据密级名称”、“数据库名”、“表名”、“字段名称”和“是否有效(Y/N)”列为必填项,内容缺失将导致数据导入失败。
导入敏感数据
- 在DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
- 单击左侧导航树中的,进入敏感数据分布页面。
- 单击页签,进入数据导入页面。
图1 数据导入
- 单击“本地导入”,在对话框中配置参数。参数说明请参考表1。
表1 本地导入参数 参数名
参数说明
数据连接
选择数据连接。当前仅支持DLI、 DWS、MRS Hive(暂不支持连接串模式)数据连接。
重复数据策略
导入的敏感数据与当前系统中的敏感数据发生重复时,所需采取的处理策略。支持替换和跳过两种策略。
选择文件
请选择需要导入的本地文件。仅支持.xlsx格式,且大小不超过1MB。
允许部分失败
勾选后,若失败条数小于或等于设置阈值,则上传任务成功,超出阈值则上传任务失败。不勾选,若存在失败条数,则上传任务失败。
忽略失败条数
导入任务允许失败条数阈值,当勾选了“允许部分失败”时设置。输入值必须在10到20之间,若输入值大于导入总条数,则设置阈值不生效,忽略失败条数默认为0。
- 单击“确认导入”,开始导入任务。
系统会对导入文件进行校验,当校验无错误,或者错误条数小于等于“忽略失败条数”,则开始导入数据。导入任务成功后,可以前往“敏感数据分布”页面查看导入结果。
相关操作
- 查看导入数据:单击“敏感数据分布”页签,查看敏感数据导入结果。
- 查看任务状态:在导入敏感数据页面“状态”列,查看任务导入状态。
- 查看任务详情:在导入敏感数据页面,单击任务名称,进入任务详情页,查看任务详情。
- 导入详情:查看“导入总数”、“成功”、“失败”、“覆盖/跳过”等导入信息。
- 基础信息:查看任务基础信息。
- 任务配置:查看任务配置信息。
- 导入失败列表:当任务状态为“导入成功”,但存在部分导入失败的数据时,可以在导入失败列表中查看导入失败数据和导入失败原因。
- 删除任务:在导入敏感数据页面,单击操作栏中的“删除”,删除单个任务,或者勾选待删除的任务后再单击列表上方的“删除”,批量删除任务。删除任务时不会同步删除导入的敏感数据。导入中的任务不支持删除。
- 取消任务:当状态为“导入中”,可以单击操作列中的“取消导入”,取消导入任务。