更新时间:2024-08-29 GMT+08:00

管理样本库

数据安全支持将您提供的OBS或HDFS样本文件生成样本库。当新建随机脱敏或字符替换类型的脱敏算法时,可以选择将敏感数据脱敏为样本库文件中的值。

本章主要介绍如何创建样本。

前提条件

已在OBS或HDFS中上传样本文件。样本文件只支持txt格式,大小建议不超过10MB,其中数据可通过换行“\n”、空格“ ”、英文逗号“,”、或分隔符“|”进行分隔。

约束与限制

  • 新建随机脱敏或字符替换类型的脱敏算法时,如果选择将敏感数据脱敏为样本库脱敏,则测试算法时限制样本文件大小不能超过10kb。注意,10kb仅为算法测试功能的限制,静态脱敏时并不限制样本文件大小不超过10kb。
  • 样本文件大小建议不超过10MB,否则运行需要解析样本文件的静态脱敏任务时,静态脱敏任务可能会失败。
  • OBS样本文件只能用于DLI引擎的静态脱敏任务,HDFS样本文件只能用于MRS引擎的静态脱敏任务。静态脱敏场景与引擎之间的对应关系请参考参考:静态脱敏场景介绍

新建样本

  1. DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
  2. 单击左侧导航树中的样本库,进入样本库管理页面。

    图1 进入样本库管理页面

  3. 在样本库管理页面,单击目录上的,然后在光标移动到目录上,单击后,输入分类名用于新增样本库分类。分类名称只能包含英文字母、数字、“_”,且长度不超过64个字符,超出部分将被截断。样本库分类最多支持10层(不包含“全部”层)。

    图2 新增样本库分类

  4. 样本库分类创建完成后,在右侧点样本列表中单击“新建”,新建样本。新建样本时,默认填充分类为左侧选中的分类。

    图3 新建样本

  5. 在弹出的新建窗口中填写样本信息,参考表1完成配置。配置完成后单击“确定”即可。

    图4 新建样本窗口

    表1 新建样本参数配置

    参数

    参数描述

    *名称

    样本名称,只能包含英文字母、数字、“_”,且长度不能超过64个字符,超出部分将被截断。

    描述

    为更好地识别样本,此处加以描述信息,长度不能超过1024个字符。

    *分类

    默认填充分类为左侧选中的样本分类,您也可以单击选择已有分类。

    *选择样本

    选择已上传至OBS或HDFS中的样本文件。样本文件只支持txt格式,大小建议不超过10MB,其中的数据可通过换行“\n”、空格“ ”、英文逗号“,”、或分隔符“|”进行分隔。

    注意,OBS样本文件只能用于DLI引擎的静态脱敏任务,HDFS样本文件只能用于MRS引擎的静态脱敏任务。静态脱敏场景与引擎之间的对应关系请参考参考:静态脱敏场景介绍

    *分隔符

    选择样本文件中数据的分隔符,可选择换行“\n”、空格“ ”、英文逗号“,”、或分隔符“|”。

相关操作

  • 编辑样本库分类:在样本库管理页面,单击目录上的,然后在光标移动到待编辑的分类上,单击后,编辑分类名。
  • 删除样本库分类:在样本库管理页面,单击目录上的,然后在光标移动到待编辑的分类上,单击后,删除分类。

    如果样本库分类下还存在样本,则不允许被删除。另外,“全部”根节点分类也不允许删除。

    删除操作无法撤销,请谨慎操作。

  • 编辑样本:在样本库管理页面,单击对应样本操作栏中的“编辑”,即可修改样本的各项参数。
  • 删除样本:在样本库管理页面,单击对应样本操作栏中的“删除”,即可删除样本。
    注意,被脱敏算法引用的样本不能被删除。若要删除已引用的样本,需要先修改引用关系,再进行删除操作。

    删除操作无法撤销,请谨慎操作。