管理样本库
数据安全支持将您提供的OBS或HDFS样本文件生成样本库。当新建随机脱敏或字符替换类型的脱敏算法时,可以选择将敏感数据脱敏为样本库文件中的值。
本章主要介绍如何创建样本。
前提条件
已在OBS或HDFS中上传样本文件。样本文件只支持txt格式,大小建议不超过10MB,其中数据可通过换行“\n”、空格“ ”、英文逗号“,”、或分隔符“|”进行分隔。
约束与限制
- 新建随机脱敏或字符替换类型的脱敏算法时,如果选择将敏感数据脱敏为样本库脱敏,则测试算法时限制样本文件大小不能超过10kb。注意,10kb仅为算法测试功能的限制,静态脱敏时并不限制样本文件大小不超过10kb。
- 样本文件大小建议不超过10MB,否则运行需要解析样本文件的静态脱敏任务时,静态脱敏任务可能会失败。
- OBS样本文件只能用于DLI引擎的静态脱敏任务,HDFS样本文件只能用于MRS引擎的静态脱敏任务。静态脱敏场景与引擎之间的对应关系请参考参考:静态脱敏场景介绍。
新建样本
- 在DataArts Studio控制台首页,选择对应工作空间的“数据安全”模块,进入数据安全页面。
- 单击左侧导航树中的
,进入样本库管理页面。图1 进入样本库管理页面
- 在样本库管理页面,单击目录上的,然后在光标移动到目录上,单击后,输入分类名用于新增样本库分类。分类名称只能包含英文字母、数字、“_”,且长度不超过64个字符,超出部分将被截断。样本库分类最多支持10层(不包含“全部”层)。
图2 新增样本库分类
- 样本库分类创建完成后,在右侧点样本列表中单击“新建”,新建样本。新建样本时,默认填充分类为左侧选中的分类。
图3 新建样本
- 在弹出的新建窗口中填写样本信息,参考表1完成配置。配置完成后单击“确定”即可。
图4 新建样本窗口
表1 新建样本参数配置 参数
参数描述
*名称
样本名称,只能包含英文字母、数字、“_”,且长度不能超过64个字符,超出部分将被截断。
描述
为更好地识别样本,此处加以描述信息,长度不能超过1024个字符。
*分类
默认填充分类为左侧选中的样本分类,您也可以单击选择已有分类。
*选择样本
选择已上传至OBS或HDFS中的样本文件。样本文件只支持txt格式,大小建议不超过10MB,其中的数据可通过换行“\n”、空格“ ”、英文逗号“,”、或分隔符“|”进行分隔。
注意,OBS样本文件只能用于DLI引擎的静态脱敏任务,HDFS样本文件只能用于MRS引擎的静态脱敏任务。静态脱敏场景与引擎之间的对应关系请参考参考:静态脱敏场景介绍。
*分隔符
选择样本文件中数据的分隔符,可选择换行“\n”、空格“ ”、英文逗号“,”、或分隔符“|”。
相关操作
- 编辑样本库分类:在样本库管理页面,单击目录上的,然后在光标移动到待编辑的分类上,单击后,编辑分类名。
- 删除样本库分类:在样本库管理页面,单击目录上的,然后在光标移动到待编辑的分类上,单击后,删除分类。
如果样本库分类下还存在样本,则不允许被删除。另外,“全部”根节点分类也不允许删除。
删除操作无法撤销,请谨慎操作。
- 编辑样本:在样本库管理页面,单击对应样本操作栏中的“编辑”,即可修改样本的各项参数。
- 删除样本:在样本库管理页面,单击对应样本操作栏中的“删除”,即可删除样本。