脱敏处理
- 在数据服务首页左侧导航,选择 。
- 在“我的数据集”页签单击新增的数据集。
- 单击“脱敏处理”界面。 进入
- 配置“任务信息”区域参数,如下所示。
- 任务名称:脱敏处理任务的自定义名称。
- 是否关联敏感检测任务:如果选择“关联”,则需要单击右侧出现的“关联”,在弹出的“选择敏感检测任务”对话框中,选中敏感检测任务,单击“确定”。此时,“源数据源”区域的参数自动关联出敏感检测任务的源数据配置;“脱敏方法配置”自动关联出敏感检测任务的敏感项和敏感样例信息。
- 配置“源数据源”区域参数,如下所示。
- 文件路径:待脱敏处理文件的OBS路径。
- 分隔符:待脱敏处理文件的行分隔符。
- 表头行数:待脱敏数据文件的表头部分(非实际数据)所占行数。
- 起始行数:待脱敏数据文件的实际数据开始行数(行数计数方式从1开始)。表头所在行数不得超过数据起始行数;当表头所在行数为0时,表示没有表头这一行。
- 单击“检测”,可以查看数据文件的字段分隔情况。
- 配置“结果数据源”区域参数,如下所示。
- 数据源类型:取值为“公有OBS”或“租户OBS”。
- 文件夹路径:脱敏处理后生成的结果文件存储路径(结果文件可能是多文件)。
- “配置类型”请根据数据敏感类型,选择一种脱敏方式。
- 普通脱敏配置:提供已有的脱敏项和脱敏方式。
- 高阶脱敏配置:提供微聚类算法方式进行脱敏。
- 配置脱敏方法,单击“新增”或“添加”。
其中,“脱敏方法”为针对不同敏感类型执行的脱敏方法;“作用字段”为脱敏操作针对每种敏感类型,实际进行脱敏的特征列名称,支持全选所有字段进行处理。如果需要“作用字段”列中的下拉框中,展示当前数据集中所有特征列名称,需要单击“源数据源”中的“检测”。
配置完成后,单击操作列的“保存”。
- 单击“脱敏测试”左侧的图标,展开脱敏测试内容。
支持在左侧框中输入敏感内容,单击“测试”,在右侧框中查看脱敏的效果。
- 配置完成脱敏处理任务后,单击界面右下角的“提交”,提交脱敏处理任务。
- 界面弹出“提示”对话框,单击“确定”。
界面跳转至“安全任务”界面。可以在安全任务界面查看脱敏处理任务结果,主要为脱敏处理结果文件的位置,脱敏结果文件可以在对应的OBS路径下查看或下载。