脱敏处理
创建脱敏处理任务,将文件中的敏感信息进行脱敏处理。
操作步骤
- 在数据服务左侧导航,选择 。
- 创建脱敏处理任务入口。
- 在安全任务列表,在敏感检测任务对应的“操作”列下,单击。
- 在“安全任务”界面,单击 。
- 配置任务信息,参数说明如下。
- 任务名称:脱敏处理任务的自定义名称。
- 是否关联敏感检测任务:请根据实际情况在下拉框中选择。如果选择“关联”,则需要单击右侧出现的“关联”,在弹出的“选择敏感检测任务”对话框中,选中敏感检测任务,单击“确定”。此时,“源数据源”区域的参数自动关联出敏感检测任务的源数据配置;“脱敏方法配置”自动关联出敏感检测任务的敏感项和敏感样例信息。
- 配置源数据源参数信息,参数说明见表1。
如果“是否关联敏感检测任务”选择“非关联”,则执行此步骤。
表1 源数据源参数说明 参数
说明
数据源类型
数据源的类型,包含如下选项:
- 公有OBS
- 租户OBS:如果选择“租户OBS”,需要同时配置租户AK/SK信息。
仅支持用户所在region的OBS桶。
文件路径
待脱敏文件的OBS路径。支持填写完整路径。完整OBS路径的示例为“s3a://case-ai/case/test.csv”。如果OBS路径以“/”结尾,说明是目录,否则为文件;OBS路径中的“*”代表通配符,仅支持出现一次且元数据要保持一致。
分隔符
待脱敏数据文件的行分隔符。
表头行数
待脱敏数据文件的表头部分(非实际数据)所占行数。
表头所在行数不得超过数据起始行数;当表头所在行数为0时,表示没有表头这一行。
起始行数
待脱敏数据文件的实际数据开始行数(行数计数方式从1开始)。
检测
单击“检测”,可以查看数据文件的字段分隔情况。
- 配置结果数据源参数信息,参数说明如下。
- 数据源类型:请根据实际情况选择OBS桶。
- 文件夹路径:脱敏处理的结果文件存储路径,结果文件可能是多文件。
- “配置类型”请根据数据敏感类型,选择一种脱敏方式。
如果“是否关联敏感检测任务”选择“非关联”,则无此步骤。
- 普通脱敏配置:提供已有的脱敏项和脱敏方式,用户可根据实际情况新增。
- 高阶脱敏配置:提供微聚类算法方式进行脱敏,用户可根据实际情况设置。
- 配置脱敏方法,单击“新增”或“添加”。
其中,“脱敏方法”为针对不同敏感类型执行的脱敏方法;“作用字段”为脱敏操作针对每种敏感类型,实际进行脱敏的特征列名称,支持全选所有字段进行处理。如果需要“作用字段”列中的下拉框中,展示当前数据集中所有特征列名称,需要单击“源数据源”中的“检测”。
- “脱敏测试”支持在左侧框中输入敏感内容,单击“测试”,在右侧框中查看脱敏的效果。
- 配置完成脱敏处理任务后,单击界面右下角的“提交”,提交脱敏处理任务。
- 在“提示”对话框单击“确定”。
任务创建成功后,系统自动跳转至“安全任务”界面,新创建的任务显示在任务列表中。
- (可选)任务执行完成后,可以执行如下操作。
- 查看脱敏处理任务详情:在对应的“操作”列下,单击任务名称。
- 查看脱敏处理结果:在对应的“操作”列下,单击。
- 快速创建脱敏处理任务:在对应的“操作”列下,单击。
- 删除脱敏处理任务:在对应的“操作”列下,单击>。