更新时间:2026-06-26 GMT+08:00
管理敏感数据发现任务
如果想要对资产库中的数据做敏感数据扫描,需要先新建一个敏感数据发现任务。
添加敏感数据发现任务
- 使用系统管理员sysadmin账号登录数据库运维管理系统。
- 在左侧导航栏,选择,页面展示资产控制列表。
- 选择一个运维资产控制,单击“配置”按钮,浏览器新开一个页面。
- 选择“敏感数据发现”,页面展示敏感数据发现任务列表。 图1 敏感数据发现
- 单击“新增发现任务”按钮,页面跳转“新建任务”页面。
- 填写发现任务名称及备注(同一个资产库控制中的发现任务名称不能重复)。
- 单击“下一步”。页面跳转到“选择数据源”页面。
- 选择一个或者多个Schema,并选中Schema下想要执行发现操作的一个或多个表,单击“下一步”,页面跳转到“配置规则”页面。
- 选择采样方式,采样方式为顺序采样。设置最大采样数,默认为1000条数据,可手动调整,若实际数量不足1000条,则以实际数据量为准。设置匹配率,匹配率可以视为一个标准,如果某字段下数据,符合某数据域下的某一条发现规则的数据量与采样的有效数据量的比值大于设置的匹配率(系统默认50%,可手动调整),那么该字段就会被标记为该数据域。
- 添加敏感类型:单击添加敏感类型按钮,会显示出所在运维资产控制绑定的所有数据域,并带出数据域下的默认发现规则,可以手动调整规则,勾选数据域。
- 单击“确定”按钮,保存发现任务。
表1 添加敏感数据发现任务输入参数说明 参数
说明
发现任务名称
新增保存时的发现任务名称。(必填)
备注
对任务进行的额外标注,附加的备注信息。
Schema
数据源中的SCHEMA(可配置多个)。
表
指定任务中要被执行发现操作的表(可多选)。
采样方式
执行发现操作时,数据的采样方式为顺序采样。
采样数
执行发现操作时获取的数量总数,若设置的采样数大于表中数据总量,则采样数等于表中数据总量。
匹配率
是一个标准参数,如果某字段下数据,符合数据域下某一发现规则的数据量与采样的有效数据量的比值大于这一参数,则该字段会被标记为相应的数据域。
敏感类型
指数据域类型,选择敏感类型后会按照相应数据域的默认发现规则比对数据。
相关操作
后续您可以根据情况,在敏感数据发现页面进行以下操作:
- 编辑:选择一个敏感数据发现任务,单击“编辑”,可以根据需要对任务信息进行修改保存。
- 发现:选择一个敏感数据发现任务,单击“发现”,启动敏感数据扫描工作。系统页面自动跳转至监控页面,可以查看当前任务的执行情况。
- 监控:选择一个敏感数据发现任务,单击“监控”,页面跳转至监控页面可以监控当前正在执行或者执行完成的任务执行情况。
- 停止:选择一个执行过程中的敏感数据发现任务。单击“停止”。系统会自动强制停止发现任务的执行。被停止的发现任务不会生成执行结果。
- 智能发现:选择一个敏感数据发现任务,单击“更多”,选择“智能发现”,选择“发现版本”单击“智能发现”。启动智能敏感数据扫描工作。系统页面自动跳转至监控页面,可以查看当前任务的执行情况。智能发现是基于所选择的发现版本的结果基础上做的增量扫描。
- 查看历史:选择一个敏感数据发现任务,单击“更多”,选择“查看历史”,可以查看各个版本发现梳理结果的差异。操作详情请参见查看历史。
- 查看结果:选择一个敏感数据发现任务,单击“更多”,选择“查看结果”,页面跳转至显示发现任务执行后的结果页面。操作详情请参见查看结果。
- 删除:选择一个敏感数据发现任务,单击“更多”,选择“删除”,删除敏感数据发现任务。
- 智能发现主要解决敏感数据发现过程中,数据重复发现、重复梳理的过程,尽可能的降低重复发现、重复梳理的工作量。
- 在前述梳理发现结果,保存发现版本的功能中我们可以看到,某些字段已经被识别并标记成敏感字段保存在了某一种版本中,智能发现就实现这样一种效果:已经被确定为是某一敏感数据的字段便不会再被重复发现。下面通过一个应用示例,更好的解释一下智能发现功能:例如:在发现电话号码的过程中,有些系统编码的字段也会被标记成电话号码,这样的发现结果显然是不对的。这时我们就可以利用智能发现功能去解决这类问题。首先,通过批量设置规则功能,将被错误标记为电话号码的字段规则重置,之后保存为一个版本。然后,通过智能发现功能执行发现任务后便不会把那些字段标记为电话号码了。
- 增量发现是项目实战中总结的一种最佳实践,用于解决现实中遇到的两个问题:
- 敏感数据是动态变化的,主要表现为法律法规定义的敏感数据的范围可能发生变化;企业由于经营的原因,也可能增加、减少敏感数据的定义。
- 某类数据具有相似特征,在敏感数据发现时,优先级不容易进行区分,如:系统编码可能和手机号码的定义相同,这时增量发现可以快速的解决敏感数据发现面临的这种问题。对情况1,例如,法律法规此前没有定义电话号码为敏感数据,但是最近增加了联系方式作为敏感数据,那么我们如何对数据进行重新发现、梳理呢,如果进行全量发现,还需要重新进行全面的梳理,那么就需要增量发现进行支持。增量发现的操作步骤是结合智能发现功能,首先编辑发现任务将未纳入发现任务的数据域(敏感类型)和表添加到发现任务中,然后单击“智能发现”。选择之前梳理的版本。对于已经梳理过的字段的数据域,系统会根据之前保存的确认结果直接带入到发现结果中,对于新纳入的数据域和表会进行一个增量的发现。