敏感数据识别概述
敏感数据识别支持传统识别和大语言模型识别两种:
- 传统识别基于数据识别引擎,对其储存结构化数据(RDS、DWS等)和非结构化数据(OBS)进行扫描、分类、分级。
- 大语言模型识别处于公测阶段,目前仅部分区域支持,详细支持的区域可通过控制台查询详情。
使用约束
对于MRS中的HIVE数据,在敏感数据识别时,当前仅支持“匹配类型”为“规则匹配”、“规则”为的方式。
大语言模型识别支持的数据类型
| 数据类型 | 数据源类型 | 版本 |
|---|---|---|
| 数据库 | MySQL | 5.6、5.7、5.8、8.0 |
| PostgreSQL | 15、14、13、12、11、10、9.6、9.5、9.4、9.1、1.0 | |
| Oracle | 11、12 | |
| DWS | 8.1.X | |
| OBS | OBS | V3 |
使用流程
| 功能 | 描述 | 相关操作 |
|---|---|---|
| 识别规则 | 拥有华为云计算公司数据安全内置的规则可供使用,同时可以自定义新的规则,将零散的数据按照识别规则进行分类,是创建识别模板必须的配置项。 | |
| 级别配置 | 拥有华为云计算公司数据安全内置的级别可供使用,同时可以自定义新的级别,将每条规则进行分级。 | |
| 识别模板 | 拥有参考华为云计算公司数据安全分类分级标准和最佳实践内置的模板供使用,同时可以自定义新的分类分级模板,将多个零散的规则进行统一分级分类管理,是创建识别任务必须的配置项。 | |
| 识别任务 | 数据安全中心会根据创建的识别任务,在选定的OBS桶、数据库、大数据、MRS或者LTS的指定范围中,自动识别敏感数据并生成识别数据和结果。 | |
| 查看或下载识别结果 | 识别任务扫描完成后,可在识别任务列表查看识别结果,也可将识别结果下载到本地查看。 |