更新时间:2025-08-05 GMT+08:00
分享

敏感数据识别概述

敏感数据识别支持传统识别和大语言模型识别两种:
  • 传统识别基于数据识别引擎,对其储存结构化数据(RDS、DWS等)和非结构化数据(OBS)进行扫描、分类、分级。
  • 大语言模型识别是基于大模型语言能力对非结构化数据(OBS)和结构化数据(仅支持部分数据库)进行自动分级分类。大语言模型识别处于公测阶段,目前仅部分区域支持,详细支持的区域请参见功能总览中的敏感数据识别区域描述。

使用约束

对于MRS中的HIVE数据,在敏感数据识别时,当前仅支持“匹配类型”“规则匹配”“规则”内容 > 包含的方式。

大语言模型识别支持的数据类型

数据类型

数据源类型

版本

数据库

MySQL

5.6、5.7、5.8、8.0

PostgreSQL

15、14、13、12、11、10、9.6、9.5、9.4、9.1、1.0

Oracle

11、12

DWS

8.1.X

OBS

OBS

V3

使用流程

表1 功能介绍

功能

描述

相关操作

识别规则

拥有华为云计算公司数据安全内置的规则可供使用,同时可以自定义新的规则,将零散的数据按照识别规则进行分类,是创建识别模板必须的配置项。

新建自定义识别规则

级别配置

拥有华为云计算公司数据安全内置的级别可供使用,同时可以自定义新的级别,将每条规则进行分级。

新建分级

识别模板

拥有参考华为云计算公司数据安全分类分级标准和最佳实践内置的模板供使用,同时可以自定义新的分类分级模板,将多个零散的规则进行统一分级分类管理,是创建识别任务必须的配置项。

新建识别模板

识别任务

数据安全中心会根据创建的识别任务,在选定的OBS桶、数据库、大数据、MRS或者LTS的指定范围中,自动识别敏感数据并生成识别数据和结果。

新建传统敏感数据识别任务新建大语言模型敏感数据识别任务

查看或下载识别结果

识别任务扫描完成后,可在识别任务列表查看识别结果,也可将识别结果下载到本地查看。

查看并下载敏感数据识别结果

相关文档