数据集服务概述
通过介绍如何使用数据集服务发布数据集、配置数据集授权、订阅数据集和下载数据集,指导您快速上手使用数据集服务。
角色介绍
数据服务中定义了7个角色,如表1所示。
角色名称 |
说明 |
---|---|
Data Acquisition Engineer |
表示数据采集工程师,主要负责数据采集、传输和入湖,也可以查看和订阅数据集及下载数据集到OBS桶。 |
Data Processing Engineer |
表示数据工程师,主要负责数据解析适配、预处理、处理、后处理、控制数据流向、模型管理、设置数据目录和逻辑实体的密级,也可以查看和订阅数据集及下载数据集到OBS桶。 |
Data Asset Manager |
表示数据资产管理员,可执行的操作包括如下:
|
Data Lake SRE |
表示数据湖SRE(Site Reliability Engineer),可执行的操作包括如下:
|
Data Operation Engineer |
表示数据运营工程师,是对外提供数据消费的管理人员或系统,主要负责申请发布数据集、配置数据集授权、申请下架数据集,也可以查看和订阅数据集及下载数据集到OBS桶。 |
Data Owner |
表示数据目录审批人员,主要负责审批数据集发布申请、订阅申请、下架申请,也可以查看和订阅数据集及下载数据集到OBS桶。 |
Data Security Auditor |
表示安全审计员,负责数据安全审计工作。 |
数据集服务的使用对象
数据集服务的使用对象分为两类:数据管理者和数据消费者,“Data Operation Engineer”和“Data Owner”角色的用户属于数据管理者,“Data Acquisition Engineer”、“Data Processing Engineer”、“Data Asset Manager”、“Data Lake SRE”、“Data Security Auditor”角色、其他角色和无角色的用户均属于数据消费者。
数据管理者可以对当前租户下治理的数据进行管理,例如:发布数据集、配置数据集授权、审批数据集订阅申请等,也可以对当前租户下发布的数据集和其他租户下发布的外部公开及已授权的秘密、机密或绝密的数据集进行消费,例如:订阅数据集、下载数据集到OBS桶等。数据消费者可以对当前租户和其他租户下发布的外部公开及已授权的秘密、机密或绝密的数据集进行消费,但不能对数据集进行管理。
数据集服务支持一个用户同时拥有多个角色,当用户同时拥有多个角色时,该用户便有权限执行这些角色可执行的操作。
数据管理者和数据消费者的应用场景
- 如果用户已订购数据资产管理服务,并已使用数据资产管理服务完成数据治理和数据权限设置,则用户可以作为数据管理者发布数据集和配置数据集授权等,也可以对当前租户下发布的数据集和其他租户下发布的外部公开及已授权的秘密、机密或绝密的数据集进行消费。
- 如果用户已订购数据资产管理服务但未完成数据治理和数据权限设置,或未订购数据资产管理服务,则用户只能作为数据消费者对当前租户和其他租户下发布的外部公开及已授权的秘密、机密或绝密的数据集进行消费。