基本概念
数据目录
数据集的组织目录。
数据集
数据集是一种由数据所组成的集合,这些数据通常具有相似的特征或支撑目标。
数据集元数据
描述数据集数据具体特征的实体。
数据字典
描述数据集数据字段信息的集合。
样例数据
从数据集数据中随机抽取的10条数据,作为数据集数据的参考,供消费者或开发者参考使用。
数据集密级
用于控制数据集的可视、可用、可搜索的字段信息,包含外部公开、秘密、机密和绝密四种状态。
数据集发布
从特定系统中(当前阶段仅从数据权限服务)同步元数据,包含数据字段信息和样例数据信息,设置数据集的到期时间、可视范围等内容后,发布到数据目录服务中,供消费者订阅使用。
数据集授权
对秘密及以上密级的数据集,设置对特定租户或用户的可视范围,使得特定租户或用户对该数据集有可视、可搜索和可订阅的权限。
数据集订阅
消费者通过浏览数据集服务上的某个数据集,并订阅该数据集,实现对数据集使用的申请,将数据集管理的数据下载到OBS空间或下载到本地中进行使用。订阅后获得该数据集的元数据、数据变化通知等功能。
数据集下载
将已审批的数据集的数据下载到租户的OBS空间中,或者通过申请下载到本地后再从OBS空间下载到本地,供后续的训练等功能使用。