基本概念
数据服务页面上的基本概念如下,其他各个工具的基本概念请在各个工具中查看。
抽取规则
在二进制文件解析完成后,根据用户自己设定的抽取规则,获取期望的解析结果。抽取规则可以为xml文件,也可以在页面手动输入。
待标注文件
待标注的时序指标数据文件。文件至少包含一列时间序列数据和一列指标数据。
点标注
对单指标点的标注。一个标注结果数据点对应单个指标数据点。
工程
一个完整的工程是由多个任务组成,每个任务是由URL和若干参数组成。
公共模板
不同租户或不同租户下的用户之间共享的项目。用户可以复用其他用户共享的公共模板来快速创建项目,并可根据实际情况修改项目参数。
HDFS
HDFS是Hadoop的分布式文件系统,在“数据探索”中可被作为一种文件数据源使用。
HIVE
HIVE是基于Hadoop的一个数据仓库,在“数据探索”中可被作为一种数据源使用。
KPI原始文件
未标注过的原始数据集。
MRS
MapReduce服务打造了高可靠、高安全、易使用的运行维护平台,对外提供大容量的数据存储和分析能力,可解决各大企业的数据存储和处理需求。用户可以独立申请和使用托管Hadoop、Spark、Hbase和Hive服务,用于快速在主机上创建集群,提供海量数据的实时性要求不高的批量数据存储和计算能力。
NAIE
网络人工智能引擎(Network Artificial Intelligence Engine)的缩写,构建电信网络的AI引擎。
OBS
基于对象的云存储服务, 在服务中可被作为一种文件数据源使用。
任务
任务是指组成项目的基本单元,任务的执行类型包括脚本、URL和用户任务。
私有模板
同一租户下不同用户之间共享的项目。用户可以复用当前租户下其他用户共享的私有模板来快速创建项目,并可根据实际情况修改项目参数。
数据集
数据集是一种由数据所组成的集合,这些数据通常具有相似的特征或支撑目标。
数据集元数据
描述数据集数据具体特征的实体。
数据集密级
用于控制数据集的可视、可用、可搜索的字段信息,包含外部公开、秘密、机密和绝密四种状态。
数据集发布
从特定系统中(当前阶段仅从数据权限)同步元数据,包含数据字段信息和样例数据信息,设置数据集的到期时间、可视范围等内容后,发布到数据目录中,供消费者订阅使用。
数据集授权
对秘密及以上密级的数据集,设置对特定租户或用户的可视范围,使得特定租户或用户对该数据集有可视、可搜索和可订阅的权限。
数据集订阅
消费者通过浏览数据集上的某个数据集,并订阅该数据集,实现对数据集使用的申请,将数据集管理的数据下载到OBS空间或下载到本地中进行使用。订阅后获得该数据集的元数据、数据变化通知等功能。
数据集下载
将已审批的数据集的数据下载到租户的OBS空间中,或者通过申请下载到本地后再从OBS空间下载到本地,供后续的训练等功能使用。
数据目录
数据集的组织目录。
数据字典
描述数据集数据字段信息的集合。
数据源
数据源是指数据的来源,是提供某种所需要数据的器件或原始媒体。
数据模型
数据模型包含物理实体和逻辑实体,能快速完成ES、DWS、OBS三种数据源上的数据物化。
如果用户无HIVE和HDFS数据源,则该数据源不开放。
实体
实体分为逻辑实体和物理实体,逻辑实体类型包括表(类似数据库表)、图片、视频、音频和文本。物理实体可以理解为实际的ES类型、DWS类型或OBS类型数据文件。
水印
数字水印过程就是向被保护的数字对象(如静止图像、视频、音频等)嵌入某些能证明版权归属或跟踪侵权行为的信息,可以是作者的序列号、公司标志、有意义的文本等等。 从视觉角度,分为可见水印和不可见水印。顾名思义,就是以嵌入水印后,能否被人以肉眼识别水印为依据划分的。
同步任务
指在用户发起后实时返回任务执行结果的探索任务,当前只支持在单个数据源内探索数据时发起。
URL
URL是指通过标准REST接口访问目标,例如:调用数据权限的创建迁移任务API等。
文件类型
待解析的原始文件类型,Pcap表示Pcap文件类型数据,WirelessBinary无线二进制数据,例如LTE-PMMRF、LTE-SIG等。
异步任务
只在用户发起后用户保存“任务名称”异步执行的探索任务,用户可以在“任务仓库”后查看异步任务的执行状态及结果。
样例数据
从数据集数据中随机抽取的10条数据,作为数据集数据的参考,供消费者或开发者参考使用。
租户OBS桶
租户订购服务后,分配该租户的公共OBS桶,以及该租户在集成管理控制台订购的OBS桶。该租户订购的所有服务均可以访问使用。