更新时间:2021-12-17 GMT+08:00
分享

基本概念

数据服务页面上的基本概念如下,其他各个工具的基本概念请在各个工具中查看。

抽取规则

在二进制文件解析完成后,根据用户自己设定的抽取规则,获取期望的解析结果。抽取规则可以为xml文件,也可以在页面手动输入。

待标注文件

待标注的时序指标数据文件。文件至少包含一列时间序列数据和一列指标数据。

点标注

对单指标点的标注。一个标注结果数据点对应单个指标数据点。

工程

一个完整的工程是由多个任务组成,每个任务是由URL和若干参数组成。

公共模板

不同租户或不同租户下的用户之间共享的项目。用户可以复用其他用户共享的公共模板来快速创建项目,并可根据实际情况修改项目参数。

HDFS

HDFS是Hadoop的分布式文件系统,在“数据探索”中可被作为一种文件数据源使用。

HIVE

HIVE是基于Hadoop的一个数据仓库,在“数据探索”中可被作为一种数据源使用。

KPI原始文件

未标注过的原始数据集。

MRS

MapReduce服务打造了高可靠、高安全、易使用的运行维护平台,对外提供大容量的数据存储和分析能力,可解决各大企业的数据存储和处理需求。用户可以独立申请和使用托管Hadoop、Spark、Hbase和Hive服务,用于快速在主机上创建集群,提供海量数据的实时性要求不高的批量数据存储和计算能力。

NAIE

网络人工智能引擎(Network Artificial Intelligence Engine)的缩写,构建电信网络的AI引擎。

OBS

基于对象的云存储服务, 在服务中可被作为一种文件数据源使用。

任务

任务是指组成项目的基本单元,任务的执行类型包括脚本、URL和用户任务。

私有模板

同一租户下不同用户之间共享的项目。用户可以复用当前租户下其他用户共享的私有模板来快速创建项目,并可根据实际情况修改项目参数。

数据集

数据集是一种由数据所组成的集合,这些数据通常具有相似的特征或支撑目标。

数据集元数据

描述数据集数据具体特征的实体。

数据集密级

用于控制数据集的可视、可用、可搜索的字段信息,包含外部公开、秘密、机密和绝密四种状态。

数据集发布

从特定系统中(当前阶段仅从数据权限)同步元数据,包含数据字段信息和样例数据信息,设置数据集的到期时间、可视范围等内容后,发布到数据目录中,供消费者订阅使用。

数据集授权

对秘密及以上密级的数据集,设置对特定租户或用户的可视范围,使得特定租户或用户对该数据集有可视、可搜索和可订阅的权限。

数据集订阅

消费者通过浏览数据集上的某个数据集,并订阅该数据集,实现对数据集使用的申请,将数据集管理的数据下载到OBS空间或下载到本地中进行使用。订阅后获得该数据集的元数据、数据变化通知等功能。

数据集下载

将已审批的数据集的数据下载到租户的OBS空间中,或者通过申请下载到本地后再从OBS空间下载到本地,供后续的训练等功能使用。

数据目录

数据集的组织目录。

数据字典

描述数据集数据字段信息的集合。

数据源

数据源是指数据的来源,是提供某种所需要数据的器件或原始媒体。

数据模型

数据模型包含物理实体和逻辑实体,能快速完成ES、DWS、OBS三种数据源上的数据物化。

如果用户无HIVE和HDFS数据源,则该数据源不开放。

实体

实体分为逻辑实体和物理实体,逻辑实体类型包括表(类似数据库表)、图片、视频、音频和文本。物理实体可以理解为实际的ES类型、DWS类型或OBS类型数据文件。

水印

数字水印过程就是向被保护的数字对象(如静止图像、视频、音频等)嵌入某些能证明版权归属或跟踪侵权行为的信息,可以是作者的序列号、公司标志、有意义的文本等等。 从视觉角度,分为可见水印和不可见水印。顾名思义,就是以嵌入水印后,能否被人以肉眼识别水印为依据划分的。

同步任务

指在用户发起后实时返回任务执行结果的探索任务,当前只支持在单个数据源内探索数据时发起。

URL

URL是指通过标准REST接口访问目标,例如:调用数据权限的创建迁移任务API等。

文件类型

待解析的原始文件类型,Pcap表示Pcap文件类型数据,WirelessBinary无线二进制数据,例如LTE-PMMRF、LTE-SIG等。

异步任务

只在用户发起后用户保存“任务名称”异步执行的探索任务,用户可以在“任务仓库”后查看异步任务的执行状态及结果。

样例数据

从数据集数据中随机抽取的10条数据,作为数据集数据的参考,供消费者或开发者参考使用。

租户OBS桶

租户订购服务后,分配该租户的公共OBS桶,以及该租户在集成管理控制台订购的OBS桶。该租户订购的所有服务均可以访问使用。

分享:

    相关文档

    相关产品