产品功能
数据服务的功能包含数据集、数据接入、数据准备等模块,这些模块的功能如下。
数据接入
数据集
数据准备
数据建模
- 提供数据存放分层的增删改查功能,帮助用户管理数据模型的分层层次结构。
- 提供逻辑实体和物理实体管理功能,帮助用户完成标准化建模开发。
- 提供配置数据销毁审批人功能,同时帮助用户进行数据销毁任务管理。
数据解析
目前的数据解析可以实现Pcap文件、4G-sig文件、4G-pmmrf文件、5G-sig文件、5G-pmmrf文件的解析,将原始的二进制文件解析为CSV文件,并直接上传到云端数据湖。
数据加载
支持不同数据源间的数据加载,目前,源端支持OBS(数据湖OBS和租户OBS)、HIVE或DWS存储。目标端支持OBS(数据湖OBS)、HIVE、DWS或HDFS存储。同时支持本地大数据上传至OBS(数据湖OBS)。
数据处理
数据处理是通过执行python脚本处理OBS数据。
数据探索
时序数据标注
- 曲线形式展现原始数据:以图表的形式界面化显示原始数据,方便数据工程师、数据科学家便捷查看,标注异常值。支持展现单KPI数据列,也支持同时展现多KPI数据列原始数据。用户可以自定义选择。
- 曲线数据缩放查看:通过改变横轴时间戳游标的长短,可以对页面内展现的数据进行缩放;多组曲线图可实现X轴联动缩放。
- 单点标注+连续时间批量标注:用户可以单击数值点进行异常值标注或修改异常值为正常值。
- 连续时间批量标注:使用横向选择工具,批量将连续时间段内的数据标注为异常值或修改为正常值。
- 连续时间制定值域范围内批量标注:使用纵向选择工具,将当前显示时间范围内且数值在所选值域范围内的数据批量标注为异常值或修改为正常值。
- 任意连续区域批量标注:使用局部选择工具,将任意连续区域内的数据标注为异常值或修改为正常值。
- 自动标注:用户通过系统默认的自动检测规则或者配置指定时间范围内的阈值规则,批量自动标注数据。
- 标注结果文件保存:支持保存标注结果到租户的OBS桶。数据工程师、数据科学家可以根据训练结果对标注结果文件重新标注。
- 模板管理:对于多指标联合分析的场景,对选定指标分组后,可以将分组配置存为模板,形成业务经验方便后续使用。
- 标签组管理:对于标注的标签值进行定义,支持多分类标注。
安全管理
安全管理平台定义的数据密级信息,包括:绝密、机密、秘密、内部公开、外部公开。支持对组织类型、数据目录、实体和实体中的属性分别进行密级设置。用户访问数据目录时,需要到安全管理平台进行密级鉴权,鉴权通过后才能访问数据目录、实体和实体中的属性。
密级定义如下所示:
- 绝密:对公司市场竞争、领先对手起决定性作用,其泄露会使公司利益遭受巨大损害,且影响范围广泛;只适合在极少数人员或指定岗位范围公开的信息。如:核心算法、定价策略、战略意图。
- 机密:对公司运营管理非常重要或内容非常敏感,其泄露会使公司利益遭受巨大损害,且影响范围广泛;只适合在极少数人员或指定岗位范围公开的信息。如:重要产品的路标规划、营销策略、经营分析报告、销售项目一览表、商务授权及价格信息。
- 秘密:是公司比较重要或敏感的信息,其泄露会使公司利益受到一定损害,但影响范围有限;适合在体系、部门或特定组织范围公开的信息。
- 内部公开:指可以在全公司范围公开,但不应向公司外部扩散的信息。
- 外部公开:指可在公司外部公开发布的信息,不属于保密信息。
安全审计
安全审计界面列出了用户数据操作相关的记录列表。支持对用户数据操作进行审计。