更新时间:2025-06-26 GMT+08:00
分享

创建数据集和数据预处理概述

建立DataArts Insight与数据源的连接之后,需要创建数据集,并对数据集中的数据集进行预处理。

数据集作为数据源和可视化展示的中间环节,承接数据源的输入,并为可视化展示提供输入。在创建数据源之后,您可以基于当前数据源创建数据集,并对已添加的数据集做编辑、删除、关联、二次数据处理分析等操作。在做数据分析时,当需要分析的数据存储在不同的表,您可以通过数据关联,把多个表关联起来,形成模型进行数据分析。当数据表中的数据无法直接满足分析需求,而需要对原始数据进行加工处理时,可以新建指标。

主要功能

表1 主要功能介绍

功能

说明

具体操作

创建数据集

数据集作为数据源和可视化展示的中间环节,是可视化分析的基础,DataArts Insight支持可视化配置或自定义SQL方式创建数据集。

通过可视化方式创建数据集

通过SQL语句创建数据集

配置列级权限

通过列级权限功能设置禁止规则对某用户/用户组设置可见范围,从而保证数据的安全,设置脱敏规则,将敏感数据进行模糊化处理,从而保护数据安全。

配置列级权限

配置行级权限

通过行级授权支持对字段值设置查看范围,缩小字段值的可见范围。行级授权模式包含条件组合授权和用户标签授权两种方式。

配置行级权限

共享数据集

DataArts Insight支持将数据集分享给其他的用户/用户组,被分享的用户/用户组将获得对数据集的编辑和使用权限,以便团队成员可以快速开展协作。

分享数据集

多表级联建模

在进行数据分析的过程中,可能会遇到需要处理分散在不同表格中的数据,通过多表级联,您可以将这些分散的数据表连接起来,构建一个综合的数据模型进行深入分析。

多表级联建模

新建维度

分析的数据并不能直接从数据表中获取,而需要基于原始数据进行加工时,可以新建维度。通过新建维度,可以将原始数据转化为更加有意义的信息

新建维度

新建层次结构

层次结构是一种有效的数据组织方式,能够将维度值进行分类,通过分类能够清晰地观察到每个分类数量分布情况。

新建层次结构

设置SET语句

使用SET语句配置查询提示(Hint)是一种手动优化查询性能的方法,通过这种方式可以直接影响数据库查询优化器的决策,从而有利于提升数据库查询性能。

设置SET语句

创建指标

指标是一个量化的度量,用于衡量业务性能或目标的实现情况,常见的指标包括销售额、用户数、增长率、转化率、满意度等,这些指标能够直观地反映业务的运营状况,为决策者提供有力的数据支持。

创建指标

分享指标

DataArts Insight支持将指标分享给其他的用户/用户组,被分享的用户/用户组将获得对指标的编辑权限,以便团队成员可以快速开展协作。

分享指标

相关文档