新建原子指标
原子指标是对指标统计逻辑、具体算法的一个抽象。为了从根源上解决定义、研发不一致的问题,指标定义明确设计统计逻辑(即计算逻辑),不需要ETL二次或者重复研发,从而提升了研发效率,也保证了统计结果的一致性。
原子指标:原子指标中的度量和属性来源于多维模型中的维度表和事实表,与多维模型所属的业务对象保持一致,与多维模型中的最细数据粒度保持一致。
原子指标中仅含有唯一度量,所含其它所有与该度量、该业务对象相关的属性,旨在用于支撑指标的敏捷自助消费。
背景信息
原子指标来源于事实表和维度表:
- 原子指标是为了构建应用统计分析所需的衍生指标,而定义的数据组件,因此可以基于事实逻辑表明细数据表来创建,也可以基于维度表来创建。
- 衍生指标无来源表,它归属于每个组合成它的原始的原子指标的来源表。
原子指标与衍生指标的关系:
- 原子指标的计算逻辑修改生效后,会直接更新应用于相关的衍生指标。
- 原子指标删除英文名,需要校验下游是否有衍生指标使用,如果有,则无法删除。
- 目前原子指标在被下游使用的情况下,支持变更英文名。
- 原子指标的更改会影响下游衍生指标。
约束与限制
单工作空间允许创建的原子指标个数最多5000个。
前提条件
您已创建并发布事实表,且事实表已通过审核,具体操作请参见新建事实表。
新建原子指标并发布
- 在DataArts Studio控制台首页,选择对应工作空间的“数据架构”模块,进入数据架构页面。
- 在数据架构控制台,单击左侧导航树中的“技术指标”,选择“原子指标”页签进入原子指标页面。
- 在左侧主题目录中选中一个主题,然后单击“新建”按钮,开始新建原子指标。
- 在新建原子指标页面,参考表1配置参数,然后单击“发布”。
图1 新建原子指标
表1 新建原子指标参数说明 参数名称
说明
*指标名称
只允许除\、<、>、%、"、'、;及换行符以外的字符。
*指标英文名称
只能包含英文字母、数字和下划线,且以英文字母开头。
*数据表
在下拉列表中选择一个已发布的事实表,如果表很多,您也可以在下拉列表的输入框中输入表名称搜索事实表。如果您尚未创建事实表,请参见新建事实表并发布进行创建并发布。
*所属主题
原子指标所属的主题信息。当“数据表”选择事实表后,将自动显示事实表所属的主题信息,您也可以单击“选择主题”进行选择。
*设定表达式
根据实际情况选择所需要的函数和字段,并设定表达式。函数列表及函数说明请参考函数说明。
描述
描述信息。支持的长度为0~600个字符。
- 在弹出框中,选择审核人,单击“确认提交”,提交审核。
如果当前用户已被添加为审核人,则可以勾选“自助审批”,单击“确认提交”后,状态显示为“已发布”。
选择审核人时,系统支持选择多个审核人,全部审批通过后,状态才会显示为已发布。如果有任意一个人驳回,则状态为已驳回。
- (可选)参考步骤3~步骤5,完成其他原子指标的发布。
- 等待审核人员审核。
原子指标创建完成后,单击指标名称,可以查看该原子指标的详情、关系图、发布历史和审核历史。
通过关系图,可以查看该原子指标的血缘图。
通过发布历史,可以查看该原子指标的发布历史和不同发布版本之间的差异对比。
管理原子指标
- 在数据架构控制台,单击左侧导航树中的“技术指标”,选择“原子指标”页签,进入原子指标页面。
图2 管理原子指标
- 您可以根据实际需要选择如下操作。
- 编辑
- 在需要编辑的原子指标右侧,单击“编辑”,进入编辑原子指标页面。
- 根据实际需要编辑相关内容。
- 单击“发布”。如果您暂时不想发布,可以先单击“保存”,稍后再发布。
- 发布
- 在需要发布的原子指标右侧,单击“发布”,弹出“提交发布”对话框。
- 在下拉菜单中选择审核人。
- 单击“确认提交”。
- 查看发布历史
- 在列表中,找到所需查看的原子指标,单击“更多 > 发布历史”,将显示“发布历史”页面。
- 在“发布历史”中,您可以查看原子指标的发布历史和版本对比信息。
- 下线
- 在需要下线的原子指标右侧,单击“更多 > 下线”,系统弹出“提交下线”对话框。
- 在下拉菜单中选择审核人。
- 单击“确认提交”。
下线及删除原子指标的前提是无依赖引用,即无衍生指标引用。
- 删除
- 勾选需要删除的原子指标,单击上方“更多 > 删除”,系统弹出“删除”对话框。
- 单击“是”。
- 导入
- 在原子指标列表上方,单击“更多 > 导入”,进入“导入配置”页签。
图3 导入原子指标
- 下载原子指标导入模板,编辑完成后保存至本地。
- 选择是否更新已有数据。
如果系统中已有的编码和模板中的编码相同,系统则认为是数据重复。
- 不更新:当数据重复时,不会替换系统中原有的数据。
- 更新:当数据重复时
- 系统中的原有数据为草稿状态,则会覆盖生成新的草稿数据。
- 系统中的原有数据为发布状态,则会生成下展数据。
- 单击“添加文件”,选择编辑完成的导入模板。
- 单击“上传文件”,上传完成后,自动跳转到“上次导入”页签,查看已导入的数据。
- 单击“关闭”。
- 在原子指标列表上方,单击“更多 > 导入”,进入“导入配置”页签。
- 导出
- 在原子指标列表选中待导出的指标。
- 在列表上方,单击“更多 > 导出”,即可将系统中的原子指标导出到本地。
- 在左侧主题树中选中某个主题,可以导出该主题下的所有原子指标;
- 当该空间下不超过5000条原子指标数据时可以全部导出。
函数说明
新建原子指标时,需要按照函数设定表达式。以聚合函数的部分函数为例,函数说明如表3所示:
函数名 |
表达式 |
函数说明 |
---|---|---|
avg(col) |
avg() |
求平均值。 |
corr(col1, col2) |
corr() |
返回两列数值的相关系数。 |
count(*) |
count() |
返回记录条数。 |
covar_pop(col1, col2) |
covar_pop() |
返回两列数值协方差。 |
covar_samp(col1, col2) |
covar_samp() |
返回两列数值样本协方差。 |
max(col) |
max() |
返回最大值。 |
min(col) |
min() |
返回最小值。 |
stddev_pop(col) |
stddev_pop() |
返回指定列的偏差。 |
stddev_samp(col) |
stddev_samp() |
返回指定列的样本偏差。 |
sum(col) |
sum() |
求和。 |
var_samp(col) |
var_samp() |
返回指定列的样本方差。 |
如果想要查询更多函数的功能及说明,可以在新建原子指标页面的基本信息中的设定表达式项,单击对应函数,在页面右侧的函数说明框中会显示对应的函数说明。