更新时间:2024-10-18 GMT+08:00

新建原子指标

原子指标是对指标统计逻辑、具体算法的一个抽象。为了从根源上解决定义、研发不一致的问题,指标定义明确设计统计逻辑(即计算逻辑),不需要ETL二次或者重复研发,从而提升了研发效率,也保证了统计结果的一致性。

原子指标:原子指标中的度量和属性来源于多维模型中的维度表和事实表,与多维模型所属的业务对象保持一致,与多维模型中的最细数据粒度保持一致。

原子指标中仅含有唯一度量,所含其它所有与该度量、该业务对象相关的属性,旨在用于支撑指标的敏捷自助消费。

背景信息

原子指标来源于事实表和维度表:

  • 原子指标是为了构建应用统计分析所需的衍生指标,而定义的数据组件,因此可以基于事实逻辑表明细数据表来创建,也可以基于维度表来创建。
  • 衍生指标无来源表,它归属于每个组合成它的原始的原子指标的来源表。

原子指标与衍生指标的关系:

  • 原子指标的计算逻辑修改生效后,会直接更新应用于相关的衍生指标。
  • 原子指标删除英文名,需要校验下游是否有衍生指标使用,如果有,则无法删除。
  • 目前原子指标在被下游使用的情况下,支持变更英文名。
  • 原子指标的更改会影响下游衍生指标。

约束与限制

单工作空间允许创建的原子指标个数最多5000个。

前提条件

您已创建并发布事实表,且事实表已通过审核,具体操作请参见新建事实表

新建原子指标并发布

  1. DataArts Studio控制台首页,选择对应工作空间的“数据架构”模块,进入数据架构页面。
  2. 在数据架构控制台,单击左侧导航树中的“技术指标”,选择“原子指标”页签进入原子指标页面。
  3. 在左侧主题目录中选中一个主题,然后单击“新建”按钮,开始新建原子指标。
  4. 在新建原子指标页面,参考表1配置参数,然后单击“发布”
    图1 新建原子指标
    表1 新建原子指标参数说明

    参数名称

    说明

    *指标名称

    只允许除\、<、>、%、"、'、;及换行符以外的字符。

    *指标英文名称

    只能包含英文字母、数字和下划线,且以英文字母开头。

    *数据表

    在下拉列表中选择一个已发布的事实表,如果表很多,您也可以在下拉列表的输入框中输入表名称搜索事实表。如果您尚未创建事实表,请参见新建事实表并发布进行创建并发布。

    *所属主题

    原子指标所属的主题信息。当“数据表”选择事实表后,将自动显示事实表所属的主题信息,您也可以单击“选择主题”进行选择。

    *设定表达式

    根据实际情况选择所需要的函数和字段,并设定表达式。函数列表及函数说明请参考函数说明

    描述

    描述信息。支持的长度为0~600个字符。

  5. 在弹出框中,选择审核人,单击“确认提交”,提交审核。

    如果当前用户已被添加为审核人,则可以勾选“自助审批”,单击“确认提交”后,状态显示为“已发布”

    选择审核人时,系统支持选择多个审核人,全部审批通过后,状态才会显示为已发布。如果有任意一个人驳回,则状态为已驳回。

  6. (可选)参考步骤3~步骤5,完成其他原子指标的发布。
  7. 等待审核人员审核。

    审核通过后,原子指标创建完成。

    原子指标创建完成后,单击指标名称,可以查看该原子指标的详情、关系图、发布历史和审核历史。

    通过关系图,可以查看该原子指标的血缘图。

    通过发布历史,可以查看该原子指标的发布历史和不同发布版本之间的差异对比。

管理原子指标

  1. 在数据架构控制台,单击左侧导航树中的“技术指标”,选择“原子指标”页签,进入原子指标页面。
    图2 管理原子指标
  2. 您可以根据实际需要选择如下操作。
    表2 操作

    当需要...

    则...

    新建

    执行新建原子指标并发布

    编辑

    执行3

    发布

    执行4

    查看发布历史

    执行5

    下线

    执行6

    删除

    执行7

    导入

    执行8

    导出

    执行9

  3. 编辑
    1. 在需要编辑的原子指标右侧,单击“编辑”,进入编辑原子指标页面。
    2. 根据实际需要编辑相关内容。
    3. 单击“发布”。如果您暂时不想发布,可以先单击“保存”,稍后再发布。
  4. 发布
    1. 在需要发布的原子指标右侧,单击“发布”,弹出“提交发布”对话框。
    2. 在下拉菜单中选择审核人。
    3. 单击“确认提交”
  5. 查看发布历史
    1. 在列表中,找到所需查看的原子指标,单击“更多 > 发布历史”,将显示“发布历史”页面。
    2. 在“发布历史”中,您可以查看原子指标的发布历史和版本对比信息。
  6. 下线
    1. 在需要下线的原子指标右侧,单击“更多 > 下线”,系统弹出“提交下线”对话框。
    2. 在下拉菜单中选择审核人。
    3. 单击“确认提交”

      下线及删除原子指标的前提是无依赖引用,即无衍生指标引用。

  7. 删除
    1. 勾选需要删除的原子指标,单击上方“更多 > 删除”,系统弹出“删除”对话框。
    2. 单击“是”
  8. 导入

    可通过导入的方式将原子指标批量快速的导入到系统中。

    1. 在原子指标列表上方,单击“更多 > 导入”,进入“导入配置”页签。
      图3 导入原子指标
    2. 下载原子指标导入模板,编辑完成后保存至本地。
    3. 选择是否更新已有数据。

      如果系统中已有的编码和模板中的编码相同,系统则认为是数据重复。

      • 不更新:当数据重复时,不会替换系统中原有的数据。
      • 更新:当数据重复时
        • 系统中的原有数据为草稿状态,则会覆盖生成新的草稿数据。
        • 系统中的原有数据为发布状态,则会生成下展数据。
    4. 单击“添加文件”,选择编辑完成的导入模板。
    5. 单击“上传文件”,上传完成后,自动跳转到“上次导入”页签,查看已导入的数据。
    6. 单击“关闭”。
  9. 导出

    可通过导出的方式将原子指标导出到本地。

    1. 在原子指标列表选中待导出的指标。
    2. 在列表上方,单击“更多 > 导出”,即可将系统中的原子指标导出到本地。
    • 在左侧主题树中选中某个主题,可以导出该主题下的所有原子指标;
    • 当该空间下不超过5000条原子指标数据时可以全部导出。

函数说明

新建原子指标时,需要按照函数设定表达式。以聚合函数的部分函数为例,函数说明如表3所示:

表3 聚合函数说明

函数名

表达式

函数说明

avg(col)

avg()

求平均值。

corr(col1, col2)

corr()

返回两列数值的相关系数。

count(*)

count()

返回记录条数。

covar_pop(col1, col2)

covar_pop()

返回两列数值协方差。

covar_samp(col1, col2)

covar_samp()

返回两列数值样本协方差。

max(col)

max()

返回最大值。

min(col)

min()

返回最小值。

stddev_pop(col)

stddev_pop()

返回指定列的偏差。

stddev_samp(col)

stddev_samp()

返回指定列的样本偏差。

sum(col)

sum()

求和。

var_samp(col)

var_samp()

返回指定列的样本方差。

如果想要查询更多函数的功能及说明,可以在新建原子指标页面的基本信息中的设定表达式项,单击对应函数,在页面右侧的函数说明框中会显示对应的函数说明。

图4 函数说明