原子指标是对指标统计口径、具体算法的抽象。Dataphin创新性地提出了设计即开发的理念,指标定义同时也明确了设计统计口径(即计算逻辑),提升了研发效率,并保证了统计结果的一致性。
背景信息
Dataphin根据计算逻辑的差异性,支持创建原子指标和衍生原子指标。详细说明如下:
- 原子指标是原生原子指标。例如,支付金额。
- 衍生原子指标是基于已提交原子指标,设定计算逻辑而构成的指标。例如,一个已提交的原子指标为支付金额,另一个已提交的原子指标为支付人数,您可以通过新建衍生原子指标的方式统计人均支付金额。
新建原子指标的权限限制,详情请参见数据开发权限列表。
新建原子指标
- 登录Dataphin控制台。
- 在Dataphin控制台页面,选择工作区地域后,单击进入Dataphin>>。
您可以通过以下方式,快速进入工作区:
- 选择工作区地域后,单击快速开始相关工作区域中相应的功能模块。
- 选择工作区地域后,单击快速进入研发项目后的Dev、Prod或Basic页签,选择相应的项目。
- 进入原子指标页面。
- 在Dataphin首页,单击顶部菜单栏中的研发。
- 在数据开发页面,单击项目名称后的
图标后,单击Dev或Basic页签,选择数据开发的Dev或Basic(非Data_distill)项目。
如果您当前访问的是
Dev或
Basic(非
Data_distill)项目,且项目为您的数据开发空间,则不需要选择项目。 - 在数据开发页面,单击规范建模。
如果进入数据
开发页面后,系统默认进入
规范建模页签,则无需再次单击
规范建模页签。 - 在规范建模页签,单击左侧导航栏中
原子指标图标。
- 在原子指标页面,单击原子指标后的
图标,选择新建原子指标。
您也可以通过以下方式,进入
新建原子指标:- 单击项目名称后的
图标,选择规范定义 > 原子指标。
- 在页面右侧的数据开发总览区域,单击原子指标下的
图标后,选择新建原子指标。
- 在原子指标页面左下方,单击原子指标对象列表。在对象列表页的原子指标页签,单击新建原子指标后,选择原子指标。
- 单击项目名称后的
- 在新建原子指标页面,选择数据域和来源表。
参数 描述 数据域 选择数据域。 说明 划分数据域,详情请参见
划分数据域。来源表 选择来源表。为保证建模标准规范,来源表仅支持维度逻辑表或事实逻辑表。 - 在新建原子指标页面,单击新建原子指标。
- 在新建原子指标对话框,配置参数。
参数 描述 主要来源字段 基于所选来源表,选择事实表或维度表中的字段。 英文名 基于所选主要来源字段,英文名自动填充为字段名,您也可以修改英文名。英文名由字母、数字或下划线(_)组合组成。 说明
英文名不能超过64个字符。名称 名称由汉字、字母、数字、下划线(_)或短划线(-)组合组成。 说明
名称不能超过64个字符。描述 填写原子指标的简单描述。 数据类型 数据类型包括STRING、BIGINT、DOUBLE、TIMESTAMPDATETIME和DECIMAL。 是否累加 基于不同大小统计周期的数据,选择是否需要累加计算。例如,最近7天支付金额,是否需要基于最近1天支付金额进行累加计算。 计算逻辑 基于来源逻辑表模型,定义所需指标的计算逻辑: - 编写SQL代码。
例如count(distinct order_id),其中order_id为来源逻辑表模型中的字段。
您也可以单击主键计算逻辑后的参考示例,可以查看SQL编写示例。
- 单击主键计算逻辑后面的规范性校验,可以校验您编写的SQL是否符合规范。
如果规范性校验校验失败,您可以单击格式化,系统会自动为您调整SQL语句的格式。
- 编写SQL代码。
- 提交和发布原子指标。
- 单击提交。
- 在提交备注对话框,填写备注信息。
- 单击确定并提交。
- 可选:发布原子指标。
- 如果您的开发模式是Dev-Prod,则需要发布已提交的原子指标,详情请参见管理发布任务。
- 如果您的开发模式是Basic,则提交成功的原子指标,即可进入生产环境。
新建衍生原子指标
- 在原子指标页面,单击原子指标后的
图标,选择新建衍生原子指标。
您也可以通过以下方式,进入
新建衍生原子指标:- 单击项目名称后的
图标,选择规范定义 > 衍生原子指标。
- 在页面右侧的数据开发总览区域,单击原子指标下的
图标后,选择新建衍生原子指标。
- 在原子指标页面左下方,单击原子指标对象列表。在对象列表页的原子指标页签,单击新建原子指标后,选择衍生原子指标。
- 单击项目名称后的
- 在新建衍生原子指标对话框,配置参数。
参数 描述 英文名 英文名由字母、数字、下划线(_)组合组成。 说明
英文名不能超过64个字符。名称 名称名称由汉字、字母、数字、下划线(_)或短划线(-)组合组成。 说明
名称不能超过64个字符。描述 对衍生指标的简单描述。 数据类型 数据类型包括STRING、BIGINT、DOUBLE、TIMESTAMPDATETIME和DECIMAL。 是否累加 基于不同大小统计周期的数据,选择是否需要累加计算。例如,最近7天支付金额,是否需要基于最近1天支付金额进行累加计算。 计算逻辑 基于已提交原子指标,组合设定所需指标的统计计算方式: - 在SQL语句输入框中输入衍生指标的计算公式,其中计算公式中引用的原子指标均为已提交的原子指标。
-
- 单击引用原子指标后的
图标后,单击数据域及来源表显示框,在下拉列表中选择数据域及来源表。
- 鼠标悬停至筛选出来的原子指标后,单击添加,将原子指标添加在右侧的SQL语句输入框中。
或在
图标后输入原子指标关键字进行快速搜索,单击搜索出来的原子指标后的添加,将原子指标添加在右侧的SQL语句输入框中。
- 单击引用原子指标后的
例如,计算人均下单金额
crt_amt/usr_cnt
,其中crt_amt为下单金额对应的已提交原子指标,usr_cnt为用户数对应的已提交原子指标。 - 提交衍生原子指标。
- 单击提交。
- 在提交备注对话框,填写备注信息。
- 单击确定并提交。
- 发布衍生原子指标。
- 如果您的开发模式是Dev-Prod,则需要发布已提交的衍生原子指标,详情请参见管理发布任务。
- 如果您的开发模式是Basic,则提交成功的衍生原子指标,即可进入生产环境。