基于Dataphin数据建模研发沉淀的数据,数据萃取提供以目标对象为中心的数据打通和深度挖掘功能,并生成代码与调度任务,完成实体对象识别、连接及标签生产,可快速应用于各类业务。
初始化配置
- 登录Dataphin控制台。
- 在Dataphin控制台页面,选择工作区地域后,单击进入Dataphin>>。
- 在Dataphin页面,单击顶部菜单栏中的研发。
- 将鼠标悬停在开发上后,单击萃取,进入初始化配置页面。
- 根据页面提示选择计算引擎源后,单击测试连接性。
如果您没有计算引擎源,则需要创建计算引擎源,详情请参见计算引擎源。创建计算引擎时,计算引擎的名称固定为data_distill,类型为MAX_COMPUTE。
- 测试连接通过后,单击确定并开始初始化,初始化成功后即可在萃取模块进行数据的开发。
萃取简介
萃取由
行为中心和
标签中心组成:
行为中心和
标签中心组成:
- 行为中心提供明细行为的配置及行为数据统计信息。
- 标签中心支持标签可视化配置并自动生成标签调度任务,管理不同开发状态的标签任务。
注意事项
请勿删除萃取模块中的系统表,如下表所示。
表名 | 名称 | 描述 |
---|---|---|
oi_behavior_detail_d | 行为中心源数据接入 | 抽取源数据的行为大宽表。 |
oi_behavior_detail_d_sample | 行为中心抽样表 | oi_behavior_detail_d的抽样表,用于行为看板查看数据。 |
oi_behavior_label_value_d | 行为中心打标结果 | 行为打标的中间表。 |
oi_behavior_label_value_all | 行为中心打标结果 | 行为打标的累积表。 |
oi_person_label_value_all | 行为中心打标结果 | 行为中心打标结果的表。 |
oi_label_value_rule_d | 标签打标规则表 | 标签打标的中间表。 |
oi_dim_behavior_id | 行为定义维表 | 行为定义的表,从源数据同步而来。 |
oi_behavior_stat_d | 行为数据统计天表 | 行为数据统计表。 |
oi_behavior_stat_sync | 行为数据统计90天表 | 行为统计90天的数据。 |
oi_behavior_object_all | 行为数据对象累积年表 | 行为对象,对象属性的累积表。 |
oi_behavior_property_value | 行为数据属性表 | 对象值表,存储行为、对象以及对象值的表,供您在标签打标时参考。 |