数据管理与分析
数据管理与分析
- 帆软商业智能解决方案
- 滴普科技数据智能平台解决方案
- 端边云车联网Serverless数据湖解决方案
- 华为云通用数据使能解决方案实践
- 天眼查商业查询解决方案实践
- 快速构建高可用TiDB集群
- 快速构建高可用Flink集群
- 华为云政务场景数据使能解决方案
- 数鑫科技领域数据空间解决方案
- 普元元数据资产管理解决方案
- 驾驶行为分析
- 软通动力数据中台及数据治理服务解决方案实践
- 中软国际数据治理专业服务解决方案实践
- 永洪商业智能解决方案
- 基于OBS配置大数据存算分离集群
- 翼海云峰大数据服务解决方案
- 观远商业智能数据分析解决方案
- 八六三智能数据平台解决方案
- 文档下载
- 通用参考
本文导读
展开导读
链接复制成功!
数据开发
- 项目创建
数据开发项目需为开发环境和生产环境配置数据鉴权模式,选择计算资源组,同时可以指定运行账号及运行队列。
图1 项目创建 - 离线任务开发
离线数据开发支持 HiveSQL、ImpalaSQL、SparkSQL、Python、Shell、Jar、Spark 等任务类型。
图2 离线任务开发 - 流程设计
任务运行以流程为核心,支持拖拉拽方式可视化编排,将多个不同类型的任务按照 DAG原则组织为其中各个子节点。
图3 流程设计1除了拖拉拽方式外,在具体的任务节点中,也可以配置化的方式添加本项目上游节点、跨项目依赖的上游节点。
图4 流程设计2 - 主流程设计
对于更加复杂的情况,同样可以通过拖拉拽方式可视化编排的方式,将项目内多个流程组织为主流程的形式满足复杂任务的依赖调度。
图5 主流程设计 - 任务调度
主流程、流程支持日、月、周、时、分等不同精度的周期调度方式。当设置为自动调度模式时,主流程或流程在发布到生产环境并启动后,将在有效期内,按给定的调度周期内的具体时间进行周期性调度。
图6 任务调度1主流程、流程外、任务节点均可设置具体运行时间。因此,同一流程下,不同任务节点在服从上下游顺序逻辑的前提下,均可按照自身的运行需要灵活启动。同时,可以对任务节点,可以设置出错重试次数和间隔时间,以实现任务调度过程中的容错处理。
图7 任务调度2如果不启动自动调度,主流程或流程在发布到生产环境并启动后,可以在有效期内通过手动调度方式运行。
图8 任务调度3同时,流程还支持自依赖、跨周期依赖设置,以支持复杂的调度场景需要。
图9 任务调度4 - 实时任务开发
FlinkSQL 任务可以通过模板快速生成 sink 和 source 代码。
图10 实时任务开发 - 实时任务调度
支持任务参数、运行参数、检查点、TTL 参数、任务并行数。支持数据血缘配置和版本管理。
图11 实时任务调度
父主题: 数据开发与治理