应用与数据集成平台 ROMA Connect
应用与数据集成平台 ROMA Connect
- 最新动态
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
-
用户指南
- 开始使用ROMA Connect
- 实例管理
- 集成应用管理
-
数据源管理
- ROMA Connect支持的数据源
- 接入API数据源
- 接入ActiveMQ数据源
- 接入ArtemisMQ数据源
- 接入DB2数据源
- 接入DIS数据源
- 接入DWS数据源
- 接入DM数据源
- 接入Gauss100数据源
- 接入FTP数据源
- 接入HL7数据源
- 接入HANA数据源
- 接入HIVE数据源
- 接入LDAP数据源
- 接入IBM MQ数据源
- 接入Kafka数据源
- 接入MySQL数据源
- 接入MongoDB数据源
- 接入MQS数据源
- 接入MRS Hive数据源
- 接入MRS HDFS数据源
- 接入MRS HBase数据源
- 接入MRS Kafka数据源
- 接入OBS数据源
- 接入Oracle数据源
- 接入PostgreSQL数据源
- 接入Redis数据源
- 接入RabbitMQ数据源
- 接入RocketMQ数据源
- 接入SAP数据源
- 接入SNMP数据源
- 接入SQL Server数据源
- 接入GaussDB(for MySQL)数据源
- 接入WebSocket数据源
- 接入自定义数据源
- 数据集成指导
- 服务集成指导
- 服务集成指导(旧版界面)
- 消息集成指导
- 设备集成指导
- 应用业务模型使用指导
- 扩大资源配额
- 查看审计日志
- 查看监控指标
- 权限管理
- 用户指南(新版)
- 最佳实践
-
开发指南
- 数据集成开发指导
-
服务集成开发指导
- 开发说明
- API调用认证开发(APP认证)
- API调用认证开发(IAM认证)
-
自定义后端开发(函数后端)
- 函数后端脚本开发说明
- AesUtils类说明
- APIConnectResponse类说明
- Base64Utils类说明
- CacheUtils类说明
- CipherUtils类说明
- ConnectionConfig类说明
- DataSourceClient类说明
- DataSourceConfig类说明
- ExchangeConfig类说明
- HttpClient类说明
- HttpConfig类说明
- JedisConfig类说明
- JSON2XMLHelper类说明
- JSONHelper类说明
- JsonUtils类说明
- JWTUtils类说明
- KafkaConsumer类说明
- KafkaProducer类说明
- KafkaConfig类说明
- MD5Encoder类说明
- Md5Utils类说明
- QueueConfig类说明
- RabbitMqConfig类说明
- RabbitMqProducer类说明
- RedisClient类说明
- RomaWebConfig类说明
- RSAUtils类说明
- SapRfcClient类说明
- SapRfcConfig类说明
- SoapClient类说明
- SoapConfig类说明
- StringUtils类说明
- TextUtils类说明
- XmlUtils类说明
- 自定义后端开发(数据后端)
- 后端服务签名校验开发
- 消息集成开发指导
- 设备集成开发指导
-
API参考
- 使用前必读
- API概览
- 如何调用API
- 公共资源API
- 数据集成API
- 服务集成API
- 消息集成API
- 设备集成API
- 应用示例
- 权限和授权项
- 附录
- 历史API
- 修订记录
- SDK参考
-
常见问题
- 实例管理
-
数据集成
-
数据集成普通任务
- FDI各类数据库支持哪些数据类型?
- 跟踪号是什么,能跟踪到数据吗?
- FDI任务是否支持清空目标表?
- FDI任务只能采集单张表到单张表吗?
- 用户创建的FDI任务,同一账号的其他用户可见吗?
- FDI通过公网对接其他租户的MRS HIVE如何配置?
- 从OBS解析文件到RDS数据库,采集过一次后,后面采集会进行更新吗?
- OBS源端的CSV文件解析到关系型数据库时,列的值不对怎么办?
- MRS Hive目标字段和源端字段数据类型不匹配时,数据是否能集成到目标端?
- MRS Hive、MRS HBase和MongoDB的Mapping映射手动输入时,是否区分大小写?
- MRS Hive是否支持分区?
- 源端API类型数据源自定义周期如何设置?
- SAP是否支持分页读取视图?
- 数据集成组合任务
-
数据集成普通任务
- 服务集成
- 消息集成
- 设备集成
-
故障排除
-
数据集成任务
- MRS Hive目标端写入时出现数据乱码
- MRS Hive写入时数据全部写在第一个字段里
- 目标端任务报任务运行超时
- MySQL到MRS Hive时目标端报“could only be written to 0 of the 1 minReplication nodes. There are 2 datanode(s) running and 2 node(s) are excluded in this operation”错误
- Mysql到Mysql时源端报“Illegal mix of collations for operation 'UNION'”错误
- 源端Mysql增量采集每小时执行一次时部分数据丢失
- API到MySQL时源端报“401 unauthorized”错误
- Kafka集到Mysql目标端报“cannot find record mapping field”错误
- API到MySQL的定时任务时会出现源端报“connect timeout”错误
- Kafka到Mysql的实时任务时,MQS中的Topic下有数据,但是FDI任务没有采集到数据。
- Mysql到Mysql的定时任务,源端有类型为tinyint(1),值为2的字段,但是采集到目标端值就变成了1
- 目标端数据源为公网Kafka时,定时任务目标端报“The task executes failed.Writer data to kafka failed”错误
- 数据集成组合任务
- 数据源
- 服务集成
- 设备集成
-
数据集成任务
- 视频帮助
- 文档下载
- 通用参考
链接复制成功!
配置编排任务流程
概述
编排任务,通过可视化UI界面来创建任务,以降低不同经验背景用户的开发门槛。编排任务主要支持以下功能:
- 通过一个处理器节点实现一个数据源到N个目标端的采集,能够完成1:N场景的数据采集。
- 任务配置采用拖拽节点的方式实现参数配置,简化流程。
- 编排模式的数据转换模式分为映射模式和脚本模式。JavaScript脚本能够实现从源端读取数据后先进行处理再写入目标端。
前提条件
操作步骤
- 登录ROMA Connect控制台,在“实例”页面单击实例上的“查看控制台”,进入实例控制台。
- 在左侧的导航栏选择“数据集成 FDI > 任务管理”,单击页面的“创建编排任务”,进入编排任务编辑页面。
- 添加源端节点。
- 添加目标端节点。
- 在左侧的“基础组件”中拖拽“集成应用”至编排区域。
- 参考步骤3添加目标端数据源集成应用。
- 添加处理器节点。
- 在左侧的“处理器”中拖拽“任务调度器”至编排区域,“任务调度器”适用于数据源之间数据调度,主要用于设置任务的集成模式、执行周期等,具体参数说明见下表。
表2 任务调度器参数配置 参数
参数说明
集成模式
选择数据集成的模式。
- 定时:指数据集成任务根据任务计划,在指定的时间执行任务,将源端数据集成到目标端。
- 实时:指数据集成任务不断检测源端数据的变更,并实时将新增的数据集成到目标端。
不同数据源所支持的数据集成模式有所不同,具体请参考表1。
是否解析
选择是否透传数据。透传,即透明传输(pass-through),指的是将传输的内容由源端传输到目标端,不对数据内容做任何改变。
- 是:不会透传数据。
- 否:则会透传数据。
使用QuartZ Cron表达式
选择是否使用QuartZ Cron表达式方式配置。
- 使用QuartZ Cron表达式说明参见使用QuartZ Cron表达式。
- 不使用QuartZ Cron表达式说明参见不使用QuartZ Cron表达式。
开始执行时间
任务的开始执行时间。
描述
填写对该任务调度器的描述内容。
- 配置“任务调度器”,任务调度器支持选择是否使用QuartZ Cron表达式方式配置,具体配置如下。
- 使用QuartZ Cron表达式
QuartZ Cron表达式支持配置灵活多样的任务计划,例如每天凌晨1点到凌晨4点之间,每隔15分钟执行一次任务。这种计划,简单界面配置无法实现,必须通过QuartZ Cron表达式实现。
0 0/15 1-4 * * ?
图1 QuartZ Cron表达式配置表3 QuartZ Cron表达式配置 参数
配置说明
使用QuartZ Cron表达式
选择“使用”。
QuartZ Cron表达式
任务计划对应的QuartZ Cron表达式,ROMA Connect当前仅支持分钟级的计划,故表达式中的“秒”固定为“0”。关于QuartZ Cron表达式的使用详解,请参考附录:QuartZ Cron表达式配置说明。
例如每天凌晨1点到凌晨4点之间,每隔15分钟执行一次任务,该计划对应的QuartZ Cron表达式为:
0 0/15 1-4 * * ?
- 不使用QuartZ Cron表达式
图2 简单界面配置
表4 简单界面配置 参数
配置说明
使用QuartZ Cron表达式
选择“不使用”。
单位
任务执行周期的单位,与“调度周期”配合使用,可设置为“分”、“时”、“日”、“周”或“月”。
调度周期
任务执行周期,根据“单位”选择的不同,可设置值的范围不同。
例如“单位”选择“日”,“调度周期”设置为“1”,则表示数据集成任务每天执行一次。需确保调度周期大于任务执行时间,否则将导致任务执行失败。
- 使用QuartZ Cron表达式
- 配置完成后单击“确定”。
- 在左侧的“处理器”中拖拽“任务调度器”至编排区域,“任务调度器”适用于数据源之间数据调度,主要用于设置任务的集成模式、执行周期等,具体参数说明见下表。
- 编排任务连接及配置。
- 单击页面右上方的“保存”,保存编排任务。
父主题: 创建数据集成任务(编排任务)