更新时间:2024-08-05 GMT+08:00
CDM作业配置管理
CDM作业管理界面的“配置管理”页签,主要操作如下:
最大抽取并发数
最大抽取并发数即集群最大抽取并发数。
此处的“最大抽取并发数”参数与集群配置处的“最大抽取并发数”参数同步,在任意一处修改即可生效。
CDM通过数据迁移作业,将源端数据迁移到目的端数据源中。其中,主要运行逻辑如下:
- 数据迁移作业提交运行后,CDM会根据作业配置中的“抽取并发数”参数,将每个作业拆分为多个Task,即作业分片。
不同源端数据源的作业分片维度有所不同,因此某些作业可能出现未严格按作业“抽取并发数”参数分片的情况。
- CDM依次将Task提交给运行池运行。根据集群配置管理中的“最大抽取并发数”参数,超出规格的Task排队等待运行。
因此作业抽取并发数和集群最大抽取并发数参数设置为适当的值可以有效提升迁移速度,您可参考下文有效配置抽取并发数。
- 集群最大抽取并发数的上限建议为vCPU核数*2,如表1所示。
- 作业抽取并发数的配置原则如下:
- 迁移的目的端为文件时,CDM不支持多并发,此时应配置为单进程抽取数据。
- 表中每行数据大小为1MB以下的可以设置多并发抽取,超过1MB的建议单线程抽取数据。
- 作业抽取并发数可参考集群最大抽取并发数配置,但不建议超过集群最大抽取并发数上限。
- 目的端为DLI数据源时,抽取并发数建议配置为1,否则可能会导致写入失败。
定时备份/恢复
该功能依赖于OBS服务。当前定时备份内容不会自动老化删除,您需要定期手动清理备份文件。
- 前提条件
已创建OBS连接,详情请参见OBS连接参数说明。
- 定时备份
在CDM作业管理界面,单击“配置管理”页签,配置定时备份的参数。
表2 定时备份参数 参数
说明
配置样例
定时备份
自动备份功能的开关,该功能只备份作业,不会备份连接。
开
备份策略
- 所有作业:不管作业处于什么状态,CDM会备份所有表/文件迁移作业、整库迁移的作业。不备份历史作业。
- 分组作业:选择备份某一个或多个分组下的作业。
所有作业
备份周期
选择备份周期:
- 日:每天零点执行一次。
- 周:每周一零点执行一次。
- 月:每月1号零点执行一次。
日
备份写入OBS连接
CDM通过该连接,将作业备份到OBS,需要用户提前在“连接管理”界面创建好OBS连接。
obslink
OBS桶
存储备份文件的OBS桶。
cdm
备份数据目录
存储备份文件的目录。
/cdm-bk/
- 恢复作业
如果之前执行过自动备份,“配置管理”页签下会显示备份列表:显示备份文件所在的OBS桶、路径、备份时间。
您可以单击备份列表操作列的“恢复备份”来恢复CDM作业。
父主题: 在CDM集群中创建作业