更新时间:2024-05-28 GMT+08:00
使用CDM服务迁移数据至MRS HDFS时任务运行失败
用户问题
使用CDM从旧的集群迁移数据至新集群的HDFS过程失败。
问题现象
使用CDM从源HDFS导入目的端HDFS,发现目的端MRS集群故障,NameNode无法启动。
查看日志发现在启动过程中存在“Java heap space”报错,需要修改NameNode的JVM参数。
图1 故障日志
原因分析
使用CDM迁移数据的过程中,HDFS的数据量过大,导致在合并元数据时发生堆栈异常。
处理步骤
- 进入HDFS服务配置页面:
- MRS 3.x之前版本,单击集群名称,登录集群详情页面,选择“组件管理 > HDFS > 服务配置”,单击“基础配置”下拉菜单,选择“全部配置”。
如果集群详情页面没有“组件管理”页签,请先完成IAM用户同步(在集群详情页的“概览”页签,单击“IAM用户同步”右侧的“同步”进行IAM用户同步)。
- MRS 3.x及后续版本,登录FusionInsight Manager,然后选择“集群 > 待操作的集群名称 > 服务 > HDFS > 配置 > 全部配置”。
- MRS 3.x之前版本,单击集群名称,登录集群详情页面,选择“组件管理 > HDFS > 服务配置”,单击“基础配置”下拉菜单,选择“全部配置”。
- 搜索并修改“HDFS > NameNode” 中的“GC_OPTS”参数,将其中的“-Xms512M -Xmx512M”两个参数的值根据实际情况调整为较大的值。
- 保存配置并重启受影响的服务或实例。
父主题: 集群管理类