更新时间:2024-09-18 GMT+08:00
Yarn汇聚日志过大导致节点磁盘被占满
用户问题
集群的磁盘使用率很高。
问题现象
原因分析
客户提交任务的操作过于频繁,且聚合后的日志文件被删除的时间配置为1296000,即聚合日志保留15天,导致汇聚的日志无法在短时间内释放,从而引起磁盘被占满。
处理步骤
- 登录Manager页面,进入Mapreduce服务配置参数页面。
- MRS Manager界面操作:登录MRS Manager,选择“服务管理 > Mapreduce > 服务配置 > 全部配置”。
- FusionInsight Manager界面操作:登录FusionInsight Manager,选择“集群 > 服务 > Mapreduce > 配置 > 全部配置”。
- 搜索“yarn.log-aggregation.retain-seconds”参数,并根据实际情况将yarn.log-aggregation.retain-seconds调小,例如调整为: 259200,即聚合日志保留3天,到期后自动释放磁盘空间。
- 保存配置,如果有弹出窗口,不勾选“重新启动受影响的服务或实例”。
- 在业务空闲时重启配置过期的服务,重启服务会导致上层服务业务中断,影响集群的管理维护和业务,建议在空闲时执行。
- 登录Manager页面。
- 重启Mapreduce、Yarn服务。
父主题: 使用Yarn