文档首页/ MapReduce服务 MRS/ 故障排除/ 使用Yarn/ Yarn汇聚日志过大导致节点磁盘被占满
更新时间:2024-09-18 GMT+08:00

Yarn汇聚日志过大导致节点磁盘被占满

用户问题

集群的磁盘使用率很高。

问题现象

  • Manager管理页面下主机管理显示磁盘使用率过高。
  • Yarn WebUI界面上显示只有少量任务在运行。

  • 登录到集群的Master节点执行hdfs dfs -du -h / 命令发现如下文件占用大量磁盘空间。

  • Mapreduce服务的汇聚日志配置参数如下:

原因分析

客户提交任务的操作过于频繁,且聚合后的日志文件被删除的时间配置为1296000,即聚合日志保留15天,导致汇聚的日志无法在短时间内释放,从而引起磁盘被占满。

处理步骤

  1. 登录Manager页面,进入Mapreduce服务配置参数页面。

    • MRS Manager界面操作:登录MRS Manager,选择“服务管理 > Mapreduce > 服务配置 > 全部配置”。
    • FusionInsight Manager界面操作:登录FusionInsight Manager,选择“集群 > 服务 > Mapreduce > 配置 > 全部配置”。

  2. 搜索“yarn.log-aggregation.retain-seconds”参数,并根据实际情况将yarn.log-aggregation.retain-seconds调小,例如调整为: 259200,即聚合日志保留3天,到期后自动释放磁盘空间。
  3. 保存配置,如果有弹出窗口,不勾选“重新启动受影响的服务或实例”。
  4. 在业务空闲时重启配置过期的服务,重启服务会导致上层服务业务中断,影响集群的管理维护和业务,建议在空闲时执行。

    1. 登录Manager页面。
    2. 重启Mapreduce、Yarn服务。