更新时间:2025-12-10 GMT+08:00
分享

使用HDFS工具检查磁盘故障

操作场景

当系统出现“ALM-14039 集群内存在慢DataNode”或“ALM-14040 HDFS中DataNode每秒出现慢SyncWriterOsCache的次数超过阈值”告警时,可使用该操作分析是否出现磁盘故障导致该类问题。

该功能适用于MRS 3.6.0及之后版本。

操作步骤

  1. 使用omm用户登录安装了HDFS服务相关实例的节点。
  1. 执行以下命令,进入工具目录。

    cd ${BIGDATA_HOME}/FusionInsight_HD_xxx/install/FusionInsight-Hadoop-3.3.1/adapter/tools/

  1. 执行以下命令进行磁盘同步能力检测。

    ./disk_sync_check -f /tmp/xxx -c 100

    表1 disk_sync_check参数列表

    参数名

    说明

    -f --file <arg>

    用于磁盘检测的文件。非必选,当该参数为空时,命令会自动生成100M文件用于测试。

    -c --count <arg>

    执行测试函数的次数。非必选,默认值:1。

    -d --debug

    输出debug日志。

    -h --help

    输出命令使用帮助。

相关文档