使用HDFS工具检查磁盘故障
操作场景
当系统出现“ALM-14039 集群内存在慢DataNode”或“ALM-14040 HDFS中DataNode每秒出现慢SyncWriterOsCache的次数超过阈值”告警时,可使用该操作分析是否出现磁盘故障导致该类问题。
该功能适用于MRS 3.6.0及之后版本。
操作步骤
- 使用omm用户登录安装了HDFS服务相关实例的节点。
- 执行以下命令,进入工具目录。
cd ${BIGDATA_HOME}/FusionInsight_HD_xxx/install/FusionInsight-Hadoop-3.3.1/adapter/tools/
- 执行以下命令进行磁盘同步能力检测。
./disk_sync_check -f /tmp/xxx -c 100
表1 disk_sync_check参数列表 参数名
说明
-f --file <arg>
用于磁盘检测的文件。非必选,当该参数为空时,命令会自动生成100M文件用于测试。
-c --count <arg>
执行测试函数的次数。非必选,默认值:1。
-d --debug
输出debug日志。
-h --help
输出命令使用帮助。