ALM-14044 XceiverCount数量超过阈值

告警解释

系统每30秒周期性检测每个DataNode上的XceiverCount数量，当检测到当前的DataNode上XceiverCount超过“dfs.datanode.max.transfer.threads”参数值（表示与DataNode间传输数据的线程的最大数，默认值为8192）的95%时产生该告警。DataNode节点上的XceiverCount小于或等于阈值时，告警恢复。

本章节仅适用于MRS 3.6.0-LTS及之后版本。

告警属性

告警ID	告警级别	是否可自动清除
14044	次要	是

告警参数

类别	参数名称	参数含义
定位信息	来源	产生告警的集群名称。
	服务名	产生告警的服务名称。
	角色名	产生告警的角色名称。
	主机名	产生告警的主机名。
附加信息	触发条件	系统当前指标取值满足自定义的告警设置条件。

对系统的影响

可能造成HDFS写入数据变慢，影响HDFS整体性能。

可能原因

DataNode XceiverCount数量参数配置不合理。
HDFS写入请求量过大。

处理步骤

检查DataNode XceiverCount数量配置是否合理

登录MRS Manager页面，选择“集群 > 服务 > HDFS > 配置 > 全部配置”，搜索“dfs.datanode.max.transfer.threads”参数。
查看该值是否远远小于默认值。
- 是, 执行步骤 3。
- 否，执行步骤 6。
修改参数值为默认值，单击“保存”。
单击“实例”页签，勾选所有DataNode实例，选择“更多 > 重启实例”重启所有DataNode实例。
等待5分钟，查看该告警是否自动消除。
- 是，处理完毕。
- 否，执行步骤 6。