更新时间:2022-02-22 GMT+08:00

优化HDFS DataNode RPC的服务质量

配置场景

当客户端写入HDFS的速度大于DataNode的硬盘带宽时,硬盘带宽会被占满,导致DataNode失去响应。客户端只能通过取消或恢复通道进行规避,这会导致写入失败及不必要的通道恢复操作。

本章节适用于MRS 3.x及后续版本。

配置步骤

引入了新的配置参数“dfs.pipeline.ecn”。当该配置启用时,DataNode会在写入通道超出负荷时从其中发出信号。客户端可以基于该阻塞信号进行退避,从而防止系统超出负荷。引入该配置参数的目的是为了使通道更加稳定,并减少不必要的取消或恢复操作。收到信号后,客户端会退避一定的时间(5000ms),然后根据相关过滤器调整退避时间(单次退避最长时间为50000ms)。

请参考修改集群服务配置参数,进入HDFS的“全部配置”页面,在搜索框中输入参数名称。

表1 DN ECN配置

参数

描述

缺省值

dfs.pipeline.ecn

进行该配置后,DataNode能够向客户端发送阻塞通知。

false