更新时间:2024-08-16 GMT+08:00
多CPU内核下的MapReduce调优配置
操作场景
当CPU内核数很多时,如CPU内核为磁盘数的3倍时的调优配置。
操作步骤
以下参数有如下两个配置入口:
- 服务器端配置
进入Yarn服务参数“全部配置”界面,在搜索框中输入参数名称。具体操作请参考修改集群服务配置参数章节。
- 客户端配置
配置 |
参数 |
配置描述 |
---|---|---|
节点容器槽位数 |
yarn.nodemanager.resource.memory-mb |
|
mapreduce.map.memory.mb
|
||
mapreduce.reduce.memory.mb
|
||
Map输出与压缩 |
mapreduce.map.output.compress
|
|
mapreduce.map.output.compress.codec
|
||
Spills |
mapreduce.map.sort.spill.percent
|
磁盘IO是主要瓶颈,合理配置“mapreduce.task.io.sort.mb”可以使溢出至磁盘的内容最小化。 |
数据包大小 |
dfs.client-write-packet-size
|
|
父主题: MapReduce性能调优