分布式消息服务 Kafka分布式消息服务 Kafka

更新时间:2021/06/16 GMT+08:00
分享

测试步骤

测试以下四种场景下,客户端消息生产速率和服务端CPU消耗。

  • 测试场景一(批处理大小):相同的Kafka专享版实例和Topic,不同的batch.size
  • 测试场景二(是否跨AZ生产):相同的Kafka专享版实例和Topic,生产客户端和服务端在不同的AZ中
  • 测试场景三(副本数):相同的Kafka专享版实例,不同的Topic副本数
  • 测试场景四(同步/异步复制):相同的Kafka专享版实例,不同复制机制的Topic
表1 测试参数

分区数

副本数

是否同步复制

batch.size

是否跨AZ生产

3

1

1KB

3

1

16KB

3

1

1KB

3

3

1KB

3

3

1KB

测试脚本如下:

./kafka-producer-perf-test.sh --producer-props bootstrap.servers=${连接地址} acks=1 batch.size=${batch.size} linger.ms=0 --topic ${Topic名称} --num-records ${num-records} --record-size 1024 --throughput -102400
  • bootstrap.servers:购买Kafka专享版实例中获取的Kafka专享版实例的地址。
  • acks:消息主从同步策略,acks=1表示异步复制消息,acks=-1表示同步复制消息。
  • batch.size:每次批量发送消息的大小(单位为字节)。
  • linger.ms:两次发送时间间隔。
  • topic:创建Topic中设置的Topic名称。
  • num-records:总共需要发送的消息数。
  • record-size:每条消息的大小。
  • throughput:每秒发送的消息数。

测试场景一:批处理大小

  1. 登录客户端服务器,进入“kafka_2.11-2.3.0/bin”目录下,执行以下脚本。

    batch.size=1KB,执行脚本如下:
    ./kafka-producer-perf-test.sh --producer-props bootstrap.servers=192.168.0.69:9092,192.168.0.42:9092,192.168.0.66:9092 acks=1 batch.size=1024 linger.ms=0 --topic Topic-01 --num-records 8000000 --record-size 1024 --throughput 102400

    执行结果如下:

    8000000 records sent, 34128.673632 records/sec (33.33 MB/sec), 879.91 ms avg latency, 4102.00 ms max latency, 697 ms 50th, 2524 ms 95th, 2888 ms 99th, 4012 ms 99.9th.

    客户端消息生产速率=34128

    batch.size=16KB,执行脚本如下:

    ./kafka-producer-perf-test.sh --producer-props bootstrap.servers=192.168.0.69:9092,192.168.0.42:9092,192.168.0.66:9092 acks=1 batch.size=16384 linger.ms=0 --topic Topic-01 --num-records 100000000 --record-size 1024 --throughput 10240

    执行结果如下:

    100000000 records sent, 102399.318430 records/sec (100.00 MB/sec), 4.72 ms avg latency, 914.00 ms max latency, 1 ms 50th, 5 ms 95th, 162 ms 99th, 398 ms 99.9th.

    客户端消息生产速率=102399

  2. 登录Kafka专享版实例控制台,在测试实例所在行,选择“查看监控数据”,跳转到云监控界面。
  3. 在“节点”页签,查看服务端leader节点的CPU使用率。

    图1 broker-0的CPU使用率(batch.size=1KB)

    CPU消耗=58.10%

    图2 broker-0的CPU使用率(batch.size=16KB)

    CPU消耗=24.10%

    图3 broker-1的CPU使用率(batch.size=1KB)

    CPU消耗=56.70%

    图4 broker-1的CPU使用率(batch.size=16KB)

    CPU消耗=25%

    图5 broker-2的CPU使用率(batch.size=1KB)

    CPU消耗=53.30%

    图6 broker-2的CPU使用率(batch.size=16KB)

    CPU消耗=23.30%

测试场景二:是否跨AZ生产

  1. 登录客户端服务器,进入“kafka_2.11-2.3.0/bin”目录下,执行以下脚本。

    客户端服务器和实例在相同的AZ中,执行脚本如下:

    ./kafka-producer-perf-test.sh --producer-props bootstrap.servers=192.168.0.69:9092,192.168.0.42:9092,192.168.0.66:9092 acks=1 batch.size=1024 linger.ms=0 --topic Topic-01 --num-records 8000000 --record-size 1024 --throughput 102400

    执行结果如下:

    8000000 records sent, 34128.673632 records/sec (33.33 MB/sec), 879.91 ms avg latency, 4102.00 ms max latency, 697 ms 50th, 2524 ms 95th, 2888 ms 99th, 4012 ms 99.9th.

    客户端消息生产速率=34128

    客户端服务器和实例在不同的AZ中,执行脚本如下:

    ./kafka-producer-perf-test.sh --producer-props bootstrap.servers=192.168.0.69:9092,192.168.0.42:9092,192.168.0.66:9092 acks=1 batch.size=1024 linger.ms=0 --topic Topic-01 --num-records 4000000 --record-size 1024 --throughput 102400

    执行结果如下:

    4000000 records sent, 8523.042044 records/sec (8.32 MB/sec), 3506.20 ms avg latency, 11883.00 ms max latency, 1817 ms 50th, 10621 ms 95th, 11177 ms 99th, 11860 ms 99.9th.

    客户端消息生产速率=8523

  2. 登录Kafka专享版实例控制台,在测试实例所在行,选择“更多 > 查看监控数据”,跳转到云监控界面。
  3. 在“节点”页签,查看服务端leader节点的CPU使用率。

    图7 broker-0的CPU使用率(客户端服务器和实例在相同的AZ中)

    CPU消耗=58.10%

    图8 broker-0的CPU使用率(客户端服务器和实例在不同的AZ中)

    CPU消耗=17.20%

    图9 broker-1的CPU使用率(客户端服务器和实例在相同的AZ中)

    CPU消耗=56.70%

    图10 broker-1的CPU使用率(客户端服务器和实例在不同的AZ中)

    CPU消耗=16.70%

    图11 broker-2的CPU使用率(客户端服务器和实例在相同的AZ中)

    CPU消耗=53.30%

    图12 broker-2的CPU使用率(客户端服务器和实例在不同的AZ中)

    CPU消耗=18.80%

测试场景三:副本数

  1. 登录客户端服务器,进入“kafka_2.11-2.3.0/bin”目录下,执行以下脚本。

    1副本,执行脚本如下:

    ./kafka-producer-perf-test.sh --producer-props bootstrap.servers=192.168.0.69:9092,192.168.0.42:9092,192.168.0.66:9092 acks=1 batch.size=1024 linger.ms=0 --topic Topic-01 --num-records 8000000 --record-size 1024 --throughput 102400

    执行结果如下:

    8000000 records sent, 34128.673632 records/sec (33.33 MB/sec), 879.91 ms avg latency, 4102.00 ms max latency, 697 ms 50th, 2524 ms 95th, 2888 ms 99th, 4012 ms 99.9th.

    客户端消息生产速率=34128

    3副本,执行脚本如下:

    ./kafka-producer-perf-test.sh --producer-props bootstrap.servers=192.168.0.69:9092,192.168.0.42:9092,192.168.0.66:9092 acks=1 batch.size=1024 linger.ms=0 --topic Topic-02 --num-records 4000000 --record-size 1024 --throughput 102400

    执行结果如下:

    4000000 records sent, 14468.325219 records/sec (14.13 MB/sec), 2069.99 ms avg latency, 7911.00 ms max latency, 846 ms 50th, 6190 ms 95th, 6935 ms 99th, 7879 ms 99.9th.

    客户端消息生产速率=14468

  2. 登录Kafka专享版实例控制台,在测试实例所在行,选择“更多 > 查看监控数据”,跳转到云监控界面。
  3. 在“节点”页签,查看服务端leader节点的CPU使用率。

    图13 broker-0的CPU使用率(1副本)

    CPU消耗=58.10%

    图14 broker-0的CPU使用率(3副本)

    CPU消耗=86.70%

    图15 broker-1的CPU使用率(1副本)

    CPU消耗=56.70%

    图16 broker-1的CPU使用率(3副本)

    CPU消耗=80.60%

    图17 broker-2的CPU使用率(1副本)

    CPU消耗=53.30%

    图18 broker-2的CPU使用率(3副本)

    CPU消耗=86.20%

测试场景四:同步/异步复制

  1. 登录客户端服务器,进入“kafka_2.11-2.3.0/bin”目录下,执行以下脚本。

    异步复制,执行脚本如下:

    ./kafka-producer-perf-test.sh --producer-props bootstrap.servers=192.168.0.69:9092,192.168.0.42:9092,192.168.0.66:9092 acks=1 batch.size=1024 linger.ms=0 --topic Topic-02 --num-records 4000000 --record-size 1024 --throughput 102400

    执行结果如下:

    4000000 records sent, 14468.325219 records/sec (14.13 MB/sec), 2069.99 ms avg latency, 7911.00 ms max latency, 846 ms 50th, 6190 ms 95th, 6935 ms 99th, 7879 ms 99.9th.

    客户端消息生产速率=14468

    同步复制,执行脚本如下:

    ./kafka-producer-perf-test.sh --producer-props bootstrap.servers=192.168.0.69:9092,192.168.0.42:9092,192.168.0.66:9092 acks=-1 batch.size=1024 linger.ms=0 --topic Topic-03 --num-records 1000000 --record-size 1024 --throughput 102400

    执行结果如下:

    1000000 records sent, 3981.937930 records/sec (3.89 MB/sec), 7356.98 ms avg latency, 19013.00 ms max latency, 6423 ms 50th, 14381 ms 95th, 18460 ms 99th, 18975 ms 99.9th.

    客户端消息生产速率=3981

  2. 登录Kafka专享版实例控制台,在测试实例所在行,选择“更多 > 查看监控数据”,跳转到云监控界面。
  3. 在“节点”页面,查看服务端leader节点的CPU使用率。

    图19 broker-0的CPU使用率(异步复制)

    CPU消耗=86.70%

    图20 broker-0的CPU使用率(同步复制)

    CPU消耗=60%

    图21 broker-1的CPU使用率(异步复制)

    CPU消耗=80.60%

    图22 broker-1的CPU使用率(同步复制)

    CPU消耗=55.20%

    图23 broker-2的CPU使用率(异步复制)

    CPU消耗=86.20%

    图24 broker-2的CPU使用率(同步复制)

    CPU消耗=50%

分享:

    相关文档

    相关产品