更新时间:2024-07-16 GMT+08:00
分享

RES10-04 健康检查与自动隔离

对应用组件进行健康检查,当发现故障后进行主动隔离,避免故障扩散。

  • 风险等级

  • 关键策略
    • 对系统内组件需要定期进行健康检查,以判断其状态是否正常。
    • 对于异常组件,需要能支持自动隔离,避免对整体业务造成影响。
  • 相关云服务和工具
    • 弹性负载均衡器 ELB:支持健康检查,会定期向后端服务器发送请求以测试其运行状态,并根据健康检查来判断后端服务器是否可用,当判断为异常后就不会将流量分发给该异常后端服务器。
    • 云容器引擎 CCE:支持容器健康检查,容器运行过程中,可根据用户需要,定时检查容器健康状况。若不配置健康检查,如果容器内应用程序异常,Pod将无法感知,也不会自动重启去恢复。最终导致虽然Pod状态显示正常,但Pod中的应用程序异常的情况。

相关文档