更新时间:2024-07-16 GMT+08:00
RES10-04 健康检查与自动隔离
对应用组件进行健康检查,当发现故障后进行主动隔离,避免故障扩散。
- 风险等级
高
- 关键策略
- 对系统内组件需要定期进行健康检查,以判断其状态是否正常。
- 对于异常组件,需要能支持自动隔离,避免对整体业务造成影响。
- 相关云服务和工具
- 弹性负载均衡器 ELB:支持健康检查,会定期向后端服务器发送请求以测试其运行状态,并根据健康检查来判断后端服务器是否可用,当判断为异常后就不会将流量分发给该异常后端服务器。
- 云容器引擎 CCE:支持容器健康检查,容器运行过程中,可根据用户需要,定时检查容器健康状况。若不配置健康检查,如果容器内应用程序异常,Pod将无法感知,也不会自动重启去恢复。最终导致虽然Pod状态显示正常,但Pod中的应用程序异常的情况。
父主题: RES10 故障隔离