更新时间:2025-06-19 GMT+08:00
分享

健康检查

功能介绍

健康检查接口主要用于探测EMS存储服务状态是否工作正常,可以用于服务熔断后恢复场景。

方法定义

Ems.check_health()

请求参数说明

返回结果说明

表1 返回结果

类型

说明

bool

参数解释:

EMS存储服务是否正常。

取值范围:

False:表示EMS服务异常。

True:表示EMS服务正常。

代码样例

当调用SDK接口访问EMS服务时返回失败,业务可能会熔断EMS服务,可以使用定时检查EMS服务状态来实现自动恢复。

from ems import Ems, EmsConfig, EmsException, CcConfig
# 初始化cc配置
cc_config = CcConfig(rank_id=8, device_id=0, model_id="llama2-13b")
# 初始化Ems
config = EmsConfig(cc_config=cc_config)
try:
    Ems.init(config)
except EmsException as e:
    print(f"exception: {e}.")
    exit(1)
status = Ems.check_health()
if status is not True:
    print(f"ems is not ok.")
else:
    print(f"ems is ok")

相关文档