查看在线服务的事件
服务的(从用户可看见部署服务任务开始)整个生命周期中,每一个关键事件点在系统后台均有记录,用户可随时在对应服务的详情页面进行查看。
方便用户更清楚的了解服务部署和运行过程,遇到任务异常时,更加准确的排查定位问题。可查看的事件点包括:
事件类型 |
事件信息(“XXX”表示占位符,以实际返回信息为准) |
解决方案 |
---|---|---|
正常 |
开始部署服务。 Start to deploy service. |
- |
异常 |
资源不足,等待资源释放。 Lack of resources, transform state to waiting. |
等待资源释放后重试。 |
异常 |
xxx资源不足,服务调度失败。补充信息:xxx %s %s Schedule failed due to insufficient resources. Retry later. %s nodes are available: %s Insufficient memory. |
根据补充信息,了解资源不足详情,参考FAQ处理。 |
正常 |
开始构建镜像。 Start to build image. |
- |
异常 |
构建模型(xxx) 镜像失败,构建日志:\nxxx。 Failed to build image for model (%s %s), docker build log:\n%s. |
根据构建日志定位和处理问题。 |
异常 |
构建镜像失败。 Failed to build image. |
请联系技术支持。 |
正常 |
构建镜像完成。 Image built successfully. |
- |
异常 |
xxx服务失败。错误信息:xxx Failed to %s service, retry later. Error message: %s |
请根据错误信息定位和处理问题。 |
异常 |
更新服务失败,执行回滚操作。 Failed to update service, rollback it. |
请联系技术支持。 |
正常 |
服务更新中。 Updating service. |
- |
正常 |
服务启动中。 Starting service. |
- |
正常 |
服务停止中。 Stopping service. |
- |
正常 |
服务已停止。 Service stopped. |
- |
正常 |
自动停止开关已关闭。 Auto-stop switched off. |
- |
正常 |
自动关闭功能开启,服务将在xs后停止。 Auto-stop switched on, service will be stopped in %d %s. |
- |
正常 |
到达自动停止时间,服务停止。 Service stopped automatically because due time is reached. |
- |
异常 |
配额超限,服务停止。 Service stopped automatically because over quota. |
请联系技术支持。 |
异常 |
自动停止服务失败,错误信息: xxx Failed to stop service automatically, error message: %s |
请根据错误信息定位和处理问题。 |
异常 |
启动边缘服务失败。 Failed to start service. |
启动服务失败情况较多,请参考FAQ定位和处理。 |
异常 |
停止边缘服务失败。 Failed to stop service. |
请联系技术支持。 |
正常 |
消费[%d]边缘模型配额。 Consume [%d] edge model quotas. |
请联系技术支持。 |
正常 |
返回[%d]边缘模型配额。 Return [%d] edge model quotas. |
- |
异常 |
在边缘池(xxx)部署/更新服务失败,错误信息:xxx Failed to deploy/update model in node(%s), %s |
请根据错误信息定位和处理问题。 |
正常 |
删除资源池(xxx)上服务实例。 Model in node(%s) deleted. |
- |
正常 |
停止资源池(xxx)上服务实例。 Model in node(%s) stopped. |
- |
异常 |
边缘服务状态异常,异常信息:边缘池或边缘节点(xxx)异常 Update service status to abnormal, the edge node/group(%s) may be abnormal. |
请检查边缘池或边缘节点是否正常。 |
异常 |
边缘服务状态异常,异常信息:实例不存在 Update service status to abnormal, deployment is not exist. |
请修改实例后重试。 |
正常 |
实例在当前边缘节点状态为xxx,相关信息:xxx Instance is %s in node(%s), %s |
- |
正常 |
当前边缘服务状态为xxx Service status is %s. |
- |
异常 |
批量服务失败,请稍后重试。错误信息:xxx Failed to %s batch service, retry later. Error message: %s. |
请根据错误信息定位和处理问题。 |
正常 |
服务运行完成。 Service stopped automatically after running. |
- |
异常 |
停止服务失败,错误信息:xxx Failed to stopped service, error message: %s |
请根据错误信息定位和处理问题。 |
正常 |
订阅许可即将超期:xxx Impending expiration notice: %s |
- |
正常 |
服务xxx启动成功。 Service %s started successfully. |
- |
异常 |
启动服务xxx失败。 Service %s started failed. |
启动服务失败情况较多,请参考FAQ定位和处理。 |
异常 |
部署服务超时,错误信息:xxx Deploying timeout, details: %s |
请根据错误信息定位和处理问题。 |
异常 |
启动服务失败,错误信息xxx Service %s started failed, error message: %s |
请根据错误信息定位和处理问题。 |
正常 |
删除应用实例 xxx 成功。 Delete service instance %s success |
- |
异常 |
删除应用实例 xxx 失败,错误信息 xxx Failed to delete service instance %s, error message: %s |
请根据错误信息定位和处理问题。 |
正常 |
更新服务失败,执行回滚操作成功。 Failed to update service, rollback succeeded. |
- |
异常 |
更新服务失败,执行回滚操作失败。 Failed to update service, rollback failed. |
请联系技术支持。 |
正常 |
[model 0.0.1] OBS桶,OBS并行文件系统,SFS Turbo挂载成功。 [%s] %s volume successfully. |
- |
服务部署和运行过程中,关键事件支持手动/自动刷新。
查看操作
- 在ModelArts管理控制台的左侧导航栏中选择“模型部署 > 在线服务”,在服务列表中,您可以单击名称/ID,进入服务详情页面。
- 在服务详情页面,切换到“事件”页签,查看事件信息。