查看在线服务的事件
服务的(从用户可看见部署服务任务开始)整个生命周期中,每一个关键事件点在系统后台均有记录,用户可随时在对应服务的详情页面进行查看。
方便用户更清楚的了解服务部署和运行过程,遇到任务异常时,更加准确的排查定位问题。可查看的事件点包括:
事件类型 |
事件信息(“XXX”表示占位符,以实际返回信息为准) |
解决方案 |
---|---|---|
正常 |
开始部署服务。 Start to deploy service. |
- |
异常 |
资源不足,等待资源释放。 Lack of resources, transform state to waiting. |
等待资源释放后重试。 |
异常 |
xxx资源不足,服务调度失败。补充信息:xxx %s %s Schedule failed due to insufficient resources. Retry later. %s nodes are available: %s Insufficient memory. |
根据补充信息,了解资源不足详情,参考FAQ处理。 |
正常 |
开始构建镜像。 Start to build image. |
- |
异常 |
构建模型(xxx) 镜像失败,构建日志:\nxxx。 Failed to build image for model (%s %s), docker build log:\n%s. |
根据构建日志定位和处理问题。 |
异常 |
构建镜像失败。 Failed to build image. |
请联系技术支持。 |
正常 |
构建镜像完成。 Image built successfully. |
- |
异常 |
xxx服务失败。错误信息:xxx Failed to %s service, retry later. Error message: %s |
请根据错误信息定位和处理问题。 |
异常 |
更新服务失败,执行回滚操作。 Failed to update service, rollback it. |
请联系技术支持。 |
正常 |
服务更新中。 Updating service. |
- |
正常 |
服务启动中。 Starting service. |
- |
正常 |
服务停止中。 Stopping service. |
- |
正常 |
服务已停止。 Service stopped. |
- |
正常 |
自动停止开关已关闭。 Auto-stop switched off. |
- |
正常 |
自动关闭功能开启,服务将在xs后停止。 Auto-stop switched on, service will be stopped in %d %s. |
- |
正常 |
到达自动停止时间,服务停止。 Service stopped automatically because due time is reached. |
- |
异常 |
配额超限,服务停止。 Service stopped automatically because over quota. |
请联系技术支持。 |
异常 |
自动停止服务失败,错误信息: xxx Failed to stop service automatically, error message: %s |
请根据错误信息定位和处理问题。 |
正常 |
删除资源池(xxx)上服务实例。 Model in node(%s) deleted. |
- |
正常 |
停止资源池(xxx)上服务实例。 Model in node(%s) stopped. |
- |
异常 |
批量服务失败,请稍后重试。错误信息:xxx Failed to %s batch service, retry later. Error message: %s. |
请根据错误信息定位和处理问题。 |
正常 |
服务运行完成。 Service stopped automatically after running. |
- |
异常 |
停止服务失败,错误信息:xxx Failed to stopped service, error message: %s |
请根据错误信息定位和处理问题。 |
正常 |
订阅许可即将超期:xxx Impending expiration notice: %s |
- |
正常 |
服务xxx启动成功。 Service %s started successfully. |
- |
异常 |
启动服务xxx失败。 Service %s started failed. |
启动服务失败情况较多,请参考FAQ定位和处理。 |
异常 |
部署服务超时,错误信息:xxx Deploying timeout, details: %s |
请根据错误信息定位和处理问题。 |
正常 |
更新服务失败,执行回滚操作成功。 Failed to update service, rollback succeeded. |
- |
异常 |
更新服务失败,执行回滚操作失败。 Failed to update service, rollback failed. |
请联系技术支持。 |
正常 |
[model 0.0.1] OBS桶,OBS并行文件系统,SFS Turbo挂载成功。 [%s] %s volume successfully. |
- |
服务部署和运行过程中,关键事件支持手动/自动刷新。
查看操作
- 在ModelArts管理控制台的左侧导航栏中选择“模型部署 > 在线服务”,在服务列表中,您可以单击名称/ID,进入服务详情页面。
- 在服务详情页面,切换到“事件”页签,查看事件信息。