更新时间:2024-08-16 GMT+08:00
分享

查看批量服务的事件

服务的(从用户可看见部署服务任务开始)整个生命周期中,每一个关键事件点在系统后台均有记录,用户可随时在对应服务的详情页面进行查看。

方便用户更清楚的了解服务部署和运行过程,遇到任务异常时,更加准确的排查定位问题。可查看的事件点包括:

表1 事件

事件类型

事件信息(“XXX”表示占位符,以实际返回信息为准)

解决方案

正常

开始部署服务。

Start to deploy service.

-

异常

资源不足,等待资源释放。

Lack of resources, transform state to waiting.

等待资源释放后重试。

异常

xxx资源不足,服务调度失败。补充信息:xxx

%s %s Schedule failed due to insufficient resources. Retry later. %s nodes are available: %s Insufficient memory.

根据补充信息,了解资源不足详情,参考FAQ处理。

正常

开始构建镜像。

Start to build image.

-

异常

构建模型(xxx) 镜像失败,构建日志:\nxxx。

Failed to build image for model (%s %s), docker build log:\n%s.

根据构建日志定位和处理问题。

异常

构建镜像失败。

Failed to build image.

请联系技术支持。

正常

构建镜像完成。

Image built successfully.

-

异常

xxx服务失败。错误信息:xxx

Failed to %s service, retry later. Error message: %s

请根据错误信息定位和处理问题。

异常

更新服务失败,执行回滚操作。

Failed to update service, rollback it.

请联系技术支持。

正常

服务更新中。

Updating service.

-

正常

服务启动中。

Starting service.

-

正常

服务停止中。

Stopping service.

-

正常

服务已停止。

Service stopped.

-

正常

自动停止开关已关闭。

Auto-stop switched off.

-

正常

自动关闭功能开启,服务将在xs后停止。

Auto-stop switched on, service will be stopped in %d %s.

-

正常

到达自动停止时间,服务停止。

Service stopped automatically because due time is reached.

-

异常

配额超限,服务停止。

Service stopped automatically because over quota.

请联系技术支持。

异常

自动停止服务失败,错误信息: xxx

Failed to stop service automatically, error message: %s

请根据错误信息定位和处理问题。

异常

启动边缘服务失败。

Failed to start service.

启动服务失败情况较多,请参考FAQ定位和处理。

异常

停止边缘服务失败。

Failed to stop service.

请联系技术支持。

正常

消费[%d]边缘模型配额。

Consume [%d] edge model quotas.

请联系技术支持。

正常

返回[%d]边缘模型配额。

Return [%d] edge model quotas.

-

异常

在边缘池(xxx)部署/更新服务失败,错误信息:xxx

Failed to deploy/update model in node(%s), %s

请根据错误信息定位和处理问题。

正常

删除资源池(xxx)上服务实例。

Model in node(%s) deleted.

-

正常

停止资源池(xxx)上服务实例。

Model in node(%s) stopped.

-

异常

边缘服务状态异常,异常信息:边缘池或边缘节点(xxx)异常

Update service status to abnormal, the edge node/group(%s) may be abnormal.

请检查边缘池或边缘节点是否正常。

异常

边缘服务状态异常,异常信息:实例不存在

Update service status to abnormal, deployment is not exist.

请修改实例后重试。

正常

实例在当前边缘节点状态为xxx,相关信息:xxx

Instance is %s in node(%s), %s

-

正常

当前边缘服务状态为xxx

Service status is %s.

-

异常

批量服务失败,请稍后重试。错误信息:xxx

Failed to %s batch service, retry later. Error message: %s.

请根据错误信息定位和处理问题。

正常

服务运行完成。

Service stopped automatically after running.

-

异常

停止服务失败,错误信息:xxx

Failed to stopped service, error message: %s

请根据错误信息定位和处理问题。

正常

订阅许可即将超期:xxx

Impending expiration notice: %s

-

正常

服务xxx启动成功。

Service %s started successfully.

-

异常

启动服务xxx失败。

Service %s started failed.

启动服务失败情况较多,请参考FAQ定位和处理。

异常

部署服务超时,错误信息:xxx

Deploying timeout, details: %s

请根据错误信息定位和处理问题。

异常

启动服务失败,错误信息xxx

Service %s started failed, error message: %s

请根据错误信息定位和处理问题。

正常

删除应用实例 xxx 成功。

Delete service instance %s success

-

异常

删除应用实例 xxx 失败,错误信息 xxx

Failed to delete service instance %s, error message: %s

请根据错误信息定位和处理问题。

正常

更新服务失败,执行回滚操作成功。

Failed to update service, rollback succeeded.

-

异常

更新服务失败,执行回滚操作失败。

Failed to update service, rollback failed.

请联系技术支持。

正常

[model 0.0.1] OBS桶,OBS并行文件系统,SFS Turbo挂载成功。

[%s] %s volume successfully.

-

服务部署和运行过程中,关键事件支持手动/自动刷新。

查看操作

  1. 在ModelArts管理控制台的左侧导航栏中选择“模型部署 > 批量服务”,在服务列表中,您可以单击名称/ID,进入服务详情页面。
  2. 在服务详情页面,切换到“事件”页签,查看事件信息。

相关文档