更新时间:2024-11-22 GMT+08:00

查看Notebook实例事件

在Notebook的整个生命周期,包括实例的创建、启动、停止、规格变更等关键操作以及实例的运行状态等在后台都有记录,用户可以在Notebook实例详情页中查看具体的事件,通过实例的事件,从而看到实例的运行或者异常等状态详情。在右侧可以手动刷新事件,也可以设置间隔30秒,1分钟,5分钟自动刷新事件。

查看Notebook实例事件的方法

单击Notebook名称,进入Notebook详情页,单击“事件”

Notebook实例事件列表

表1 实例创建过程的事件列表

事件名称

事件描述

事件级别

Scheduled

实例被调度成功

提示

PullingImage

正在拉取镜像

提示

PulledImage

镜像拉取完毕

提示

NotebookHealthy

实例运行中,处于健康状态

重要

CreateNotebookFailed

创建实例失败

紧急

PullImageFailed

镜像拉取失败

紧急

FailedCreate

Failed to create notebook container. Please contact SRE to check node {node_name}

紧急

CreateContainerError

Failed to create container. Please contact SRE to check node {node_name}

紧急

FailedAttachVolume

Failed to attach volume. Please contact SRE to check node {node_name}

重要

MountVolumeFailed

Mount volume failed; Check whether the DEW secret is correct if the instance cannot change to running in five minutes

紧急

Mount volume failed; Check if vpc of sfs-turbo is interconnected if the instance cannot change to running in five minutes

紧急

Mount volume failed; Please contact SRE to check node {node_name} if the instance cannot change to running in five minutes

紧急

表2 实例停止过程的事件列表

事件名称

事件描述

事件级别

StopNotebook

实例停止

重要

StopNotebookResourceIdle

实例因资源空闲即将自动停止或实例因资源空闲自动停止

重要

表3 更新实例过程的事件列表

事件名称

事件描述

事件级别

UpdateName

更新实例名称

提示

UpdateDescription

更新实例描述

提示

UpdateFlavor

更新实例规格

重要

UpdateImage

更新实例镜像

重要

UpdateStorageSize

实例存储正在扩容

(User %s is updating storage size from %sGB to %sGB)

重要

实例扩容完成

(User %s updated storage size successfully)

重要

UpdateKeyPair

配置实例密钥对

(User %s updated the instance keypair to "{%s}")

重要

更新实例密钥对

(User %s updated the instance keypair from %s to %s)

重要

UpdateWhitelist

更新实例访问白名单

重要

UpdateHook

更新自定义脚本

重要

UpdateStorageSizeFailed

资源售罄引起的实例存储扩容失败

(The EVS disk is sold out)

紧急

内部错误引起的实例扩容失败

(The EVS disk size updated failed. Operations and maintenance personnel are handling the problem)

紧急

表4 镜像保存过程中的事件列表

事件名称

事件描述

事件级别

SaveImage

保存镜像成功

重要

SavedImageFailed

D进程引起的保存镜像失败

(There are processes in 'D' status, please check process status using 'ps -aux' and kill all the 'D' status processes)

紧急

镜像大小引起的保存镜像失败

(Container size %dG is greater than threshold %dG)

紧急

层数限制引起的保存镜像失败

(Too many layers in your image)

紧急

任务超时引起的保存镜像失败

(Operations personnel are handling the problem)

紧急

SWR故障引起的保存镜像失败

(Failed to save the image because the SWR service is faulty)

紧急

CheckImageSize

The notebook container image size is {image_size}G.

{image_size} 表示镜像大小,为可变变量。

提示

CheckImageLayer

The number of original notebook image layers is {layer_number}.

{layer_number} 表示镜像层数,为可变变量。

提示

ContainerCommitStarted

Start to commit notebook container.

提示

ContainerCommitSuccess

Notebook container commit successfully.

提示

ImagePushStarted

Start to push notebook image.

提示

ImagePushSuccess

Notebook image push successfully.

提示

ContainerCommitFailed

Failed to commit notebook container. Please contact SRE to check node {node_name}.

{node_name}表示节点名称,为可变变量,一般为ip形式,如:192.168.225.161

提示

ImagePushFailed

Failed to push Notebook image. Please contact SRE to check node {node_name}.

提示

表5 实例运行过程的事件列表

事件名称

事件描述

事件级别

NotebookUnhealthy

实例处于不健康状态

紧急

OutOfMemory

实例被OOM掉了

紧急

JupyterProcessKilled

jupyter进程被killed掉了

紧急

CacheVolumeExceedQuota

/cache目录文件大小超过最大限制

紧急

NotebookHealthy

实例从不健康恢复到了健康状态

重要

EVSSoldOut

EVS存储售罄

紧急

表6 OBS动态挂载产生的事件列表

事件名称

事件描述

事件级别

DynamicMountStorage

挂载OBS存储

重要

DynamicUnmountStorage

卸载OBS存储

重要

表7 用户侧触发的事件

事件名称

事件描述

事件级别

RefreshCredentialsFailed

用户鉴权失败

紧急