为什么自定义规格的Notebook在设置空闲停止后长时间未停止?
问题现象
用户创建了一个自定义规格的Notebook实例(例如:0.5核CPU + 1 GiB内存),并开启了空闲自动停止功能(例如:将空闲时间设置为15分钟)。然而,该实例在长时间无操作后并未按预期自动停止。
问题原因
平台判定Notebook实例是否空闲的依据是实例的资源占用率是否持续低于预设的阈值。只有当CPU、内存等关键资源的占用率均低于该阈值时,才会触发空闲停止。但Notebook实例在运行时,其容器本身及基础系统服务会占用一部分资源。当用户选择的自定义规格非常小(如0.5 核、1 GiB)时,这部分“固有消耗”所占的比例就会相对较高,导致整体资源占用率始终高于空闲判定阈值。因此,即使没有用户活动,实例也不会被判定为空闲,从而无法触发自动停止。
空闲判定指标阈值:
| 规格类型 | 网络接收速率(≤1.6KB/s) | CPU使用率(≤5%) | GPU使用率(≤1%) | NPU使用率(≤1%) |
|---|---|---|---|---|
| CPU类型 | √ | √ | - | - |
| GPU类型 | √ | √ | √ | - |
| Ascend类型 | √ | √ | - | √ |