CCE AI套件(Ascend NPU)
插件介绍
CCE AI套件(Ascend NPU)是支持容器里使用NPU设备的管理插件。
安装本插件后,可创建“AI加速型”节点,实现快速高效地处理推理和图像识别等工作。
字段说明
|
参数 |
是否必选 |
参数类型 |
描述 |
|---|---|---|---|
|
basic |
否 |
object |
插件基础配置参数,无需指定。 |
|
flavor |
是 |
表3 object |
插件规格参数 |
|
custom |
是 |
表4 object |
插件自定义参数 |
|
参数 |
是否必选 |
参数类型 |
描述 |
|---|---|---|---|
|
cluster_version |
是 |
String |
CCE集群版本 |
|
device_version |
是 |
String |
插件的版本 |
|
driver_version |
是 |
String |
插件开启自动安装驱动时,插件里负责安装驱动的Pod的镜像tag,一般与device_version相同 |
|
swr_addr |
是 |
String |
镜像仓库地址 |
|
swr_user |
是 |
String |
镜像仓库租户路径 |
|
参数 |
是否必选 |
参数类型 |
描述 |
|---|---|---|---|
|
description |
否 |
String |
插件相关的描述信息 |
|
name |
是 |
String |
插件规格名称,固定为:Single-instance |
|
replicas |
是 |
String |
实例数,默认为:1 |
|
resources |
是 |
resources object |
容器资源(CPU、内存)配额。 |
|
参数 |
是否必选 |
参数类型 |
描述 |
|---|---|---|---|
|
auto_install_npu_driver |
否 |
Bool |
默认值:false true:自动在节点上安装NPU驱动,当前只支持310、310P卡的部分规格 |
|
check_frequency_failed_threshold |
否 |
Int |
插件判断NPU设备状态不健康的阈值次数 默认值:100 |
|
check_frequency_fall_times |
否 |
Int |
判断芯片主频降级是否隔离的门限 默认值:3 |
|
check_frequency_gate |
否 |
Bool |
true:开启芯片主频检查 默认值:false |
|
check_frequency_recover_threshold |
否 |
Int |
插件判断NPU设备状态健康的阈值次数 默认值:100 |
|
check_frequency_rise_times |
否 |
Int |
判断芯片主频降级是否恢复的门限 默认值:2 |
|
container_path |
否 |
String |
容器里用于挂载Hiai library的路径 默认值:"/usr/local/HiAI_unused" |
|
host_path |
否 |
String |
主机上包含Hiai library的路径 默认值:"/usr/local/HiAI_unused" |
|
npu_driver_config |
否 |
Map |
如果自动在节点上安装NPU驱动,该参数key为机型,value为机型对应的NPU驱动的下载地址 默认值:{} |
请求示例
{
"kind": "Addon",
"apiVersion": "v3",
"metadata": {
"name": "huawei-npu",
},
"spec": {
"clusterID": "e93c2716-****-****-****-0255ac10004e",
"version": "2.0.26",
"addonTemplateName": "huawei-npu",
"values": {
"basic": {
"cluster_version": "v1.23",
"device_version": "2.0.26",
"driver_version": "2.0.26",
"platform": "linux-amd64",
"rbac_enabled": true,
"swr_addr": "***",
"swr_user": "***"
},
"custom": {
"annotations": {},
"auto_install_npu_driver": true,
"check_frequency_failed_threshold": 100,
"check_frequency_fall_times": 3,
"check_frequency_gate": false,
"check_frequency_recover_threshold": 100,
"check_frequency_rise_times": 2,
"container_path": "/usr/local/HiAI_unused",
"host_path": "/usr/local/HiAI_unused",
"npu_driver_config": {}
},
"flavor": {
"category": [
"CCE",
"Turbo"
],
"name": "default",
"resources": [
{
"limitsCpu": "1000m",
"limitsMem": "4096Mi",
"name": "npu-driver-installer",
"requestsCpu": "50m",
"requestsMem": "100Mi"
}
]
},
}
}
}