CCE AI套件(Ascend NPU)
插件介绍
CCE AI套件(Ascend NPU)是支持容器里使用NPU设备的管理插件。
安装本插件后,可创建“AI加速型”节点,实现快速高效地处理推理和图像识别等工作。
字段说明
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
basic |
否 |
object |
插件基础配置参数,无需指定。 |
flavor |
是 |
表3 object |
插件规格参数 |
custom |
是 |
表4 object |
插件自定义参数 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
cluster_version |
是 |
String |
CCE集群版本 |
device_version |
是 |
String |
插件的版本 |
driver_version |
是 |
String |
插件开启自动安装驱动时,插件里负责安装驱动的Pod的镜像tag,一般与device_version相同 |
swr_addr |
是 |
String |
镜像仓库地址 |
swr_user |
是 |
String |
镜像仓库租户路径 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
description |
否 |
String |
插件相关的描述信息 |
name |
是 |
String |
插件规格名称,固定为:Single-instance |
replicas |
是 |
String |
实例数,默认为:1 |
resources |
是 |
resources object |
容器资源(CPU、内存)配额。 |
参数 |
是否必选 |
参数类型 |
描述 |
---|---|---|---|
auto_install_npu_driver |
否 |
Bool |
默认值:false true:自动在节点上安装NPU驱动,当前只支持310、310P卡的部分规格 |
check_frequency_failed_threshold |
否 |
Int |
插件判断NPU设备状态不健康的阈值次数 默认值:100 |
check_frequency_fall_times |
否 |
Int |
判断芯片主频降级是否隔离的门限 默认值:3 |
check_frequency_gate |
否 |
Bool |
true:开启芯片主频检查 默认值:false |
check_frequency_recover_threshold |
否 |
Int |
插件判断NPU设备状态健康的阈值次数 默认值:100 |
check_frequency_rise_times |
否 |
Int |
判断芯片主频降级是否恢复的门限 默认值:2 |
container_path |
否 |
String |
容器里用于挂载Hiai library的路径 默认值:"/usr/local/HiAI_unused" |
host_path |
否 |
String |
主机上包含Hiai library的路径 默认值:"/usr/local/HiAI_unused" |
npu_driver_config |
否 |
Map |
如果自动在节点上安装NPU驱动,该参数key为机型,value为机型对应的NPU驱动的下载地址 默认值:{} |
请求示例
{ "kind": "Addon", "apiVersion": "v3", "metadata": { "name": "huawei-npu", }, "spec": { "clusterID": "e93c2716-****-****-****-0255ac10004e", "version": "2.0.26", "addonTemplateName": "huawei-npu", "values": { "basic": { "cluster_version": "v1.23", "device_version": "2.0.26", "driver_version": "2.0.26", "platform": "linux-amd64", "rbac_enabled": true, "swr_addr": "***", "swr_user": "***" }, "custom": { "annotations": {}, "auto_install_npu_driver": true, "check_frequency_failed_threshold": 100, "check_frequency_fall_times": 3, "check_frequency_gate": false, "check_frequency_recover_threshold": 100, "check_frequency_rise_times": 2, "container_path": "/usr/local/HiAI_unused", "host_path": "/usr/local/HiAI_unused", "npu_driver_config": {} }, "flavor": { "category": [ "CCE", "Turbo" ], "name": "default", "resources": [ { "limitsCpu": "1000m", "limitsMem": "4096Mi", "name": "npu-driver-installer", "requestsCpu": "50m", "requestsMem": "100Mi" } ] }, } } }