Agendamento de NPU
Você pode usar NPUs em contêineres do CCE.
Pré-requisitos
- Um nó de NPU foi criado. Para mais detalhes, consulte Criação de um nó.
- O huawei-npu foi instalado. Para mais detalhes, consulte Suíte de IA do CCE (Ascend NPU).
Usar NPUs
Crie uma carga de trabalho e solicite NPUs. Você pode especificar o número de NPUs da seguinte forma:
kind: Deployment apiVersion: apps/v1 metadata: name: npu-test namespace: default spec: replicas: 1 selector: matchLabels: app: npu-test template: metadata: labels: app: npu-test spec: containers: - name: container-0 image: nginx:perl resources: limits: cpu: 250m huawei.com/ascend-310: '1' memory: 512Mi requests: cpu: 250m huawei.com/ascend-310: '1' memory: 512Mi imagePullSecrets: - name: default-secret
Especifique o número de NPUs a serem solicitados em huawei.com/ascend-310.
Quando você usa huawei.com/ascend-310 para especificar o número de NPUs, os valores de solicitações e limites devem ser os mesmos.
Depois que huawei.com/ascend-310 for especificado, as cargas de trabalho serão agendadas apenas para nós com NPUs. Se as NPUs forem insuficientes, um evento do Kubernetes semelhante a "0/2 nodes are available: 2 Insufficient huawei.com/ascend-310." será relatado.
Para usar NPUs no console do CCE, selecione a cota de NPU e especifique o número de chips Ascend 310 a serem usados ao criar uma carga de trabalho.
Rótulos de nó de NPU
O CCE rotulará os nós habilitados para NPU que estão prontos para uso.
$ kubectl get node -L accelerator/huawei-npu NAME STATUS ROLES AGE VERSION HUAWEI-NPU 10.100.2.59 Ready <none> 2m18s v1.19.10-r0-CCE21.11.1.B006-21.11.1.B006 ascend-310
kind: Deployment apiVersion: apps/v1 metadata: name: npu-test namespace: default spec: replicas: 1 selector: matchLabels: app: npu-test template: metadata: labels: app: npu-test spec: nodeSelector: accelerator/huawei-npu: ascend-310 containers: - name: container-0 image: nginx:perl resources: limits: cpu: 250m huawei.com/ascend-310: '1' memory: 512Mi requests: cpu: 250m huawei.com/ascend-310: '1' memory: 512Mi imagePullSecrets: - name: default-secret