Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.
Central de ajuda/ ModelArts/ Gerenciamento de recursos/ Cluster elástico/ Atualização de um driver de pool de recursos
Atualizado em 2024-09-14 GMT+08:00

Atualização de um driver de pool de recursos

Descrição

Se GPUs ou recursos de Ascend forem usados em um pool de recursos dedicado, talvez seja necessário personalizar os drivers da GPU ou Ascend. O ModelArts permite que você atualize drivers de GPU ou Ascend de seus pools de recursos dedicados.

Existem dois modos de atualização de driver: atualização segura e atualização forçada.

  • Atualização segura: os serviços em execução não são afetados. Após o início da atualização, os nós são isolados (novos trabalhos não podem ser entregues). Depois que os trabalhos existentes nos nós são concluídos, a atualização é realizada. A atualização segura pode levar muito tempo porque os trabalhos devem ser concluídos primeiro.
  • Atualização forçada: os drivers são atualizados diretamente, independentemente de haver trabalhos em execução.

Restrições

  • O pool de recursos dedicados de destino deve estar em execução e o pool de recursos contém recursos de GPU ou Ascend.
  • Para um pool de recursos lógicos, o driver pode ser atualizado somente após a vinculação de nó ser ativada. Para ativar a vinculação de nó, envie um tíquete de serviço para entrar em contato com os engenheiros da Huawei.

Atualizar o driver

  1. Faça logon no console de gerenciamento do ModelArts. No painel de navegação, escolha Dedicated Resource Pools > Elastic Cluster.
  2. Na coluna Operation do pool de recursos de destino, escolha More > Upgrade Driver.
  3. Na caixa de diálogo Upgrade Driver, o tipo de driver, o número de nós, a versão atual, a versão de destino e o modo de atualização do pool de recursos dedicados são exibidos.
    • Target Version: selecione uma versão do driver de destino na lista suspensa.
    • Upgrade Mode: selecione Secure upgrade ou Forcible upgrade.
    • Rolling Mode: uma vez ativado, você pode atualizar o driver no modo contínuo. Atualmente, a rolagem por porcentagem de nó e por quantidade de nó são suportadas. Se By node percentage for selecionada, o número de nós a serem atualizados em cada lote será a proporção de nós multiplicada pelo número total de nós no pool de recursos. Se By node quantity for selecionada, o número de nós a serem atualizados em cada lote é o que você configurou.
    Figura 1 Atualizar um driver
  4. Clique em OK para iniciar a atualização do driver.