Este conteúdo foi traduzido por máquina para sua conveniência e a Huawei Cloud não pode garantir que o conteúdo foi traduzido com precisão. Para exibir o conteúdo original, use o link no canto superior direito para mudar para a página em inglês.
Central de ajuda/ ModelArts/ Melhores práticas/ Cluster elástico/ Criação de um pool de recursos
Atualizado em 2024-09-14 GMT+08:00

Criação de um pool de recursos

Esta seção descreve como criar um pool de recursos dedicado.

Procedimento

  1. Efetue logon no console do ModelArts. No painel de navegação, escolha Dedicated Resource Pools > Elastic Cluster.

    Para novos usuários, somente os clusters elásticos de nova versão estão disponíveis no console do ModelArts. Para os usuários que usaram pools de recursos dedicados de versão antiga, eles podem acessar clusters elásticos de versão antiga e nova.

  2. Na guia Resource Pools, clique em Create e configure parâmetros.
    Tabela 1 Parâmetros de pool de recursos dedicados

    Parâmetro

    Sub parâmetro

    Descrição

    Name

    N/D

    Nome de um pool de recursos dedicado.

    Somente letras minúsculas, dígitos e hifens (-) são permitidos. O valor deve começar com uma letra minúscula e não pode terminar com um hífen (-).

    Description

    N/D

    Breve descrição de um pool de recursos dedicado.

    Billing Mode

    N/D

    Você pode selecionar Pay-per-use.

    Resource Pool Type

    N/D

    Você pode selecionar Physical ou Logical. Se não houver nenhuma especificação lógica, Logical não será exibido.

    Job Type

    N/D

    Selecione os tipos de trabalho suportados pelo pool de recursos com base nos requisitos de serviço.

    • Physical: DevEnviron, Training Job e Inference Service são suportados.
    • Logical: somente Training Job é suportado.

    Network

    N/D

    Rede na qual a instância do serviço de destino está implementada. A instância pode trocar dados com outros recursos de serviço de nuvem na mesma rede.

    Selecione uma rede na caixa de listagem suspensa. Se nenhuma rede estiver disponível, clique em Create à direita para criar uma rede. Para obter detalhes sobre como criar uma rede, consulte Criação de uma rede.

    Specification Management

    Specifications

    Selecione as especificações necessárias. Devido à perda do sistema, os recursos disponíveis reais são menores do que os especificados nas especificações. Depois que um pool de recursos dedicado é criado, você pode exibir os recursos disponíveis reais na página de guia Nodes da página de detalhes do pool de recursos dedicado.

    AZ

    Você pode selecionar Automatically allocated ou Specifies AZ. Uma AZ é uma região física onde recursos usam fontes de energia e redes independentes. As AZs são fisicamente isoladas, mas interconectadas em uma intranet.

    • Automatically allocated: as AZs são alocadas automaticamente.
    • Specifies AZ: especificar AZs para nós do pool de recursos. Para garantir a recuperação de desastres do sistema, implemente todos os nós na mesma AZ. Você pode definir o número de nós em uma AZ.

    Nodes

    Selecione o número de nós em um pool de recursos dedicado. Mais nós significam maior desempenho de computação.

    Se AZ estiver definida como Specifies AZ, não é necessário configurar Nodes.

    NOTA:

    É uma boa prática criar não mais do que 30 nodes por vez. Caso contrário, a criação pode falhar devido à limitação de tráfego.

    Advanced Configuration

    Isso permite definir o espaço do mecanismo do contêiner.

    Você deve inserir um inteiro para o espaço do mecanismo do contêiner. Não pode ser inferior a 50 GB, que é o valor padrão e mínimo. O valor máximo depende das especificações. Para ver os valores válidos, verifique o prompt do console. Personalizar o espaço do mecanismo do contêiner não aumenta os custos.

    Custom Driver

    N/D

    Esse parâmetro está disponível somente quando um flavor de GPU ou Ascend é selecionado. Ative esta função e selecione um driver.

    GPU Driver

    N/D

    Esse parâmetro está disponível somente quando o driver personalizado está habilitado. Selecione um driver de acelerador de GPU.

    Required Duration

    N/D

    Selecione o período de tempo para o qual você deseja usar o pool de recursos. Esse parâmetro é obrigatório somente quando o modo de cobrança Yearly/Monthly estiver selecionado.

    Auto-renewal

    N/D

    Especifica se a renovação automática deve ser ativada. Esse parâmetro é obrigatório somente quando o modo de cobrança Yearly/Monthly estiver selecionado.

    • As assinaturas mensais são renovadas a cada mês.
    • As assinaturas anuais são renovadas a cada ano.

    Advanced Options

    N/D

    Selecione Configure Now para definir as informações de tag, o bloco CIDR e a distribuição do nó do controlador.

    Tags

    N/D

    O ModelArts pode trabalhar com o Tag Management Service (TMS). Ao criar tarefas que consomem recursos no ModelArts, por exemplo, ttabalhos de treinamento, configure tags para que o ModelArts possa usar tags para gerenciar recursos por grupo.

    Para obter detalhes sobre como usar tags, consulte Como o ModelArts usa tags para gerenciar recursos por grupo?

    NOTA:

    Você pode selecionar uma tag do TMS predefinida na lista suspensa de tags ou personalizar uma tag. As tags predefinidas estão disponíveis para todos os recursos de serviço que suportam tags. As tags personalizadas estão disponíveis apenas para os recursos de serviço do usuário que criou as tags.

    CIDR block

    N/D

    Você pode selecionar Default ou Custom.

    • Default: o sistema aloca aleatoriamente um bloco CIDR disponível para você, que não pode ser modificado depois que o pool de recursos é criado. Para uso comercial, personalize seu bloco CIDR.
    • Custom: você precisa personalizar o contêiner de K8S e os blocos CIDR de serviço K8S.
      • K8S Container Network: usado pelo contêiner em um cluster, que determina quantos contêineres podem existir em um cluster. O valor não pode ser alterado após a criação do pool de recursos.
      • K8S Service Network: usado quando os contêineres no mesmo cluster acessam uns aos outros, o que determina quantos serviços podem existir. O valor não pode ser alterado após a criação do pool de recursos.

    Master Distribution

    N/D

    Locais de distribuição dos nós do controlador. Você pode selecionar Random ou Custom.

    • Random: use as AZs alocadas aleatoriamente pelo sistema.
    • Custom: selecione AZs para os nós do controlador.

    Distribua nós do controlador em diferentes AZs para recuperação de desastres.

  3. Clique em Next e confirme as configurações. Em seguida, clique em Submit para criar o pool de recursos dedicado.
    • Depois que um pool de recursos é criado, seu status muda para Running. Somente quando o número de nós disponíveis for maior que 0, as tarefas podem ser entregues a esse pool de recursos.
      Figura 1 Exibir um pool de recursos
    • Passe o cursor sobre Creating para exibir os detalhes sobre o processo de criação. Clique em View Details. A página de registro da operação é exibida.
      Figura 2 Criando
      Figura 3 Visualizar detalhes
    • Você pode exibir os registros de tarefas do pool de recursos clicando em Records no canto superior esquerdo da lista do pool de recursos.
      Figura 4 Registros da operação
      Figura 5 Exibir o status do pool de recursos

Perguntas frequentes

E se eu escolher um flavor para um pool de recursos dedicado, mas receber uma mensagem de erro dizendo que nenhum recurso está disponível?

Os flavors de recursos dedicados mudam com base na disponibilidade em tempo real. Às vezes, você pode escolher um flavor na página de compra, mas ele está esgotado antes de você pagar e criar o pool de recursos. Isso faz com que a criação do pool de recursos falhe.

Você pode tentar um flavor diferente na página de criação e criar o pool de recursos novamente.

P: por que não posso usar todos os recursos da CPU em um nó em um pool de recursos?

Os nós do pool de recursos têm sistemas e plug-ins instalados neles. Estes ocupam alguns recursos da CPU. Por exemplo, se um nó tiver 8 vCPUs, mas algumas delas forem usadas por componentes do sistema, os recursos disponíveis serão menos de 8 vCPUs.

Você pode verificar os recursos de CPU disponíveis clicando na guia Nodes na página de detalhes do pool de recursos, antes de iniciar uma tarefa.