Exibição de detalhes sobre um pool de recursos
Página de detalhes do pool de recursos
- Efetue logon no console do ModelArts. No painel de navegação, escolha Dedicated Resource Pools > Elastic Cluster.
- Clique em ao lado do tipo de pool de recursos ou status no cabeçalho da tabela. No canto superior direito da lista, selecione Name ou Resource ID para filtrar pools de recursos. Para obter o ID do recurso, acesse a página Billing Center > Orders > My Orders e clique em Details na coluna Operation do pedido de destino.
- Na lista de pool de recursos, clique em um pool de recursos para ir para sua página de detalhes e exibir suas informações.
- Se houver vários pools de recursos, clique em no canto superior esquerdo da página de detalhes de um pool de recursos para alternar entre pools de recursos. Clique em More no canto superior direito para executar operações como redimensionar ou excluir o pool de recursos. As operações disponíveis variam dependendo do pool de recursos.
- Na área Network de Basic Information, você pode clicar no número de pools de recursos associados para exibir pools de recursos associados.
- Na área de informações estendidas, você pode exibir as informações de monitoramento, trabalhos, nós, especificações e eventos. Para obter detalhes, consulte a seguinte seção.
Exibir trabalhos em um pool de recursos
Na página de detalhes do pool de recursos, clique em Jobs. Você pode exibir todos os trabalhos em execução no pool de recursos. Se um trabalho estiver enfileirando, você poderá visualizar sua posição de enfileiramento.
Somente os trabalhos de treinamento podem ser visualizados.
Exibir eventos do pool de recursos
Na página de detalhes do pool de recursos, clique em Events. Você pode exibir todos os eventos do pool de recursos. A causa de um evento é PoolStatusChange ou PoolResourcesStatusChange.
Na lista de eventos, clique em à direita de Event Type para filtrar eventos.
- Quando um pool de recursos começa a ser criado ou se torna anormal, o status do pool de recursos muda e a alteração é registrada como um evento.
- Quando o número de nós disponíveis ou anormais ou em processo de criação ou exclusão for alterado, o status do nó do pool de recursos será alterado e a alteração será registrada como um evento.
Exibir nós do pool de recursos
Na página de detalhes do pool de recursos, clique em Nodes. Você pode exibir todos os nós no pool de recursos e o uso de recursos de cada nó.
Alguns recursos são reservados para componentes de cluster. Portanto, CPUs (Available/Total) não indica o número de recursos físicos no nó. Ele exibe apenas o número de recursos que podem ser usados pelos serviços. Os núcleos da CPU são medidos em milinúcleos, e 1000 milinúcleos equivalem a 1 núcleo físico.
- Substituir um nó:
Na guia Nodes, localize o nó a ser substituído. Na coluna Operation, clique em Replace. Nenhuma taxa é cobrada para esta operação.
Verifique os registros de substituição de nó na página Records. Running indica que o nó está sendo substituído. Após a substituição, você pode verificar o novo nó na lista de nós.
A substituição não pode durar mais de 24 horas. Se nenhum recurso adequado for encontrado após o tempo limite de substituição, o status mudará para Failed. Passe o mouse sobre para verificar a causa da falha.
- O número de substituições por dia não pode exceder 20% do total de nós no pool de recursos. O número de nós a serem substituídos não pode exceder 5% do total de nós no pool de recursos.
- Certifique-se de que haja recursos de nó ociosos. Caso contrário, a substituição pode falhar.
- Se houver nós no estado Resetting nos registros de operação, os nós no pool de recursos não poderão ser substituídos.
- Redefinir um nó
Na guia Nodes, localize o nó que deseja redefinir. Clique em Reset na coluna Operation para redefinir um nó. Você também pode selecionar vários nós e clicar em Reset para redefinir vários nós.
Configure os parâmetros descritos na tabela abaixo.
Tabela 1 Parâmetros Parâmetro
Descrição
Operating System
Selecione um sistema operacional na caixa de listagem suspensa.
Configuration Mode
Selecione um modo de configuração para redefinir o nó.
- By node percentage: a proporção máxima de nós que podem ser redefinidos se houver vários nós na tarefa de redefinição
- By node quantity: o número máximo de nós que podem ser redefinidos se houver vários nós na tarefa de redefinição
Verifique os registros de redefinição de nó na página Records. Se o nó está sendo reiniciado, seu status é Resetting. Após a redefinição ser concluída, o status do nó muda para Available. A redefinição de um nó não será cobrada.
Figura 3 Redefinir um nó
- A redefinição de um nó afetará os serviços em execução.
- Somente os nós no estado Available podem ser redefinidos.
- Um único nó pode estar em apenas uma tarefa de redefinição por vez. Várias tarefas de redefinição não podem ser entregues ao mesmo nó por vez.
- Se houver nós no estado Replacing nos registros de operação, os nós no pool de recursos não poderão ser redefinidos.
- Quando o driver de um pool de recursos está sendo atualizado, os nós nesse pool de recursos não podem ser redefinidos.
- Para especificações de GPU e NPU, após o nó ser redefinido, o driver do nó pode ser atualizado. Espere pacientemente.
Figura 4 Nós
Figura 5 Registros da operação
- Exclusão, cancelamento de assinatura ou liberação de um nó
- Para um pool de recursos de pagamento por uso, clique em Delete na coluna Operation.
Para excluir nós em lotes, marque as caixas de seleção ao lado dos nomes dos nós e clique em Delete.
- Para um pool de recursos anual/mensal cujos recursos não estejam expirados, clique em Unsubscribe na coluna Operation.
- Para um pool de recursos anual/mensal cujos recursos tenham expirado (no período de tolerância), clique em Release na coluna Operation.
Se o botão de exclusão estiver disponível para um nó anual/mensal, se o nó for um nó de inventário, clique em Delete.
- Antes de excluir, cancelar a assinatura ou liberar um nó, verifique se não há tarefas em execução nesse nó. Caso contrário, os trabalhos serão interrompidos.
- Excluir, cancelar a assinatura ou liberar nós anormais em um pool de recursos e adicionar novos para substituição.
- Se houver apenas um nó, ele não pode ser excluído, cancelado ou liberado.
- Para um pool de recursos de pagamento por uso, clique em Delete na coluna Operation.
Exibir especificações do pool de recursos
Na página de detalhes do pool de recursos, clique em Specifications. Você pode exibir as especificações usadas pelo pool de recursos e o número de cada especificação.
Exibir informações de monitoramento do pool de recursos
Na página de detalhes do pool de recursos, clique em Monitoring. O uso de recursos, incluindo CPUs usadas, uso de memória e capacidade de disco disponível do pool de recursos, é exibido. Se aceleradores de IA forem usados no pool de recursos, as informações de monitoramento de GPU e NPU também serão exibidas.
Visualização de tags
Você pode adicionar tags a um pool de recursos para pesquisa rápida.
Na página de detalhes do pool de recursos, clique em Tags. Você pode exibir, adicionar, modificar e excluir tags de um pool de recursos. Para obter detalhes sobre como usar tags, consulte Como o ModelArts usa tags para gerenciar recursos por grupo?
Você pode adicionar até 20 tags.