Relatório de alarme do diretório de cache do notebook
Ao criar uma instância de notebook, você pode selecionar recursos de CPU, GPU ou Ascend com base no volume de dados de serviço. Se você selecionar recursos de GPU ou Ascend, o ModelArts montará os discos rígidos no diretório de cache. Você pode usar esse diretório para armazenar arquivos temporários.
Alarmes de capacidade não são gerados para o diretório de cache da instância do notebook por padrão. Exceder o limite de capacidade reiniciará a instância do notebook. Após a reinicialização, várias configurações são redefinidas, descartando seus dados e perdendo o ambiente. Isso afetará sua experiência. É aconselhável ativar o monitoramento e os alarmes para o uso do diretório de cache e relatar os dados ao AOM.
Processo de configuração
- Insira as informações básicas do alarme.
- Defina uma regra de alarme.
- Configure as métricas de monitoramento
- Defina as condições de acionamento do alarme.
- Configure notificações de alarme.
- Crie um tópico, configure a política de tópicos e assine o tópico.
- Crie uma regra de ação de alarme.
- Selecione a regra de ação criada.
Configurar configurações de alarme
- Efetue logon no console do AOM.
- Escolha Alarm Center > Alarm Rules e clique em Create Alarm Rule.
- Insira as informações básicas do alarme.
- Defina uma regra de alarme.
Rule Type: selecione Threshold alarm.
Monitored Object: selecione Select resource objects. Clique em Select Resource Object. Uma caixa de diálogo nova é exibida.
- Add By: selecione Dimension.
- Metric Name: clique em Custom Metrics e selecione as métricas de cache a serem monitoradas. Exemplo: ma_container_notebook_cache_dir_size_bytes (tamanho total do diretório cache) e ma_container_notebook_cache_dir_util (uso do diretório cache)
- Dimension: selecione uma dimensão de métrica, por exemplo, service_id:xxx e clique em Confirm.
Depois de definir o objeto monitorado, defina Statistic e Statistical Period.
Alarm Condition: defina este parâmetro com base na sua necessidade.
Figura 1 Selecionar objeto monitorado
Figura 2 Configurar o método de estatísticas
Figura 3 Configurar condições de alarme
- Configure as notificações de alarme e clique em Create Now.
Alarm Mode: selecione Direct Alarm Reporting.
Action Rule: ative-a e selecione a regra de ação criada. Se as regras de ação de alarme existentes não puderem atender aos seus requisitos, clique em Create Rule para criar uma regra de ação. Para obter detalhes, consulte Criação de uma ação de alarme.
Notification: habilitá-la.
Figura 4 Configurar notificações de alarme
Crie um tópico no SMN para configurar regras de notificação de alarme.
- Criar um tópico
- Vá para o console do SMN. No painel de navegação, escolha Topic Management > Topics.
- Clique em Create Topic. Insira um nome de tópico, selecione um projeto empresarial e clique em OK.
- Localize o tópico de destino e escolha More > Configure Topic Policy na coluna Operation.
Selecione APM para permitir que os alarmes do AOM acionem o SMN.
Figura 5 Configure Topic Policy
- Clique em Add Subscription na coluna Operation do tópico. Depois que a assinatura for bem-sucedida, uma notificação será recebida assim que as condições de alarme forem atendidas.
Selecione um protocolo, como e-mail ou SMS, e insira os pontos de extremidade, como endereços de e-mail ou números de celular. Clique em OK.
Um registro é exibido na lista de assinaturas, mas o registro está no estado Unconfirmed.
Após receber o e-mail, confirme a assinatura.
Em seguida, a assinatura está no estado confirmado.
- Criar uma regra de ação de alarme
Uma regra de ação especifica como o AOM o notifica quando um alarme é disparado. Depois que uma regra de ação de alarme é habilitada, o sistema envia notificações com base no tópico do SMN associado e no modelo de mensagem.
Insira o nome da regra de ação, selecione o tipo de regra de ação, selecione o tópico criado na etapa anterior, selecione um modelo de mensagem e clique em Confirm.
Figura 6 Create Alarm Action Rule
- Criar um tópico
Na área Alarm Notification da página Create Alarm Rule, defina Action Rule como a regra de ação de alarme recém-criada e clique em Create Now.
Após a conclusão da configuração, você receberá uma notificação por e-mail assim que as condições de alarme forem atendidas.