Por que o SO falha ao responder quando o kdump ocorre em um ECS de Linux?
Sintoma
Quando o kdump ocorre em um ECS Xen de Linux, o SO não responde e não pode ser recuperado automaticamente. Por exemplo, se você executar o comando echo c>/proc/sysrq-trigger para acionar o kdump, essa falha ocorrerá.
  
 
   Geralmente, o kdump está desabilitado para imagens públicas. Esse problema não ocorre nos ECSs criados usando imagens públicas.
Possíveis causas
- Certas versões do kernel Linux são incompatíveis com a virtualização Xen.
 - Se o kdump estiver habilitado no ECS com o kernel não suportando soft_rest, o ECS para de responder durante o dump.
 
Solução
Método 1: desativar o kdump.
O CentOS 7.5 é usado como um exemplo a seguir.
- Reinicie forçadamente o ECS.
    
- Faça logon no console de gerenciamento.
 - Em Compute, escolha Elastic Cloud Server.
 - Na lista do ECS, selecione o ECS de destino e clique em Restart.
 - Selecione Forcibly restart the preceding ECSs ou Forcibly stop the preceding ECSs.
 - Clique em OK.
 
 - Desative o kdump.
 
Método 2:
Se o ECS de destino oferecer suporte à função crash_kexec_post_notifiers, adicione a função ao arquivo de configuração de inicialização do ECS (menu.lst ou grub.cfg). Para fazer isso, execute as seguintes operações:
- Execute o seguinte comando para verificar se o ECS oferece suporte à função crash_kexec_post_notifiers:
    
cat /proc/kallsyms |grep crash_kexec_post_notifiers
Figura 2 Suporte para a função crash_kexec_post_notifiers
    - Se sim, vá para a etapa 2.
 - Se não, use o método 1.
 
 - Adicione a função crash_kexec_post_notifiers ao arquivo de configuração de inicialização.
    
Tome menu.lst como um exemplo.
 
    
      