Por que o SO falha ao responder quando o kdump ocorre em um ECS de Linux?
Sintoma
Quando o kdump ocorre em um ECS Xen de Linux, o SO não responde e não pode ser recuperado automaticamente. Por exemplo, se você executar o comando echo c>/proc/sysrq-trigger para acionar o kdump, essa falha ocorrerá.


Geralmente, o kdump está desabilitado para imagens públicas. Esse problema não ocorre nos ECSs criados usando imagens públicas.
Possíveis causas
- Certas versões do kernel Linux são incompatíveis com a virtualização Xen.
- Se o kdump estiver habilitado no ECS com o kernel não suportando soft_rest, o ECS para de responder durante o dump.
Solução
Método 1: desativar o kdump.
O CentOS 7.5 é usado como um exemplo a seguir.
- Reinicie forçadamente o ECS.
- Faça logon no console de gerenciamento.
- Em Compute, escolha Elastic Cloud Server.
- Na lista do ECS, selecione o ECS de destino e clique em Restart.
- Selecione Forcibly restart the preceding ECSs ou Forcibly stop the preceding ECSs.
- Clique em OK.
- Desative o kdump.
Método 2:
Se o ECS de destino oferecer suporte à função crash_kexec_post_notifiers, adicione a função ao arquivo de configuração de inicialização do ECS (menu.lst ou grub.cfg). Para fazer isso, execute as seguintes operações:
- Execute o seguinte comando para verificar se o ECS oferece suporte à função crash_kexec_post_notifiers:
cat /proc/kallsyms |grep crash_kexec_post_notifiers
Figura 2 Suporte para a função crash_kexec_post_notifiers- Se sim, vá para a etapa 2.
- Se não, use o método 1.
- Adicione a função crash_kexec_post_notifiers ao arquivo de configuração de inicialização.
Tome menu.lst como um exemplo.