O&M de cluster
Gestão de alarmes
O MRS pode monitorar clusters de Big Data em tempo real e identificar o status de integridade do sistema com base em alarmes e eventos. Além disso, o MRS permite personalizar o monitoramento e os limites de alarme para se concentrar no status de saúde de cada métrica. Quando os dados de monitoramento atingem o limite de alarme, o sistema dispara um alarme.
O MRS também pode se interconectar com o sistema de serviço de mensagens do serviço Simple Message Notification (SMN) da Huawei Cloud para enviar informações de alarme aos usuários por mensagem SMS ou e-mail. Para mais detalhes, consulte Notificação de mensagem.
Gerenciamento de patches
O MRS suporta operações de patching de cluster e liberará patches para componentes de Big Data de código aberto em tempo hábil. Na página de gerenciamento de cluster do MRS, você pode exibir as informações da versão de patch relacionadas aos clusters em execução, incluindo a descrição detalhada dos problemas e impactos resolvidos. Você pode determinar se deseja instalar um patch com base no status do serviço em execução. A instalação de patch com um clique não envolve intervenção manual e não causará interrupção do serviço por meio da instalação contínua, garantindo a disponibilidade a longo prazo dos clusters.
O MRS pode exibir o processo detalhado de instalação do patch. O gerenciamento de patches também oferece suporte à desinstalação e reversão de patches.
O MRS 3.x ou posterior não oferece suporte ao gerenciamento de patches no console de gerenciamento.
Suporte de O&M
Os recursos de cluster fornecidos pelo MRS pertencem aos usuários. Geralmente, quando o suporte da equipe de O&M é necessário para a solução de problemas de um cluster, a equipe de O&M não pode acessar diretamente o cluster. Para melhor atender os clientes, a MRS oferece os dois métodos a seguir para melhorar a eficiência da comunicação durante a localização de falhas:
- Compartilhamento de logs: você também pode iniciar o compartilhamento de logs no console de gerenciamento do MRS para compartilhar um escopo de log especificado com a equipe de O&M, de modo que a equipe de O&M possa localizar falhas sem acessar o cluster.
- Autorização de O&M: se ocorrer um problema quando você usar um cluster de MRS, poderá iniciar a autorização de O&M no console de gerenciamento de MRS. A equipe de O&M pode ajudá-lo a localizar rapidamente o problema e você pode revogar a autorização a qualquer momento.
Verificação de integridade
O MRS fornece inspeção automática em ambientes em execução do sistema para que você possa verificar e auditar o status de integridade do sistema em execução em um clique, garantindo o funcionamento adequado do sistema e reduzindo os custos de operação e manutenção do sistema. Depois de visualizar os resultados da inspeção, você pode exportar relatórios para arquivamento e análise de falhas.