ALM-45433 Excepción de topología de ClickHouse AZ
Descripción
Si la función de HA entre AZ está habilitada para un clúster en el que se ha desplegado ClickHouse, la topología ClickHouse permanece sin cambios. Esta alarma se genera cuando el HA entre AZ no tiene efecto si los nodos de copia de respaldo del mismo shard están en la misma AZ.
Esta alarma se borra automáticamente cuando el sistema detecta que todos los shards cumplen los requisitos de despliegue de HA entre AZ.
Atributo
ID de alarma |
Severidad de alarma |
Borrar automáticamente |
---|---|---|
45433 |
Crítica |
Sí |
Parámetros
Nombre |
Significado |
---|---|
Source |
Especifica el clúster para el que se genera la alarma. |
ServiceName |
Especifica el servicio para el que se genera la alarma. |
HostName |
Especifica el host para el que se genera la alarma. |
Impacto en el sistema
El despliegue actual del servicio ClickHouse no admite HA entre AZ.
Causas posibles
Después de que HA entre AZ está habilitado, todos los nodos de copia de respaldo de un shard están en la misma AZ.
Procedimiento
Modificar la AZ de nodos de copia de respaldo.
- Inicie sesión en el nodo donde está instalado el cliente como usuario de instalación del cliente. Ejecute el siguiente comando para cambiar al directorio de instalación del cliente:
cd {Client installation path}
- Ejecute el siguiente comando para configurar las variables de entorno:
source bigdata_env
- Ejecute el siguiente comando para autenticar al usuario (omita este paso en modo normal):
kinit Component service user
- Ejecute el siguiente comando para iniciar sesión en la herramienta de cliente:
zkCli.sh -serverService IP address of the node where the ZooKeeper instance resides:Client port
- Ejecute el siguiente comando para ver la topología actual:
get /clickhouse/topo
Si el ClickHouse está instalado con varios servicios, ejecute el comando get /ClickHouse{-n}/topo. Por ejemplo, si el ClickHouse-1 está instalado, ejecute el comando get /clickhouse-1/topo.
[zk: 192.168.20.36:24002(CONNECTED) 0] get /clickhouse/topo <topo> <mcluster> <shard id="14" index="1"> <server id="15"> <replica>1</replica> <az>AZ1</az> <host>192-168-20-205</host> <port>21427</port> </server> <server id="16"> <replica>2</replica> <az>AZ1</az> <host>192-168-20-2205</host> <port>21427</port> </server> </shard> </mcluster> </topo>
- Seleccione un host del shard deseado y despliegue el host en otra zona de disponibilidad.
- Inicie sesión en FusionInsight Manager, click Host, seleccione el host en el que ha desplegado en 6 and elija More > Reinstall para reinstalar el host.
- Elija Cluster > Cross-AZ HA, haga clic en Configure AZ and Policy y cambie la información de AZ del host reinstalado a la AZ planificado en 6.
- Espere cinco minutos y compruebe si la alarma está desactivada.
- En caso afirmativo, no es necesario hacer nada más.
- Si no, vaya a 10.
Recopilar información de fallas.
- En FusionInsight Manager, elija O&M > Log > Download.
- Expanda la lista desplegable junto al campo Service. En el cuadro de diálogo Services que se muestra, seleccione ClickHouseServer para el clúster de destino.
- Expanda la lista Hosts. En el cuadro de diálogo Select Host que se muestra, seleccione el host anormal y haga clic en OK.
- Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 1 hora antes y después del tiempo de generación de alarma, respectivamente. A continuación, haga clic en Download.
- Póngase en contacto con y proporcione los registros recopilados.
Eliminación de alarmas
Esta alarma se borra automáticamente después de rectificar la falla.
Información relacionada
Ninguna