Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ MapReduce Service/ Guía del usuario/ Referencia de alarma (aplicable a MRS 3.x)/ ALM-45433 Excepción de topología de ClickHouse AZ
Actualización más reciente 2023-11-20 GMT+08:00

ALM-45433 Excepción de topología de ClickHouse AZ

Descripción

Si la función de HA entre AZ está habilitada para un clúster en el que se ha desplegado ClickHouse, la topología ClickHouse permanece sin cambios. Esta alarma se genera cuando el HA entre AZ no tiene efecto si los nodos de copia de respaldo del mismo shard están en la misma AZ.

Esta alarma se borra automáticamente cuando el sistema detecta que todos los shards cumplen los requisitos de despliegue de HA entre AZ.

Atributo

ID de alarma

Severidad de alarma

Borrar automáticamente

45433

Crítica

Parámetros

Nombre

Significado

Source

Especifica el clúster para el que se genera la alarma.

ServiceName

Especifica el servicio para el que se genera la alarma.

HostName

Especifica el host para el que se genera la alarma.

Impacto en el sistema

El despliegue actual del servicio ClickHouse no admite HA entre AZ.

Causas posibles

Después de que HA entre AZ está habilitado, todos los nodos de copia de respaldo de un shard están en la misma AZ.

Procedimiento

Modificar la AZ de nodos de copia de respaldo.

  1. Inicie sesión en el nodo donde está instalado el cliente como usuario de instalación del cliente. Ejecute el siguiente comando para cambiar al directorio de instalación del cliente:

    cd {Client installation path}

  2. Ejecute el siguiente comando para configurar las variables de entorno:

    source bigdata_env

  3. Ejecute el siguiente comando para autenticar al usuario (omita este paso en modo normal):

    kinit Component service user

  4. Ejecute el siguiente comando para iniciar sesión en la herramienta de cliente:

    zkCli.sh -serverService IP address of the node where the ZooKeeper instance resides:Client port

  5. Ejecute el siguiente comando para ver la topología actual:

    get /clickhouse/topo

    Si el ClickHouse está instalado con varios servicios, ejecute el comando get /ClickHouse{-n}/topo. Por ejemplo, si el ClickHouse-1 está instalado, ejecute el comando get /clickhouse-1/topo.

    [zk: 192.168.20.36:24002(CONNECTED) 0] get /clickhouse/topo 
    
    <topo>
      <mcluster>
        <shard id="14" index="1">
          <server id="15">
            <replica>1</replica>
            <az>AZ1</az>
            <host>192-168-20-205</host>
            <port>21427</port>
          </server>
          <server id="16">
            <replica>2</replica>
            <az>AZ1</az>
            <host>192-168-20-2205</host>
            <port>21427</port>
          </server>
        </shard>
      </mcluster>
    </topo>

  6. Seleccione un host del shard deseado y despliegue el host en otra zona de disponibilidad.
  7. Inicie sesión en FusionInsight Manager, click Host, seleccione el host en el que ha desplegado en 6 and elija More > Reinstall para reinstalar el host.
  8. Elija Cluster > Cross-AZ HA, haga clic en Configure AZ and Policy y cambie la información de AZ del host reinstalado a la AZ planificado en 6.
  9. Espere cinco minutos y compruebe si la alarma está desactivada.

    • En caso afirmativo, no es necesario hacer nada más.
    • Si no, vaya a 10.

Recopilar información de fallas.

  1. En FusionInsight Manager, elija O&M > Log > Download.
  2. Expanda la lista desplegable junto al campo Service. En el cuadro de diálogo Services que se muestra, seleccione ClickHouseServer para el clúster de destino.
  3. Expanda la lista Hosts. En el cuadro de diálogo Select Host que se muestra, seleccione el host anormal y haga clic en OK.
  4. Haga clic en en la esquina superior derecha y establezca Start Date y End Date para la recopilación de registros en 1 hora antes y después del tiempo de generación de alarma, respectivamente. A continuación, haga clic en Download.
  5. Póngase en contacto con y proporcione los registros recopilados.

Eliminación de alarmas

Esta alarma se borra automáticamente después de rectificar la falla.

Información relacionada

Ninguna