Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Actualización más reciente 2023-02-21 GMT+08:00

Alto uso de CPU

Si el uso de la CPU alcanza el 80%, existe un cuello de botella de la CPU. En este caso, la lectura y escritura de datos son lentas, afectando sus servicios.

A continuación se describe cómo analizar las consultas lentas actuales. Después del análisis y la optimización, se mejorará el rendimiento de las consultas y se utilizarán los índices de manera más eficiente.

Análisis de consultas actuales

  1. Conéctese a una instancia mediante Mongo Shell.
  2. Ejecute el siguiente comando para ver las operaciones que se realizan en la base de datos:

    db.currentOp()

    Salida del comando:

    {
            "raw" : {
                    "shard0001" : {
                            "inprog" : [
                                    {
                                            "desc" : "StatisticsCollector",
                                            "threadId" : "140323686905600",
                                            "active" : true,
                                            "opid" : 9037713,
                                            "op" : "none",
                                            "ns" : "",
                                            "query" : {
                                            },
                                            "numYields" : 0,
                                            "locks" : {
                                            },
                                            "waitingForLock" : false,
                                            "lockStats" : {
                                            }
                                    },
                                    {
                                            "desc" : "conn2607",
                                            "threadId" : "140323415066368",
                                            "connectionId" : 2607,
                                            "client" : "172.16.36.87:37804",
                                            "appName" : "MongoDB Shell",
                                            "active" : true,
                                            "opid" : 9039588,
                                            "secs_running" : 0,
                                            "microsecs_running" : NumberLong(63),
                                            "op" : "command",
                                            "ns" : "admin.",
                                            "query" : {
                                                    "currentOp" : 1
                                       },
                                            "numYields" : 0,
                                            "locks" : {
                                            },
                                            "waitingForLock" : false,
                                            "lockStats" : {
                                            }
                                    }
                            ],
                            "ok" : 1
                    },
        ...
    }
    • client: dirección IP del cliente que envía la solicitud
    • opid: ID de operación única
    • secs_running: tiempo transcurrido para la ejecución, en segundos. Si el valor devuelto de este campo es demasiado grande, compruebe si la solicitud es razonable.
    • microsecs_running: tiempo transcurrido para la ejecución, en segundos. Si el valor devuelto de este campo es demasiado grande, compruebe si la solicitud es razonable.
    • op: tipo de operación. Las operaciones pueden ser consulta, inserción, actualización, eliminación o comando.
    • ns: colección de destino
    • Para obtener más información, consulte el comando db.currentOp() en el documento oficial.
  3. Basado en la salida del comando, compruebe si hay solicitudes que tardan mucho tiempo en procesarse.

    Si el uso de CPU es bajo mientras se procesan los servicios, pero luego se vuelve alto durante solo ciertas operaciones, analice las solicitudes que tardan mucho tiempo en ejecutarse.

    Si se encuentra una consulta anormal, busque el opid correspondiente a la operación y ejecute db.killOp(opid) para matarlo.

Análisis de consultas lentas

El perfil de consulta lento está habilitado para DDS de forma predeterminada. El sistema registra automáticamente cualquier consulta cuya ejecución tarda más de 500 ms en la colección system.profile en la base de datos correspondiente. Podrá hacer lo siguiente:

  1. Conéctese a una instancia mediante Mongo Shell.

    Para acceder a una instancia desde Internet

    To access an instance that is not publicly accessible

  2. Seleccione una base de datos específica (usando la base de datos de test como ejemplo):

    use test

  3. Compruebe si se han recopilado consultas SQL lentas en system.profile.

    show collections;

    • Si la salida del comando incluye system.profile, se han generado consultas SQL lentas. Vaya al siguiente paso.
      mongos> show collections
      system.profile
      test
    • Si el resultado del comando no contiene system.profile, no se han generado consultas SQL lentas y no se requiere un análisis de consultas lento.
      mongos> show collections
      test
  4. Compruebe los registros de consultas lentos en la base de datos.

    db.system.profile.find().pretty()

  5. Analice los registros de consultas lentos para encontrar la causa del alto uso de CPU.

    A continuación se muestra un ejemplo de un registro de consulta lento. El registro muestra una solicitud que escaneaba toda la tabla, incluidos los documentos de 1,561,632 y sin utilizar un índice de búsqueda.

    {
            "op" : "query",
            "ns" : "taiyiDatabase.taiyiTables$10002e",
            "query" : {
                    "find" : "taiyiTables",
                    "filter" : {
                            "filed19" : NumberLong("852605039766")
                    },
                    "shardVersion" : [
                            Timestamp(1, 1048673),
                            ObjectId("5da43185267ad9c374a72fd5")
                    ],
                    "chunkId" : "10002e"
            },
            "keysExamined" : 0,
            "docsExamined" : 1561632,
            "cursorExhausted" : true,
            "numYield" : 12335,
            "locks" : {
                    "Global" : {
                            "acquireCount" : {
                                    "r" : NumberLong(24672)
                            }
                    },
                    "Database" : {
                            "acquireCount" : {
                                    "r" : NumberLong(12336)
                            }
                    },
                    "Collection" : {
                            "acquireCount" : {
                                    "r" : NumberLong(12336)
                            }
                    }
            },
            "nreturned" : 0,
            "responseLength" : 157,
            "protocol" : "op_command",
            "millis" : 44480,
            "planSummary" : "COLLSCAN",
            "execStats" : {
                  "stage" : "SHARDING_FILTER",                                                                                                                                       [3/1955]
                    "nReturned" : 0,
                    "executionTimeMillisEstimate" : 43701,
                    "works" : 1561634,
                    "advanced" : 0,
                    "needTime" : 1561633,
                    "needYield" : 0,
                    "saveState" : 12335,
                    "restoreState" : 12335,
                    "isEOF" : 1,
                    "invalidates" : 0,
                    "chunkSkips" : 0,
                    "inputStage" : {
                            "stage" : "COLLSCAN",
                            "filter" : {
                                    "filed19" : {
                                            "$eq" : NumberLong("852605039766")
                                    }
                            },
                            "nReturned" : 0,
                            "executionTimeMillisEstimate" : 43590,
                            "works" : 1561634,
                            "advanced" : 0,
                            "needTime" : 1561633,
                            "needYield" : 0,
                            "saveState" : 12335,
                            "restoreState" : 12335,
                            "isEOF" : 1,
                            "invalidates" : 0,
                            "direction" : "forward",
                            "docsExamined" : 1561632
                    }
            },
            "ts" : ISODate("2019-10-14T10:49:52.780Z"),
            "client" : "172.16.36.87",
            "appName" : "MongoDB Shell",
            "allUsers" : [
                    {
                            "user" : "__system",
                            "db" : "local"
                    }
            ],
           "user" : "__system@local"
    }

    Las siguientes etapas pueden ser causas de una consulta lenta:

    • COLLSCAN implica una exploración completa de la colección (tabla completa).

      Cuando una solicitud (como la consulta, la actualización y la eliminación) requiere un análisis completo de la tabla, se ocupa una gran cantidad de recursos de CPU. Si encuentra COLLSCAN en el registro de consultas lentas, se realizó un análisis de tabla completa y que ocupa una gran cantidad de recursos de CPU.

      Si estas solicitudes son frecuentes, cree índices para los campos que se van a consultar.

    • docsExamined implica un análisis completo de la colección (tabla completa).

      Puede ver el valor de docsExamined para comprobar el número de documentos escaneados. Un valor mayor indica un uso más alto de la CPU.

    • Índice de escaneo de IXSCAN y keysExamined.

      Un número excesivo de índices puede afectar al rendimiento de escritura y actualización.

      Si su aplicación tiene más operaciones de escritura, crear índices puede aumentar la latencia de escritura.

      Puede ver el valor de keyExamined para ver cuántos índices se analizan en una consulta. Un valor mayor indica un uso más alto de la CPU.

      Si un índice no se crea correctamente o hay muchos resultados coincidentes, el uso de la CPU no disminuye mucho y la velocidad de ejecución es lenta.

      Ejemplo: Para los datos de una colección, el número de valores del campo a es pequeño (solo 1 y 2), pero el campo b tiene más valores.

      { a: 1, b: 1 }
      { a: 1, b: 2 }
      { a: 1, b: 3 }
      ......
      { a: 1, b: 100000} 
      { a: 2, b: 1 }
      { a: 2, b: 2 }
      { a: 2, b: 3 }
      ......
      { a: 1, y: 100000}

      A continuación se muestra cómo implementar la consulta {a: 1, b: 2}.

      db.createIndex ({a: 1}): La consulta no es efectiva porque el campo a tiene demasiados valores iguales.
      db.createIndex ({a: 1, b: 1}): La consulta no es efectiva porque el campo a tiene demasiados valores iguales.
      db.createIndex ({b: 1}): La consulta es efectiva porque el campo b tiene unos cuantos valores iguales.
      db.createIndex ({b: 1, a: 1}): La consulta no es efectiva porque el campo a tiene unos pocos valores iguales.

      Para las diferencias entre {a: 1} y {b: 1, a: 1}, véase los documentos oficiales.

    • SORT y hasSortStage pueden implicar la clasificación de una gran cantidad de datos.

      Si el valor del parámetro hasSortStage en la colección system.profile es true, la solicitud de consulta implica ordenar. Si la clasificación no se puede implementar a través de índices, los resultados de la consulta se ordenan y la clasificación es una operación intensiva de la CPU. En este escenario, debe crear índices para los campos que se ordenan con frecuencia.

      Si la colección system.profile contiene SORT, puede utilizar la indexación para mejorar la velocidad de clasificación.

    Otras operaciones, tales como la creación de índices y la agregación (combinaciones de recorrido, consulta, actualización y clasificación), también se aplican a los escenarios mencionados anteriormente porque también son operaciones intensivas en CPU. Para obtener más información sobre la creación de perfiles, consulte documentos oficiales.

Capacidad de análisis

Después del análisis y optimización de las solicitudes que se están ejecutando y las solicitudes lentas, todas las solicitudes utilizan índices adecuados, y el uso de la CPU se vuelve estable. Si el uso de CPU sigue siendo alto después del análisis y la solución de problemas, la instancia actual puede haber alcanzado el cuello de botella de rendimiento y no puede cumplir con los requisitos de servicio. En este caso, puede realizar las siguientes operaciones para resolver el problema:
  1. Vea la información de supervisión para analizar el uso de recursos de instancia. Para obtener más información, consulte Consulta de métricas de supervisión.
  2. Cambie la clase de instancia DDS o agregue nodos de shard.