Alto uso de CPU
Si el uso de la CPU alcanza el 80%, existe un cuello de botella de la CPU. En este caso, la lectura y escritura de datos son lentas, afectando sus servicios.
A continuación se describe cómo analizar las consultas lentas actuales. Después del análisis y la optimización, se mejorará el rendimiento de las consultas y se utilizarán los índices de manera más eficiente.
Análisis de consultas actuales
- Conéctese a una instancia mediante Mongo Shell.
Para acceder a una instancia a través de una red privada, consulte:
- Ejecute el siguiente comando para ver las operaciones que se realizan en la base de datos:
Salida del comando:
{ "raw" : { "shard0001" : { "inprog" : [ { "desc" : "StatisticsCollector", "threadId" : "140323686905600", "active" : true, "opid" : 9037713, "op" : "none", "ns" : "", "query" : { }, "numYields" : 0, "locks" : { }, "waitingForLock" : false, "lockStats" : { } }, { "desc" : "conn2607", "threadId" : "140323415066368", "connectionId" : 2607, "client" : "172.16.36.87:37804", "appName" : "MongoDB Shell", "active" : true, "opid" : 9039588, "secs_running" : 0, "microsecs_running" : NumberLong(63), "op" : "command", "ns" : "admin.", "query" : { "currentOp" : 1 }, "numYields" : 0, "locks" : { }, "waitingForLock" : false, "lockStats" : { } } ], "ok" : 1 }, ... }
- client: dirección IP del cliente que envía la solicitud
- opid: ID de operación única
- secs_running: tiempo transcurrido para la ejecución, en segundos. Si el valor devuelto de este campo es demasiado grande, compruebe si la solicitud es razonable.
- microsecs_running: tiempo transcurrido para la ejecución, en segundos. Si el valor devuelto de este campo es demasiado grande, compruebe si la solicitud es razonable.
- op: tipo de operación. Las operaciones pueden ser consulta, inserción, actualización, eliminación o comando.
- ns: colección de destino
- Para obtener más información, consulte el comando db.currentOp() en el documento oficial.
- Basado en la salida del comando, compruebe si hay solicitudes que tardan mucho tiempo en procesarse.
Si el uso de CPU es bajo mientras se procesan los servicios, pero luego se vuelve alto durante solo ciertas operaciones, analice las solicitudes que tardan mucho tiempo en ejecutarse.
Si se encuentra una consulta anormal, busque el opid correspondiente a la operación y ejecute db.killOp(opid) para matarlo.
Análisis de consultas lentas
El perfil de consulta lento está habilitado para DDS de forma predeterminada. El sistema registra automáticamente cualquier consulta cuya ejecución tarda más de 500 ms en la colección system.profile en la base de datos correspondiente. Podrá hacer lo siguiente:
- Conéctese a una instancia mediante Mongo Shell.
Para acceder a una instancia desde Internet
Para más detalles, consulteTo access an instance that is not publicly accessible
- Seleccione una base de datos específica (usando la base de datos de test como ejemplo):
use test
- Compruebe si se han recopilado consultas SQL lentas en system.profile.
show collections;
- Si la salida del comando incluye system.profile, se han generado consultas SQL lentas. Vaya al siguiente paso.
mongos> show collections system.profile test
- Si el resultado del comando no contiene system.profile, no se han generado consultas SQL lentas y no se requiere un análisis de consultas lento.
mongos> show collections test
- Si la salida del comando incluye system.profile, se han generado consultas SQL lentas. Vaya al siguiente paso.
- Compruebe los registros de consultas lentos en la base de datos.
- Analice los registros de consultas lentos para encontrar la causa del alto uso de CPU.
A continuación se muestra un ejemplo de un registro de consulta lento. El registro muestra una solicitud que escaneaba toda la tabla, incluidos los documentos de 1,561,632 y sin utilizar un índice de búsqueda.
{ "op" : "query", "ns" : "taiyiDatabase.taiyiTables$10002e", "query" : { "find" : "taiyiTables", "filter" : { "filed19" : NumberLong("852605039766") }, "shardVersion" : [ Timestamp(1, 1048673), ObjectId("5da43185267ad9c374a72fd5") ], "chunkId" : "10002e" }, "keysExamined" : 0, "docsExamined" : 1561632, "cursorExhausted" : true, "numYield" : 12335, "locks" : { "Global" : { "acquireCount" : { "r" : NumberLong(24672) } }, "Database" : { "acquireCount" : { "r" : NumberLong(12336) } }, "Collection" : { "acquireCount" : { "r" : NumberLong(12336) } } }, "nreturned" : 0, "responseLength" : 157, "protocol" : "op_command", "millis" : 44480, "planSummary" : "COLLSCAN", "execStats" : { "stage" : "SHARDING_FILTER", [3/1955] "nReturned" : 0, "executionTimeMillisEstimate" : 43701, "works" : 1561634, "advanced" : 0, "needTime" : 1561633, "needYield" : 0, "saveState" : 12335, "restoreState" : 12335, "isEOF" : 1, "invalidates" : 0, "chunkSkips" : 0, "inputStage" : { "stage" : "COLLSCAN", "filter" : { "filed19" : { "$eq" : NumberLong("852605039766") } }, "nReturned" : 0, "executionTimeMillisEstimate" : 43590, "works" : 1561634, "advanced" : 0, "needTime" : 1561633, "needYield" : 0, "saveState" : 12335, "restoreState" : 12335, "isEOF" : 1, "invalidates" : 0, "direction" : "forward", "docsExamined" : 1561632 } }, "ts" : ISODate("2019-10-14T10:49:52.780Z"), "client" : "172.16.36.87", "appName" : "MongoDB Shell", "allUsers" : [ { "user" : "__system", "db" : "local" } ], "user" : "__system@local" }
Las siguientes etapas pueden ser causas de una consulta lenta:
- COLLSCAN implica una exploración completa de la colección (tabla completa).
Cuando una solicitud (como la consulta, la actualización y la eliminación) requiere un análisis completo de la tabla, se ocupa una gran cantidad de recursos de CPU. Si encuentra COLLSCAN en el registro de consultas lentas, se realizó un análisis de tabla completa y que ocupa una gran cantidad de recursos de CPU.
Si estas solicitudes son frecuentes, cree índices para los campos que se van a consultar.
- docsExamined implica un análisis completo de la colección (tabla completa).
Puede ver el valor de docsExamined para comprobar el número de documentos escaneados. Un valor mayor indica un uso más alto de la CPU.
- Índice de escaneo de IXSCAN y keysExamined.
Un número excesivo de índices puede afectar al rendimiento de escritura y actualización.
Si su aplicación tiene más operaciones de escritura, crear índices puede aumentar la latencia de escritura.
Puede ver el valor de keyExamined para ver cuántos índices se analizan en una consulta. Un valor mayor indica un uso más alto de la CPU.
Si un índice no se crea correctamente o hay muchos resultados coincidentes, el uso de la CPU no disminuye mucho y la velocidad de ejecución es lenta.
Ejemplo: Para los datos de una colección, el número de valores del campo a es pequeño (solo 1 y 2), pero el campo b tiene más valores.
{ a: 1, b: 1 } { a: 1, b: 2 } { a: 1, b: 3 } ...... { a: 1, b: 100000} { a: 2, b: 1 } { a: 2, b: 2 } { a: 2, b: 3 } ...... { a: 1, y: 100000}
A continuación se muestra cómo implementar la consulta {a: 1, b: 2}.
db.createIndex ({a: 1}): La consulta no es efectiva porque el campo a tiene demasiados valores iguales.
db.createIndex ({a: 1, b: 1}): La consulta no es efectiva porque el campo a tiene demasiados valores iguales.
db.createIndex ({b: 1}): La consulta es efectiva porque el campo b tiene unos cuantos valores iguales.
db.createIndex ({b: 1, a: 1}): La consulta no es efectiva porque el campo a tiene unos pocos valores iguales.
Para las diferencias entre {a: 1} y {b: 1, a: 1}, véase los documentos oficiales.
- SORT y hasSortStage pueden implicar la clasificación de una gran cantidad de datos.
Si el valor del parámetro hasSortStage en la colección system.profile es true, la solicitud de consulta implica ordenar. Si la clasificación no se puede implementar a través de índices, los resultados de la consulta se ordenan y la clasificación es una operación intensiva de la CPU. En este escenario, debe crear índices para los campos que se ordenan con frecuencia.
Si la colección system.profile contiene SORT, puede utilizar la indexación para mejorar la velocidad de clasificación.
Otras operaciones, tales como la creación de índices y la agregación (combinaciones de recorrido, consulta, actualización y clasificación), también se aplican a los escenarios mencionados anteriormente porque también son operaciones intensivas en CPU. Para obtener más información sobre la creación de perfiles, consulte documentos oficiales.
- COLLSCAN implica una exploración completa de la colección (tabla completa).
Capacidad de análisis
- Vea la información de supervisión para analizar el uso de recursos de instancia. Para obtener más información, consulte Consulta de métricas de supervisión.
- Cambie la clase de instancia DDS o agregue nodos de shard.