Informes de alarmas del directorio de caché de notebook
Al crear una instancia de notebook, puede seleccionar recursos de CPU, GPU o Ascend en función del volumen de datos del servicio. Si selecciona recursos de GPU o de Ascend, ModelArts monta los discos duros en el directorio de caché. Puede utilizar este directorio para almacenar archivos temporales.
Por defecto, no se generan alarmas de capacidad para el directorio de caché de la instancia de notebook. Si se supera el límite de capacidad, se reiniciará la instancia de notebook. Después del reinicio, se restablecen varias configuraciones, lo que descarta los datos y pierde el entorno. Esto afectará su experiencia. Se recomienda habilitar el monitoreo y las alarmas para el uso del directorio de caché y reportar los datos a AOM.
Proceso de configuración
- Ingrese la información básica de las alarmas.
- Configure una regla de alarmas.
- Configure las métricas de monitoreo.
- Configure las condiciones de activación de alarmas.
- Configure las notificaciones de alarmas.
- Cree un tema, configure la política de temas y suscríbase al tema.
- Cree una regla de acción de alarmas.
- Seleccione la regla de acción creada.
Configuración de ajustes de alarmas
- Inicie sesión en la consola de AOM.
- Seleccione Alarm Center > Alarm Rules y haga clic en Create Alarm Rule.
- Ingrese la información básica de las alarmas.
- Establezca una regla de alarma.
Rule Type: seleccione Threshold alarm.
Monitored Object: seleccione Select resource objects. Haga clic en Select Resource Object. Aparecerá un nuevo cuadro de diálogo.
- Add By: seleccione Dimension.
- Metric Name: haga clic en Custom Metrics y seleccione las métricas de caché que desea supervisar. Ejemplo: ma_container_notebook_cache_dir_size_bytes (tamaño total del directorio caché) y ma_container_notebook_cache_dir_util (uso del directorio caché)
- Dimension: seleccione una dimensión métrica, por ejemplo service_id:xxx y haga clic en Confirm.
Después de configurar el objeto monitoreado, configure Statistic y Statistical Period.
Alarm Condition: configure este parámetro en función de sus necesidades.
Figura 1 Selección de objeto monitoreado
Figura 2 Configuración del método de estadísticas
Figura 3 Configuración de condiciones de alarma
- Configure las notificaciones de alarmas y haga clic en Create Now.
Alarm Mode: seleccione Direct Alarm Reporting.
Action Rule: actívelo y seleccione la regla de acción creada. Si las reglas de acción de alarmas existentes no pueden satisfacer sus requerimientos, haga clic en Create Rule para crear una regla de acción. Para obtener más detalles, véase Creación de una regla de acción de alarma.
Notification: Habilite esta opción.
Figura 4 Configuración de notificaciones de alarma
Cree un tema en SMN para configurar las reglas de notificación de alarmas.
- Creación de un tema
- Vaya a la consola de SMN. En el panel de navegación, seleccione Topic Management > Topics.
- Haga clic en Create Topic. Introduzca un nombre de tema, seleccione un proyecto empresarial y haga clic en OK.
- Localice el tema de destino y seleccione More > Configure Topic Policy en la columna Operation.
Seleccione APM para permitir que las alarmas de AOM activen SMN.
Figura 5 Configurar política de temas
- Haga clic en Add Subscription en la columna Operation del tema. Una vez que la suscripción es exitosa, se recibe una notificación una vez que se cumplen las condiciones de alarma.
Seleccione un protocolo, como correo electrónico o SMS, e introduzca los puntos de conexión, como direcciones de correo electrónico o números de teléfono móvil. Haga clic en OK.
Se muestra un registro en la lista de suscripción, pero el registro se encuentra en estado Unconfirmed.
Después de recibir el correo electrónico, confirme la suscripción.
Luego, la suscripción se encuentra en estado confirmado.
- Creación de una regla de acción de alarmas
Una regla de acción especifica cómo AOM le notifica cuando se activa una alarma. Una vez habilitada una regla de acción de alarmas, el sistema envía notificaciones basadas en el tema de SMN asociado y la plantilla de mensajes.
Introduzca el nombre de la regla de acción, seleccione el tipo de regla de acción, seleccione el tema creado en el paso anterior, seleccione una plantilla de mensaje y haga clic en Confirm.
Figura 6 Crear regla de acción de alarma
- Creación de un tema
En el área Alarm Notification de la página Create Alarm Rule, configure Action Rule en la regla de acción de alarmas recién creada y haga clic en Create Now.
Una vez finalizada la configuración, recibirá una notificación por correo electrónico una vez que se cumplan las condiciones de alarma.