Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Centro de ayuda/ ModelArts/ Preguntas frecuentes/ Despliegue del servicio/ Servicios en tiempo real/ ¿Cómo relleno el encabezado de solicitud y el cuerpo de solicitud de una solicitud de inferencia cuando se está ejecutando un servicio en tiempo real?
Actualización más reciente 2023-10-09 GMT+08:00

¿Cómo relleno el encabezado de solicitud y el cuerpo de solicitud de una solicitud de inferencia cuando se está ejecutando un servicio en tiempo real?

Síntoma

Después de desplegar un servicio en tiempo real, puede obtener su dirección de solicitud de inferencia en la ficha Usage Guides de la página de detalles del servicio cuando el servicio se está ejecutando. Sin embargo, no hay ninguna instrucción para rellenar la cabecera y el cuerpo de una solicitud de inferencia.

Causa posible

La dirección de solicitud de inferencia en la pestaña Usage Guides de la página de detalles del servicio puede ser llamada para inferencia. Por motivos de seguridad, ModelArts toma medidas de autenticación y autorización para evitar llamadas no autorizadas al servicio en tiempo real. Por lo tanto, la cabecera de una solicitud de predicción contiene la información de identidad del iniciador de solicitud, y el cuerpo contiene el contenido a predecir.

El encabezado debe autenticarse siguiendo las reglas de autenticación de Huawei Cloud. El cuerpo debe configurarse en función de los requisitos del modelo, como los requisitos de los scripts de preprocesamiento o las imágenes personalizadas.

Solución

  • Encabezado:

    En la pestaña Usage Guides de la página de detalles del servicio, puede obtener un máximo de dos direcciones API, una para la autenticación de IAM o AK/SK y la otra para la autenticación de aplicaciones. La estructura de encabezado varía dependiendo del modo de autenticación.

    • Autenticación de IAM o AK/SK: En el encabezado, introduzca el token de nivel de dominio del tenant en la región de destino en el campo X-Auth-Token. Para obtener más información, consulte Obtención de un token de usuario con la autenticación de contraseña.
    • Autenticación de aplicaciones: la autenticación de aplicaciones se puede clasificar como autenticación de AppCode y autenticación de firma de aplicaciones.
      • Para la autenticación de AppCode, introduzca el AppCode de la aplicación asociada al servicio en tiempo real en el campo X-Apig-AppCode del encabezado.
      • Para la autenticación de firma de aplicación, en el encabezado, introduzca los valores X-Sdk-Date y Authorization generados mediante AppKey y AppSecret de la aplicación asociada al servicio en tiempo real a través del SDK o herramienta para autenticar la firma de la solicitud. Para obtener más información, consulte Acceso autenticado mediante una aplicación.
  • Cuerpo:

    El cuerpo varía dependiendo de la fuente del modelo.

    • Si el modelo se importa desde una imagen de contenedor, el cuerpo debe configurarse en función de los requisitos de imagen personalizada. Para obtener más información, póngase en contacto con el creador de la imagen.
    • Si el modelo se importa desde OBS, los requisitos en el cuerpo se reflejan en el preprocesamiento del código de inferencia, que convertirá el cuerpo HTTP de entrada en la entrada requerida por el modelo. Para obtener más información, consulte Especificaciones para codificación de inferencia de modelo.
    • Si el modelo se obtiene de AI Gallery, compruebe la descripción de la invocación en AI Gallery o consulte al proveedor del modelo.

Resumen y Sugerencias

Nada