Estos contenidos se han traducido de forma automática para su comodidad, pero Huawei Cloud no garantiza la exactitud de estos. Para consultar los contenidos originales, acceda a la versión en inglés.
Cómputo
Elastic Cloud Server
Bare Metal Server
Auto Scaling
Image Management Service
Dedicated Host
FunctionGraph
Cloud Phone Host
Huawei Cloud EulerOS
Redes
Virtual Private Cloud
Elastic IP
Elastic Load Balance
NAT Gateway
Direct Connect
Virtual Private Network
VPC Endpoint
Cloud Connect
Enterprise Router
Enterprise Switch
Global Accelerator
Gestión y gobernanza
Cloud Eye
Identity and Access Management
Cloud Trace Service
Resource Formation Service
Tag Management Service
Log Tank Service
Config
Resource Access Manager
Simple Message Notification
Application Performance Management
Application Operations Management
Organizations
Optimization Advisor
Cloud Operations Center
Resource Governance Center
Migración
Server Migration Service
Object Storage Migration Service
Cloud Data Migration
Migration Center
Cloud Ecosystem
KooGallery
Partner Center
User Support
My Account
Billing Center
Cost Center
Resource Center
Enterprise Management
Service Tickets
HUAWEI CLOUD (International) FAQs
ICP Filing
Support Plans
My Credentials
Customer Operation Capabilities
Partner Support Plans
Professional Services
Análisis
MapReduce Service
Data Lake Insight
CloudTable Service
Cloud Search Service
Data Lake Visualization
Data Ingestion Service
GaussDB(DWS)
DataArts Studio
IoT
IoT Device Access
Otros
Product Pricing Details
System Permissions
Console Quick Start
Common FAQs
Instructions for Associating with a HUAWEI CLOUD Partner
Message Center
Seguridad y cumplimiento
Security Technologies and Applications
Web Application Firewall
Host Security Service
Cloud Firewall
SecMaster
Data Encryption Workshop
Database Security Service
Cloud Bastion Host
Data Security Center
Cloud Certificate Manager
Blockchain
Blockchain Service
Servicios multimedia
Media Processing Center
Video On Demand
Live
SparkRTC
Almacenamiento
Object Storage Service
Elastic Volume Service
Cloud Backup and Recovery
Storage Disaster Recovery Service
Scalable File Service
Volume Backup Service
Cloud Server Backup Service
Data Express Service
Dedicated Distributed Storage Service
Contenedores
Cloud Container Engine
SoftWare Repository for Container
Application Service Mesh
Ubiquitous Cloud Native Service
Cloud Container Instance
Bases de datos
Relational Database Service
Document Database Service
Data Admin Service
Data Replication Service
GeminiDB
GaussDB
Distributed Database Middleware
Database and Application Migration UGO
TaurusDB
Middleware
Distributed Cache Service
API Gateway
Distributed Message Service for Kafka
Distributed Message Service for RabbitMQ
Distributed Message Service for RocketMQ
Cloud Service Engine
EventGrid
Dedicated Cloud
Dedicated Computing Cluster
Aplicaciones empresariales
ROMA Connect
Message & SMS
Domain Name Service
Edge Data Center Management
Meeting
AI
Face Recognition Service
Graph Engine Service
Content Moderation
Image Recognition
Data Lake Factory
Optical Character Recognition
ModelArts
ImageSearch
Conversational Bot Service
Speech Interaction Service
Huawei HiLens
Developer Tools
SDK Developer Guide
API Request Signing Guide
Terraform
Koo Command Line Interface
Distribución de contenido y cómputo de borde
Content Delivery Network
Intelligent EdgeFabric
CloudPond
Soluciones
SAP Cloud
High Performance Computing
Servicios para desarrolladores
ServiceStage
CodeArts
CodeArts PerfTest
CodeArts Req
CodeArts Pipeline
CodeArts Build
CodeArts Deploy
CodeArts Artifact
CodeArts TestPlan
CodeArts Check
Cloud Application Engine
aPaaS MacroVerse
KooPhone
KooDrive
En esta página

Consulta de detalles del servicio

Actualización más reciente 2024-09-25 GMT+08:00

Después de implementar una aplicación de IA como servicio en tiempo real, puede acceder a la página del servicio para ver sus detalles.

  1. Inicie sesión en la consola de gestión ModelArts y elija Service Deployment > Real-Time Services.
  2. En la página Real-Time Services, haga clic en el nombre del servicio de destino. Se muestra la página de detalles del servicio.

    Puede ver el nombre del servicio, el estado y otra información. Para más detalles, véase Tabla 1.

    Tabla 1 Parámetros de servicio en tiempo real

    Parámetro

    Descripción

    Name

    Nombre del servicio en tiempo real.

    Status

    Estado del servicio en tiempo real.

    Source

    Fuente de aplicación de IA del servicio en tiempo real.

    Service ID

    ID de servicio en tiempo real

    Description

    Descripción del servicio, que se puede editar después de hacer clic en el botón de edición en el lado derecho.

    Resource Pool

    Especificaciones de grupo de recursos utilizadas por el servicio. Si se utiliza el grupo de recursos públicos para el despliegue, no se muestra este parámetro.

    Custom Settings

    Configuraciones personalizadas basadas en versiones de servicio en tiempo real. Esto permite configuraciones y políticas de distribución de tráfico basadas en versiones. Active esta opción y haga clic en View Settings para personalizar la configuración. Para más detalles, véase Modificación de parámetros personalizados.

    Traffic Limit

    Número máximo de veces que se puede acceder a un servicio en un segundo.

    Runtime Log Output

    Esta función está deshabilitada por defecto. Los logs de tiempo de ejecución de los servicios en tiempo real se almacenan solo en el sistema de logs de ModelArts.

    Si esta función está habilitada, los logs de tiempo de ejecución de los servicios en tiempo real se exportarán y almacenarán en Log Tank Service (LTS). LTS crea automáticamente grupos de logs y flujos de logs y cachés ejecuta logs generados en un plazo de siete días de forma predeterminada. Para obtener más detalles sobre la función de gestión de logs LTS, véase Log Tank Service.

    NOTA:
    • Esto no se puede deshabilitar una vez que está habilitado.
    • Se le facturarán las funciones de consulta de logs y almacenamiento de logs proporcionadas por LTS. Para obtener más detalles, véase la sección Detalles de precios de LTS.

    WebSocket

    Si se debe actualizar al servicio de WebSocket.

  3. Cambie entre las pestañas de la página de detalles de un servicio en tiempo real para ver más detalles. Para más detalles, véase Tabla 2.
    Tabla 2 Detalles de un servicio en tiempo real

    Parámetro

    Descripción

    Usage Guides

    Esta página muestra la URL de la API, la información de la aplicación de IA, los parámetros de entrada y los parámetros de salida. Puede hacer clic en para copiar la URL de API para invocar al servicio. Si se admite la autenticación de aplicaciones, en las Guías de uso puede ver los detalles de URL de la API y de gestión de autorizaciones, incluidos el nombre de la aplicación, AppKey y AppSecret. También puede agregar o cancelar la autorización para una aplicación.

    Prediction

    Puede realizar la predicción en tiempo real en esta página. Para más detalles, véase Prueba del servicio desplegado.

    Configuration Updates

    Esta página muestra Current Configurations y Update History.

    • Current Configurations: nombre, versión, estado, especificaciones de nodo de cómputo, relación de tráfico, número de nodos de cómputo, intervalo de tiempo de espera de despliegue, variables de entorno, montaje de almacenamiento e información de grupo de recursos de aplicación de IA (para servicios desplegados en un grupo de recursos dedicado)
    • Update History: información histórica de aplicaciones de IA.

    Monitoring

    Esta página muestra el uso de recursos y las llamadas de aplicaciones de IA.

    • Resource Usage: incluye las CPU usadas y disponibles, la memoria y la GPU.
    • AI Application Calls: indica el número de llamadas de aplicación de IA. La recopilación de estadísticas comienza después de que el estado de la aplicación de IA cambie a Ready. (Este parámetro no se muestra para los servicios de WebSocket)

    Event

    Esta página muestra operaciones clave durante el uso del servicio, como el progreso de despliegue del servicio, causas detalladas de excepciones de despliegue y puntos en el tiempo cuando se inicia, para o modifica un servicio.

    Los eventos se guardan durante un mes y luego se borran automáticamente.

    Para obtener detalles sobre cómo ver los eventos de un servicio, véase Consulta de eventos de servicio.

    Logs

    Esta página muestra la información de log de cada aplicación de IA del servicio. Puede ver los registros generados en los últimos 5 minutos, los últimos 30 minutos, las últimas 1 hora y el segmento de tiempo definido por el usuario.

    Puede seleccionar la hora de inicio y la hora de finalización al definir el segmento de tiempo.

    Si esta función está habilitada, se mostrarán los logs almacenados en LTS. Puede hacer clic en View Complete Logs on LTS para ver todos los logs.

    Cumpla las siguientes reglas para buscar logs:

    • No introduzca cadenas que contengan los siguientes delimitadores: ,'";=() [] {}@&<>/:\n\t\r.
    • Ingrese palabras clave para la búsqueda exacta. Una palabra clave es una palabra entre dos delimitadores adyacentes.
    • Ingrese palabras clave para búsqueda difusa. Por ejemplo, puede escribir error, er?or, rro* o er*r.
    • Ingrese las frases para la búsqueda exacta. Por ejemplo, Start to refresh.
    • Antes de habilitar esta función, puede combinar las palabras clave con AND (&&) u OR (||). Por ejemplo, query logs&&erro* o query logs||erro*. Una vez habilitada esta función, se pueden combinar palabras clave con AND u OR. Por ejemplo, query logs AND erro* o query logs OR erro*.

    Tags

    Etiquetas que se han agregado al servicio. Las etiquetas se pueden agregar, modificar y eliminar.

    Para obtener más información sobre cómo usar etiquetas, véase ¿Cómo usa ModelArts etiquetas para gestionar recursos por grupo?

Modificación de parámetros personalizados

Una regla de configuración personalizada consiste en la condición de configuración (Setting), la versión de acceso (Version) y los parámetros de ejecución personalizados (incluidos Setting Name y Setting Value).

Puede configurar diferentes ajustes con parámetros de ejecución personalizados para diferentes versiones de un servicio en tiempo real.

Las prioridades de las reglas de configuración personalizadas están en orden descendente. Puede cambiar las prioridades arrastrando la secuencia de reglas de configuración personalizadas.

Una vez coincidente una regla, el sistema ya no coincidirá con las reglas posteriores. Se puede configurar un máximo de 10 reglas de configuración.

Tabla 3 Parámetros para Custom Settings

Parámetro

Obligatorio

Descripción

Setting

Expresión de la regla Spring Expression Language (SPEL). Solo se admiten las expresiones igual, coinciden y hashCode del tipo de carácter.

Version

Versión de acceso para una regla de configuración de servicio personalizada. Cuando se coincide con una regla, se solicita el servicio en tiempo real de la versión.

Setting Name

No

Clave de un parámetro de ejecución personalizado, que consta de un máximo de 128 caracteres.

Configure este parámetro si el encabezado del mensaje HTTP se utiliza para llevar parámetros de ejecución personalizados a un servicio en tiempo real.

Setting Value

No

Valor de un parámetro de ejecución personalizado, que consta de un máximo de 256 caracteres.

Configure este parámetro si el encabezado del mensaje HTTP se utiliza para llevar parámetros de ejecución personalizados a un servicio en tiempo real.

La configuración personalizada se puede utilizar en los siguientes escenarios:

  • Si se despliegan varias versiones de un servicio en tiempo real para la versión intermedia, se pueden utilizar los ajustes personalizados para distribuir el tráfico por usuario.
    Tabla 4 Variables incorporadas

    Variable incorporada

    Descripción

    DOMAIN_NAME

    Nombre de cuenta que se utiliza para invocar a una solicitud de inferencia

    DOMAIN_ID

    ID de cuenta que se utiliza para invocar a una solicitud de inferencia

    PROJECT_NAME

    Nombre del proyecto que se utiliza para invocar a una solicitud de inferencia

    PROJECT_ID

    ID de proyecto que invoca la solicitud de inferencia

    USER_NAME

    Nombre de usuario que se utiliza para invocar a una solicitud de inferencia

    USER_ID

    ID de usuario que se utiliza para invocar a una solicitud de inferencia

    La clave Pound (#) indica que se hace referencia a una variable. La string de caracteres coincidentes debe estar entre comillas simples.

    #{Built-in variable} == 'Character string'
    #{Built-in variable} matches 'Regular expression'
    • Ejemplo 1:

      Si el nombre de cuenta para invocar la solicitud de inferencia es User A, la versión especificada coincide.

      #DOMAIN_NAME == 'User A'
    • Ejemplo 2:

      Si el nombre de cuenta en la solicitud de inferencia comienza con op, la versión especificada coincide.

      #DOMAIN_NAME matches 'op.*'
      Tabla 5 Expresiones regulares comunes

      Carácter

      Descripción

      .

      Coincide con cualquier carácter, excepto \n. Para que coincida con cualquier carácter, incluido \n, utilice (.|\n).

      *

      Coincide con la subexpresión que sigue para cero o varias veces. Por ejemplo, zo* puede coincidir con z y zoo.

      +

      Coincide con la subexpresión que sigue una o varias veces. Por ejemplo, zo+ puede coincidir con zo y zoo, pero no puede igualar z.

      ?

      Coincide con la subexpresión que sigue durante cero o una vez. Por ejemplo, do(es)? puede igualar does o do en does.

      ^

      Coincide con el inicio de la string de entrada.

      $

      Coincide con el final de la string de entrada.

      {n}

      n es un entero no negativo que coincide exactamente con el número n de apariciones de una expresión. Por ejemplo, o{2} no puede coincidir con o en Bob, pero puede coincidir con dos o en food.

      x|y

      Coincide con x o y. Por ejemplo, z|food puede coincidir con z o food, y (z|f)ood puede coincidir con zood o food.

      [xyz]

      Conjuntos de caracteres, en el que se puede hacer coincidir cualquier carácter. Por ejemplo, [abc] puede coincidir con a en plain.

      Figura 1 Distribución del tráfico por usuario
  • Si se desplieguen varias versiones de un servicio en tiempo real para el inicio cerrado, se pueden usar configuraciones personalizadas para acceder a diferentes versiones a través del encabezado.
    Comience con #HEADER_ para indicar que se hace referencia al encabezado como condición.
    #HEADER_{key} == '{value}'
    #HEADER_{key} matches '{value}'
    • Ejemplo 1:

      Si el encabezado de una solicitud HTTP de inferencia contiene una versión y el valor es 0.0.1, se cumple la condición. De lo contrario, la condición no se cumple.

      #HEADER_version == '0.0.1'
    • Ejemplo 2:

      Si el encabezado de una solicitud HTTP de inferencia contiene testheader y el valor comienza con mock, la regla coincide.

      #HEADER_testheader matches 'mock.*'
    • Ejemplo 3:

      Si el encabezado de una solicitud HTTP de inferencia contiene uid y el valor del código hash cumple las condiciones descritas en el siguiente algoritmo, la regla coincide.

      #HEADER_uid.hashCode() % 100 < 10
      Figura 2 Usar el encabezado para acceder a diferentes versiones
  • Si una versión de servicio en tiempo real admite diferentes configuraciones de tiempo de ejecución, puede utilizar Setting Name y Setting Value para especificar parámetros de tiempo de ejecución personalizados para que diferentes usuarios puedan utilizar diferentes configuraciones de ejecución.

    Por ejemplo:

    Cuando el usuario A accede a la aplicación de IA, el usuario utiliza la configuración A. Cuando el usuario B accede a la aplicación de IA, el usuario utiliza la configuración B. Cuando se coincide con una configuración en ejecución, el ModelArts agrega un encabezado a la solicitud y también los parámetros de ejecución personalizados especificados por Setting Name y Setting Value.
    Figura 3 Parámetros de ejecución personalizados agregados para una regla de configuración personalizada

Utilizamos cookies para mejorar nuestro sitio y tu experiencia. Al continuar navegando en nuestro sitio, tú aceptas nuestra política de cookies. Descubre más

Comentarios

Comentarios

Comentarios

0/500

Seleccionar contenido

Enviar el contenido seleccionado con los comentarios