更新时间:2025-05-14 GMT+08:00

请求模式

解释说明

创建模型时,通过选择请求模式定义模型支持部署成哪种请求服务。

  • 同步请求

    单次推理可同步返回结果(约<60s)。例如图片、较小视频文件。

  • 异步请求

    单次推理需要异步处理返回结果(约>60s)。例如实时视频推理、大视频文件。

当部署类型选择为“在线服务”时,才支持异步请求模式。

元模型来源为“从对象存储服务(OBS)中选择”(AI引擎为Custom)和“从容器镜像中选择”时,才支持异步请求模式。