更新时间:2024-10-28 GMT+08:00

服务预测请求体大小限制是多少?

服务部署完成且服务处于运行中后,可以往该服务发送推理的请求,请求的内容根据模型的不同可以是文本,图片,语音,视频等内容。

当使用调用指南页签中显示的调用地址(华为云APIG网关服务的地址)预测时,对请求体的大小限制是12MB,超过12MB时,请求会被拦截。

如果是从ModelArts console的预测页签进行的预测,由于console的网络链路的不同,此时要求请求体的大小不超过8MB。

因此,尽量避免请求体大小超限。如果有高并发的大流量推理请求,请提工单联系专业服务支持。