文档首页/ 魔坊（ModelArts）模型训推平台/ 常见问题/ 推理部署（旧版）/ ModelArts在线服务预测时，如何提高预测速度？

更新时间：2026-02-05 GMT+08:00

ModelArts在线服务预测时，如何提高预测速度？

部署在线服务时，您可以选择性能更好的“实例规格”提高预测速度。例如使用GP资源代替CPU资源。
部署在线服务时，您可以增加“实例数”。
如果实例数设置为1，表示后台的计算模式是单机模式；如果实例数设置大于1，表示后台的计算模式为分布式的。您可以根据实际需求进行选择。
推理速度与模型复杂度强相关，您可以尝试优化模型提高预测速度。
ModelArts中提供了模型版本管理的功能，方便溯源和模型反复调优。

父主题： 推理部署（旧版）

相关文档

意见反馈

文档内容是否对您有帮助？

有帮助没帮助

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

云宝助手提问云社区提问