文档首页/ AI开发平台ModelArts/ 常见问题/ Standard推理部署/ ModelArts在线服务预测时,如何提高预测速度?
更新时间:2025-08-14 GMT+08:00

ModelArts在线服务预测时,如何提高预测速度?

  • 部署在线服务时,您可以选择性能更好的“实例规格”提高预测速度。例如使用GP资源代替CPU资源。
  • 部署在线服务时,您可以增加“实例数”

    如果实例数设置为1,表示后台的计算模式是单机模式;如果实例数设置大于1,表示后台的计算模式为分布式的。您可以根据实际需求进行选择。

  • 推理速度与模型复杂度强相关,您可以尝试优化模型提高预测速度。

    ModelArts中提供了模型版本管理的功能,方便溯源和模型反复调优。