更新时间:2024-05-22 GMT+08:00
分享

资源池介绍

ModelArts资源池说明

在使用ModelArts进行AI开发时,您可以选择使用如下两种资源池:

  • 专属资源池:专属资源池不与其他用户共享,资源更可控。在使用专属资源池之前,您需要先创建一个专属资源池,然后在AI开发过程中选择此专属资源池。其中专属资源池分为弹性集群和弹性裸金属。
    • 弹性集群:分为Standard弹性集群与Lite弹性集群。其中:
      • Standard弹性集群提供独享的计算资源,使用Modelarts开发平台的训练作业、部署模型以及开发环境时,通过Standard弹性集群的计算资源进行实例下发。
        • 物理资源池:
        • 逻辑资源池:用户可以直接购买逻辑池,与物理资源池的主要区别为:1)逻辑池支持单卡售卖。 2)逻辑池仅支持训练作业。 3)逻辑池不支持和租户的VPC网络打通。当前仅部分HCSO局点支持逻辑资源池功能。
        • 逻辑子池:逻辑子池为白名单功能,用户可以在ModelArts Standard专属资源池上拆分出逻辑子池,并设置每个子池的资源配额,包括保留配额和配额上线。拆分出逻辑子池后,训练、推理和开发环境的任务投递,需要投递在逻辑子池上,并受逻辑子池的配额约束,满足配额约束的任务才能被投递运行。
      • Lite弹性集群面向k8s资源型用户,提供托管式k8s集群,并预装主流AI开发插件以及自研的加速插件,以云原生方式直接向用户提供AI Native的资源、任务等能力,用户可以直接操作资源池中的节点和k8s集群。请参见弹性集群k8s Cluster
    • 弹性裸金属:弹性裸金属提供不同型号的xPU裸金属服务器,您可以通过弹性公网IP进行访问,在给定的操作系统镜像上可以自行安装GPU&NPU相关的驱动和其他软件,使用SFS或OBS进行数据存储和读取相关的操作,满足算法工程师进行日常训练的需要。请参见弹性裸金属DevServer
  • 公共资源池:公共资源池提供公共的大规模计算集群,根据用户作业参数分配使用,资源按作业隔离。 用户下发训练作业、部署模型、使用开发环境实例等,均可以使用ModelArts提供的公共资源池完成,按照使用量计费,方便快捷。

专属资源池和公共资源池的能力差异

  • 专属资源池为用户提供独立的计算集群、网络,不同用户间的专属资源池物理隔离,公共资源池仅提供逻辑隔离,专属资源池的隔离性、安全性要高于公共资源池。
  • 专属资源池用户资源独享,在资源充足的情况下,作业是不会排队的;而公共资源池使用共享资源,在任何时候都有可能排队。
  • 专属资源池支持打通用户的网络,在该专属资源池中运行的作业可以访问打通网络中的存储和资源。例如,在创建训练作业时选择打通了网络的专属资源池,训练作业创建成功后,支持在训练时访问SFS中的数据。
  • 专属资源池支持自定义物理节点运行环境相关的能力,例如GPU/Ascend驱动的自助升级,而公共资源池暂不支持。
分享:

    相关文档

    相关产品