更新时间:2025-07-30 GMT+08:00
分享

部署静态应用

  1. 完成创建静态应用操作后,在画布右上角单击“画布部署”,并参考表1进行部署画布。
    图1 画布部署
    表1 部署参数说明

    参数名称

    说明

    部署方式

    服务的部署类型,支持边缘部署。

    服务名称

    部署服务的名称。

    架构类型

    部署的资源池架构类型,与实际算法的架构相关。

    资源池

    选择部署的资源池。支持专属资源池和边缘资源池。若需要使用Ascend卡,当前支持推理卡类型为Snt3p。

    负载均衡

    边缘部署使用的负载均衡。算法包边缘部署仅支持负载均衡访问方式,负载均衡包含HTTPS和HTTP两种请求类型。

    CPU

    部署需要使用的最小CPU值(物理核),默认1Core。越复杂的模型通常需要更多的计算资源,可以考虑增加CPU的数量;如果服务需要处理大量的并发请求,建议增加CPU数量。但不能超过资源池中的可用CPU数。

    内存

    部署需要使用的最小内存值,默认1024MB。模型越大、处理数据越多,需要的内存也就越大。可以依据实际模型情况和待处理的数据量情况进行调整。

    Ascend

    部署使用的npu卡数量。Ascend设备通常用于深度学习模型的加速,当模型支持在Ascend上运行,且资源池中包含Ascend资源时,才可以进行配置,确保分配的Ascend数量在资源池范围内。当前支持推理卡类型为Snt3p,单卡算力为70T FLOPS@fp16,加载不同推理模型所消耗的算力资源不同,需要卡数的计算公式为:卡数量≈总算力/卡算力。计算得到的卡数量可以向上取整后作为参数取值。

    若资源池进行过算力切分,此处的卡数量表示的是逻辑卡数。若资源池没有经过算力切分,则表示为物理卡数。例如,物理卡切分成了7份,那一个逻辑卡的算力就是10T FLOPS@fp16。

    环境变量

    用户在组件代码中定义的外部环境变量。

    如果使用视频解码、视频抽帧类算法,CPU和内容推荐设置为4CPU,8092M内存,若算法需要使用Ascend设备运行,可将数量设置为1。CPU、内存、Ascend取值大小与用户所使用的算法相关、处理的数据量相关,请按算法实际运行所依赖的资源要求进行设置。

  2. 图2 画布调试
  3. 部署完成后,单击画布右上角“画布服务”按钮,进入画布服务列表页面。
    图3 画布服务列表
  4. 单击服务名称跳转进入服务详情页面,可查看当前服务详情信息。
  5. 通过服务列表页面可以删除画布服务。
    图4 删除画布服务

相关文档