文档首页 > > 用户指南> 插件管理> volcano

volcano

分享
更新时间:2021/01/12 GMT+08:00

插件简介

Volcano是一个基于Kubernetes的批处理平台,提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而Kubernetes当前缺失的一系列特性。

Volcano源自于华为云高性能批量计算解决方案,在支撑华为云一站式AI开发平台ModelArts、云容器实例CCI等服务稳定运行中发挥重要作用。Volcano提供了高性能任务调度引擎、高性能异构芯片管理、高性能任务运行管理等通用计算能力,通过接入AI、大数据、基因、渲染等诸多行业计算框架服务终端用户。(目前Volcano项目已经在Github开源)

Volcano针对计算型应用提供了作业调度、作业管理、队列管理等多项功能,主要特性包括:

  • 丰富的计算框架支持:通过CRD提供了批量计算任务的通用API,通过提供丰富的插件及作业生命周期高级管理,支持TensorFlow,MPI,Spark等计算框架容器化运行在Kubernetes上。
  • 高级调度:面向批量计算、高性能计算场景提供丰富的高级调度能力,包括成组调度,优先级抢占、装箱、资源预留、任务拓扑关系等。
  • 队列管理:支持分队列调度,提供队列优先级、多级队列等复杂任务调度能力。

项目开源地址:https://github.com/volcano-sh/volcano

约束与限制

此插件支持混合集群,集群版本需为1.13及以上版本。

安装插件

  1. CCE控制台中,单击左侧导航栏的插件管理,在插件市场页签下,单击Volcano下的“安装插件”按钮。
  2. 在安装插件页面,选择安装的集群和插件版本,单击“下一步:规格配置”
  3. Volcano插件暂未开放可配置参数,直接单击“安装”

    待插件安装完成后,单击“返回”,在“插件实例”页签下,选择对应的集群,可查看到运行中的实例,这表明该插件已在当前集群的各节点中安装。

卸载插件

  1. CCE控制台中,单击左侧导航栏的“插件管理”,在“插件实例”页签下,选择对应的集群,单击Volcano下的“卸载”
  2. 在弹出的窗口中,单击“是”,可卸载该插件。

版本记录

表1 Volcano版本记录

插件版本

支持的集群类型

更新时间

更新特性

1.2.1

混合集群 v1.13.*|v1.15.*

鲲鹏集群 v1.13.*|v1.15.*

2020/08/21

  • 安全增强
  • Volcano作业零副本支持
  • 边缘计算场景支持

1.1.2

混合集群 v1.13.*|v1.15.*

鲲鹏集群 v1.13.*|v1.15.*

2020/11/19

解决极端情况下Tensorflow作业OOM的问题。

1.1.0

混合集群 v1.13.*|v1.15.*

鲲鹏集群 v1.13.*|v1.15.*

2020/05/26

  • 支持GPU调度功能
  • 支持作业扩缩容功能
  • 支持Linux ARM平台

1.0.4

混合集群 v1.13.*|v1.15.*

鲲鹏集群 v1.13.*|v1.15.*

2020/11/06

解决1.0.3版本升级问题(仅限1.0.3版本)

1.0.3

混合集群 v1.13.*

2019/11/18

Volcano是一个基于Kubernetes的批处理平台,提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要的而 Kubernetes当下缺失的一系列特性。

1.0.0

混合集群 v1.13.*

2019/08/14

kube-batch是一个kubernetes的调度器,提供批量调度工作负载的能力。

分享:

    相关文档

    相关产品

文档是否有解决您的问题?

提交成功!非常感谢您的反馈,我们会继续努力做到更好!
反馈提交失败,请稍后再试!

*必选

请至少选择或填写一项反馈信息

字符长度不能超过200

提交反馈 取消

如您有其它疑问,您也可以通过华为云社区问答频道来与我们联系探讨

智能客服提问云社区提问