Lite Cluster插件概述
ModelArts提供多种类型的插件,支持通过安装插件选择性扩展Lite Cluster资源池功能,以满足业务需求。
默认安装插件
在创建专属资源池时,已默认安装的插件。

资源池默认安装的插件不支持卸载。
插件名称 |
插件简介 |
---|---|
ModelArts节点故障检测是一款监控集群节点异常事件的插件,以及对接第三方监控平台功能的组件。它是一个在每个节点上运行的守护程序,可从不同的守护进程中搜集节点问题。 |
|
CCE AI套件(Ascend NPU)是支持容器里使用huawei NPU设备的管理插件。 开通Lite Cluster资源时,仅实例规格类型选择“Ascend”时自动安装。 |
|
Volcano 是一个基于 Kubernetes 的批处理平台,提供了机器学习、深度学习、生物信息学、基因组学及其他大数据应用所需要而 Kubernetes 当下缺失的一系列特性。 |
手动安装插件
可根据业务需求,选择性安装插件用于扩展资源池功能。
插件名称 |
插件简介 |
---|---|
集群弹性引擎是一个对集群中ModelArts资源池进行进行弹性伸缩的插件。 集群弹性引擎可以根据用户配置的规则对各节点池进行扩容或者缩容。 |
插件生命周期
状态 |
状态属性 |
说明 |
---|---|---|
安装中 |
中间状态 |
插件正处于部署状态。 如遇到插件配置错误或资源不足所有实例均无法调度等情况,系统会在10分钟后将该插件置为“不可用”状态。 |
运行中 |
稳定状态 |
插件正常运行状态,所有插件实例均正常部署,插件可正常使用。 |
升级中 |
中间状态 |
插件正处于更新状态。 |
不可用 |
稳定状态 |
不可用,表示插件状态异常,插件不可使用。可单击状态查看失败原因。 |
删除中 |
中间状态 |
插件处于正在被删除的状态。 如果长时间处于该状态,则说明出现异常。 |
在插件广场搜索查看插件
在ModelArts管理控制台插件广场页面展示了丰富的插件信息,在插件广场页面可搜索查看指定插件详情,并安装插件到指定资源池。
操作 |
说明 |
操作步骤 |
---|---|---|
搜索查看插件 |
进入插件广场搜索查看指定插件。 |
登录ModelArts管理控制台,在控制台左侧导航栏中选择“插件广场”,进入“插件广场”页面。 在下拉框中可通过资源池类型过滤插件,也可在搜索框中输入关键词搜索相应的插件。 |
查看插件详情 |
在插件广场查看插件详情,包括插件简介、组件列表等信息。 |
|
安装插件 |
部分插件支持手动安装指定插件。可在插件广场安装插件。 |
|
在资源池详情页查看Lite Cluster插件
在资源池详情页的“插件”页签,执行表4中的操作。
操作 |
说明 |
操作步骤 |
---|---|---|
查看插件列表 |
查看资源池所有插件列表。在此页面,可以查看插件详情、安装插件、升级插件、卸载插件,对插件集中管理。 |
|
查看插件详情 |
查看插件详情,包括插件简介、组件列表等信息。 |
|
默认安装插件 |
创建资源池时默认安装插件,无需手动操作。 |
|
手动安装插件 |
在资源池中安装指定插件。 |
方式一: Lite Cluster资源开通时安装插件。 方式二:
|
编辑插件 |
编辑插件参数。 |
|
升级插件 |
将插件升级至新版。 |
注意:
|
卸载插件 |
将插件从资源池中卸载。卸载操作无法恢复,请谨慎操作。 |
|