安装/升级Lite Server中的CES Agent插件
场景描述
在Lite Server的运维管理中,当用户发现当前操作系统镜像中预置的CES Agent版本过低,影响了CES服务的正常使用时,会面临无法通过现有手段进行升级的问题。传统的升级方式,如重新制作OS镜像或手动登录机器执行命令,不仅操作复杂、耗时长,还存在较高的误操作风险,无法满足用户对于高效、便捷运维的需求。如何在不中断业务的前提下,实现CES Agent的快速、批量升级,成为了亟待解决的问题。
为此,Lite Server引入了CES Agent安装和升级功能,通过Lite Server平台,用户可以轻松发起CES Agent的批量安装或升级任务,不仅支持指定版本的安装与升级,还大幅降低了人工干预的风险,提升了运维效率和系统的稳定性。
约束限制
当前仅支持Snt9b节点和超节点Snt9b23中的CES Agent批量安装或升级。
前提条件
该操作依赖在节点上预安装Lite Server AI插件,请通过安装Lite Server AI插件章节完成插件安装。
操作步骤
- 登录ModelArts管理控制台。
- 在左侧导航栏中,选择,进入“任务中心”。
图1 任务中心
- 单击任务中心页面左上角的“创建任务”,进入“任务模板”页面,在该页面选择“Ascend软件升级”,单击“创建任务”。
图2 任务模板
- 在Ascend软件升级创建页面,填写“任务名称”、“任务描述”,选择“任务类型”和“机型”,单击“选择节点”,在右侧节点列表弹窗中勾选节点后单击“确认”,该操作会在相应节点下发版本查询任务,以便获取真实的CES-Agent的版本信息。
表1 创建任务参数 参数分类
参数说明
任务名称
系统自动填入任务名称,用户可以自定义。
任务描述
对该任务的描述信息,方便快速查找任务。
任务类型
升级任务勾选“CES-Agent升级”卡片。
机型
支持Snt9b节点和超节点Snt9b23。
选择节点
单击“选择节点”,在右侧弹出的节点列表中,选择需要升级CES-Agent的节点。支持批量选择,也可以通过关键字搜索节点。
单击“确定”,该操作会在选择的节点内下发一个查询任务,查询节点内CES-Agent的版本。
等待查询结果刷新,该过程大约耗时1~2分钟。
选择CES-Agent版本
在下拉框中选择待升级的目标CES-Agent版本。
- 选择待升级的CES-Agent版本后,单击“下一步”,确认升级信息,单击“确认”创建,下发升级任务。升级任务下发后,大约需要五分钟完成整个升级过程。
- 升级过程中,返回“任务中心”页面,查看任务的执行状态。单击具体的任务名称,可以进入任务详情页,查看任务的详细信息和日志。
任务的执行状态为“成功”时,表示CES Agent安装或升级成功。
相关操作
CES Agent安装或升级成功后,可以监控Lite Server资源,具体请参考文档使用CES监控Lite Server NPU资源。