Lite Server节点参数面网络配置
场景描述
Lite Server任务中心提供一键式的系统配置能力,用户可自助快捷地在Lite Server产品页面上完成参数面网络配置诉求。通过优化服务器参数(如RoCE网络上行端口、参数面网络IP)等,以满足训练/推理场景基本需求,并提升服务器性能,同时可批量在多台服务器上均可并行,大幅度提升效率。
约束限制
- 当前仅支持Snt9b节点和超节点Snt9b23。
- 创建任务的节点需要安装NodeTaskHub插件, 请在创建任务前确保插件安装完毕,具体参见安装Lite Server AI插件。
- 同一时间节点上最多同时支持一个任务,任务开始后无法中断, 请您规划好任务优先级。
- 请确保目标节点无业务运行,执行任务过程中可能会导致当前业务中断或异常。
- 执行任务前需安装Ascend HDK23.0.0及以后的版本的MCU、驱动和固件,预置操作系统已经默认安装,如果是自定义操作系统,也需确保该软件正常安装。
- 执行任务依赖开发套件包Ascend-docker-runtime,预置操作系统已经默认安装该软件,如果是自定义操作系统,也需确保该软件正常安装。
操作步骤
- 登录ModelArts管理控制台。
- 在左侧导航栏中,选择,进入“任务中心”。
图1 任务中心
- 单击任务中心页面左上角的“创建任务”,进入“任务模板”页面,在该页面选择“Ascend系统配置”,单击“创建任务”。
图2 任务模板
- 在Ascend系统配置任务创建页面,填写“任务名称”、“任务描述”,选择“机型”,选择“配置项”,勾选使用须知并单击“立即创建”。
表1 创建任务参数 参数分类
参数说明
任务名称
系统自动填入任务名称,用户可以自定义。
任务描述
对该任务的描述信息,方便快速查找任务。
机型
选择机型,并在节点列表中勾选节点。具体节点信息支持通过关键字搜索。
支持Snt9b节点和超节点Snt9b23。
配置项
参数面网络配置:优化RoCE网络上行端口配置,并调整参数面网络参数,确保参数面网络IP地址、子网掩码及网关等配置准确。
- 返回“任务中心”页面,查看任务的执行状态。
- 单击具体的任务名称,可以进入任务详情页,查看任务的详细信息。
图3 任务详情
- 在任务详情页,单击“查看日志”,在页面右侧弹窗中查看任务执行的详细日志信息。
图4 查看日志