更新时间:2025-09-05 GMT+08:00
分享

Lite Server节点一键式压测

场景描述

Lite Server任务中心提供一键式的压测能力,用户无需深入理解AICore,HBM等软件栈,即可自助快捷地在Lite Server产品页面上完成业务压测诉求。支持对昇腾服务器的带宽测试、算力测试、功耗测试、诊断压测等,为AI训练、推理等高负载场景提供硬件保障,同时可批量在多台服务器上均可并行,大幅度提升效率。

约束限制

  • 当前仅支持Ascend Snt9b和Ascend Snt9b23节点。
  • 创建任务的节点需要安装NodeTaskHub插件, 请在创建任务前确保插件安装完毕,具体参见安装Lite Server AI插件
  • 同一时间节点上最多同时支持一个压测任务,任务开始后无法中断, 请您规划好任务优先级。
  • 请确保待压测节点无业务运行,压测过程中的命令执行可能导致当前业务中断或异常。
  • 执行压测前需安装Ascend HDK23.0.0及以后的版本的MCU、驱动和固件,预置操作系统已经默认安装,如果是自定义操作系统,也需确保该软件正常安装。
  • 压测任务依赖开发套件包Ascend-docker-runtime,预置操作系统已经默认安装该软件,如果是自定义操作系统,也需确保该软件正常安装。

操作步骤

  1. 登录ModelArts管理控制台
  2. 在左侧导航栏中,选择资源管理 > 轻量算力节点 (Lite Server),进入“任务中心”
    图1 任务中心

  3. 单击任务中心页面左上角的“创建任务”,进入“任务模板”页面,在该页面选择“Ascend压测任务”,单击“创建任务”
    图2 任务模板

  4. 在昇腾压测任务创建页面,填写“任务名称”“任务信息”,选择“机型”“节点类型”,选择“压测用例”,勾选使用须知并单击“立即创建”
    表1 创建任务参数

    参数分类

    参数说明

    任务名称

    系统自动填入压测任务名称,用户可以自定义。

    任务描述

    对该任务的描述信息,方便快速查找任务。

    机型

    仅支持Ascend Snt9b和Ascend Snt9b23两种机型。

    节点类型

    支持选择“单节点”“整柜节点”,具体节点信息支持通过关键字搜索。

    压测用例

    支持选择以下压测用例。压测用例可以单个执行,也可以同时执行。

    • AICore压测:对AICore ERROR进行压力测试,并输出诊断结果,AICore压测需要占用HOST服务器侧约20~40GB的内存,执行命令前请预留足够内存,防止进程异常中断。
    • HBM压测:对高带宽内存进行压力测试,并输出压测结果。
    • P2P压测:测试节点上所有Device之间的HCCS通信链路是否存在硬件故障。
  5. 返回“任务中心”页面,显示任务的执行状态。

  6. 单击具体的任务名称,可以进入到任务详情页,查看任务的详细信息。
    图3 任务详情

  7. 在任务详情页,单击“查看日志”,在页面右侧弹窗中查看任务执行的详细日志信息。
    图4 查看日志

相关文档