更新时间:2026-06-30 GMT+08:00
分享

创建模型调优训练作业

模型调优训练作业是指对已有模型的微调。模型有“具身广场-模型”(系统预置模型)和“空间资产-模型”(仅支持用户创建自定义的模型)两类。

约束限制

当前lerobot-libero数据集仅支持LeRobot_WALL-OSS-Base模型。

创建模型调优训练作业(基于具身广场-模型)

  1. 登录CloudRobo控制台
  2. 在左侧菜单栏中单击“模型开发 > 模型训练”,进入“模型训练”页面。
  3. 单击右上角“创建训练作业”,进入创建页面,参照如下参数说明配置相关信息。

    表1 创建模型调优训练作业参数说明

    参数

    说明

    基础信息

    作业名称

    模型训练作业的名称。

    命名规则:由中文、数字、字母、下划线(_)、中划线(-)、点(.)、斜线(/)组成,长度为3~64个字符。

    描述(可选)

    训练作业的简介。

    长度为512个字符以内。

    训练配置

    训练方式

    选择“模型调优”方式。

    模型调优指对已有模型的微调。

    模型

    选择“具身广场-模型”。

    说明:

    在训练镜像中,输入模型通过系统内置的环境变量 ${MODEL_MAP} 获取对应的本地目录。

    • 输入模型根路径环境变量为${MODEL}, e.g. /tmp/data/model。
    • 输入模型到本地目录的环境变量为${MODEL_MAP}, e.g.{"modelInfo":"/tmp/data/model"}。

    调优方式

    系统会根据您选择模型自动显示调优方式,请根据实际情况自行选择调优方式。

    如果选择的模型提供配套算法,则需配置“调优方式”。

    算法

    用户通过算法设置模型的调优方式。

    如果选择的模型没有提供配套算法,用户自定义算法。算法支持“空间资产-算法”和“现在配置”2种方式。

    • 空间资产-算法:单击在弹出来的窗口中选择算法,也可以单击“创建算法”去空间资产自定义算法(参考创建自定义算法章节操作)后再进行选择。
    • 现在配置:在当前页面自定义算法,算法不存入空间资产。

    数据设置(仅当模型提供配套算法才需要进行数据设置)

    数据

    选择模型数据。

    • 预置数据:单击在弹出来的窗口中选择预置数据。
    • 空间资产-数据:单击在弹出来的窗口中选择空间资产-数据。
    • 对象存储服务OBS:单击OBS存储数据路径下的数据。
      说明:
      • 不支持选择跨区域(Region)的OBS桶。如果您的OBS桶中有需要特别保护的敏感数据,请自行对数据加密后再存放到OBS桶。
      • 只能选择当前工作空间下的默认存储位置OBS路径下的文件夹,不能选择到具体文件。

    环境配置(仅当模型没有提供配套算法才需进行环境配置)

    镜像

    选择训练需要的容器镜像。

    代码目录

    执行本次训练作业所需的代码目录。

    勾选“代码目录”,单击右侧的,选择训练代码文件所在的OBS目录。

    需要提前将代码上传至OBS桶中,目录内文件总大小必须小于或等于5GB,文件数必须小于或等于1000个,文件深度必须小于或等于32。如果使用预训练模型,请将其放置在代码目录下。

    说明:
    • 如果您的OBS桶中有需要特别保护的敏感数据,请自行对数据加密后再存放到OBS桶。
    • 只能选择当前工作空间下的默认存储位置OBS路径下的文件夹,不能选择到具体文件。

    启动命令

    镜像的启动命令。

    运行训练作业时,当“代码目录”下载完成后,“启动命令”会被自动执行。
    • 如果训练启动脚本用的是py文件,例如“train.py”,则启动命令如下所示。
      python ${MA_JOB_DIR}/demo-code/train.py
    • 如果训练启动脚本用的是sh文件,例如“main.sh”,则启动命令如下所示。
      bash ${MA_JOB_DIR}/demo-code/main.sh

    启动命令支持使用“;”“&&”拼接多条命令,命令中的“demo-code”为存放代码目录的最后一级OBS目录,以实际情况为准。

    本地代码目录

    用于指定训练容器中代码的本地目录,启动训练时系统会将代码目录中的文件下载至此目录下,下载内容为代码目录的最小子目录。

    资源配置

    资源池类型

    选择资源池类型,支持公共资源池和专属资源池。

    • 专属资源池:专属资源池不与其他用户共享,资源更可控。在使用专属资源池之前,您需要先创建专属资源池,然后在开发过程中选择此专属资源池。专属资源池的创建可通过订阅CloudRobo具身智能开发平台基础版或专业版纳管资源完成。不同方式创建的专属资源池应用场景有所不同,请以实际界面展示为准。
    说明:

    选择的预置模型、镜像、数据如果是被保护的资产,为非公开资产,无法提交到专属资源池训练,则用户无法选择“专属资源池”类型。

    • 公共资源池:公共资源池提供公共的大规模计算集群,根据用户作业参数分配使用,资源按作业隔离。用户下发训练作业、部署模型、使用开发环境实例等情况下,均可以使用公共资源池完成。开通账号并申请公测后即可使用CloudRobo的公共资源池。

    专属资源池

    当“资源池”选择“专属资源池”时,显示此参数。

    请在下拉列表选择该业务拥有的专属资源池。

    实例规格

    下拉选择资源池类型对应的实例规格。

    实例数

    输入实例数值。输入值默认为1。

    超参配置

    超参用于训练调优。

    界面默认显示选中的模型调优方式对应的内置算法中的预置超参,用户也可根据实际业务需求修改超参值。如果无内置算法,则用户根据实际业务需求配置超参。

    • 单击“添加”,添加超参信息,总数不超过90条。
    • 如不需要可单击删除。

    环境变量

    界面默认显示选中的模型调优方式对应的内置算法中预置环境变量,用户也可根据实际业务需求配置环境变量的参数名称、值。

    • 单击“添加”,添加环境变量信息,总数不超过90条。
    • 如不需要可单击删除。
    说明:

    为了确保您的数据安全,在环境变量中,请勿输入敏感信息,如明文密码。

    输入输出(仅当配置了“算法”需进行输入输出配置)

    输入

    单击“添加”,配置训练作业输入信息,最多可添加10个。

    • 参数名称

      算法代码需要通过“输入”的“参数名称”去读取训练的输入数据。

      建议设置为“data_url”。训练输入参数要与所选算法的“输入”参数匹配。

    • 输入路径类型

      下拉选择输入路径类型,支持来源“OBS存储”、“预置数据”、“空间资产-数据”、“空间资产-模型”四种类型。

    • 输入路径

      单击“输入路径”右侧的,在弹窗中选择输入路径。

      训练启动时,系统将自动下载输入路径中的数据到训练运行容器。

    • 获取方式

      以参数名称为“data_path”的训练输入为例,说明获取方式的作用。

      • 当参数的“获取方式”为“超参”时,可以参考如下代码来读取数据。
        import argparseparser = argparse.ArgumentParser() parser.add_argument('--data_path') args, unknown = parser.parse_known_args() data_path = args.data_path 
      • 当参数的“获取方式”为“环境变量”时,可以参考如下代码来读取数据。
        import osdata_path = os.getenv("data_path", "")
    • 容器本地路径:数据输入的容器本地路径。

      本地路径不支持修改,此路径由系统自动设置。

    输出

    单击“添加”,配置训练作业输出信息,最多可添加5个。

    • 参数名称

      算法代码需要通过“输出”“参数名称”去读取训练的输出目录。

      建议设置为“train_url”。训练输出参数要与所选算法的“输出”参数匹配。

    • 输出路径

      单击“输出路径”参数右侧的,从OBS桶中选择训练输出数据的存储位置。文件总大小必须小于或等于1GB,文件数必须小于或等于128个,单个文件大小必须小于或等于128MB。

      训练过程中,系统将自动从训练容器的本地代码目录下同步文件到数据存储位置。

      输出数据的存储位置仅支持OBS存储。为避免和训练输入数据存储冲突,建议选择一个空目录用作输出数据存储位置。

    • 获取方式

      以参数名称为“train_url”的训练输出为例,说明获取方式的作用。

      • 当参数的“获取方式”为“超参”时,可以参考如下代码来读取数据。
        import argparse
        parser = argparse.ArgumentParser()
        parser.add_argument('--train_url')
        args, unknown = parser.parse_known_args()
        train_url = args.train_url 
      • 当参数的“获取方式”为“环境变量”时,可以参考如下代码来读取数据。
        import os
        train_url = os.getenv("train_url", "")
    • 容器本地路径:数据输入通道映射的容器本地路径。

      “输出”的本地路径不支持修改,此路径由系统自动设置。

    训练产物

    说明:

    请确保在训练镜像中,将模型的训练产物保存至系统内置的环境变量 ${RESULT} 指定的本地目录。系统检测到该目录内容后,将自动将其上传到模型资产中。

    保存方式

    设置训练产物的保存方式,模型训练的最终产物将发布至空间资产-模型

    • 当“保存方式”设置为“新模型”时,可自定义新模型的名称。模型训练的最终产物将发布至空间资产-模型
    • 当“保存方式”设置为“已有模型新版本”时,下拉选择已有的模型(当“保存方式”设置为“新模型”时产生的模型)。模型训练的最终产物将发布至空间资产-模型
    • 当“保存方式”设置为“不发布”时,模型训练的最终产物将不发布至空间资产-模型

    模型名称

    选择调优后产生的新模型的名称。

    模型名称长度范围为3~64个字符,由中文、数字、字母、下划线(_)、中划线(-)、点(.)、斜线(/)组成。

    说明:

    当“保存方式”设置为“不发布”该字段无效。

    模型版本号

    填写新模型版本号。

    当保存为“已有模型新版本”时,填写的模型版本号不能和该模型已有的版本号重复,如未填写版本号时,模型版本号会自动新增一个版本。

    模型版本号长度范围为2~128个字符,以字母或数字开头,仅支持大小写字母、数字、中划线(-)、点号(.)、下划线(_)。

    说明:

    当“保存方式”设置为“不发布”该字段无效。

    模型类型

    系统自动匹配模型类型,不可修改。

    新模型的模型类型,需要与源模型的模型类型保持一致。

    说明:

    当“保存方式”设置为“不发布”该字段无效。

    模型优势技能

    指模型经过训练后,在各项能力中表现相对优异、可作为该模型优势能力的技能。

    单击“添加”,配置模型优势技能。需配置“技能名称”和“prompt”信息。

    • 技能名称:仅支持中文、大小写字母、数字、中划线(-)、下划线(_),不能以空格开头和结尾,长度为1~64个字符。
    • prompt:长度在 1~1024个字符之间的字符串。

    如不需要可单击删除。最多添加50个模型优势技能。

    说明:
    • 如果选择的模型类型是“操作模型”和“导航模型”,才需配置模型优势技能,其他类模型则无需配置。
    • 当“保存方式”设置为“不发布”该字段无效。

    仅执行模型优势技能

    开启是否仅执行模型优势技能。

    开启后,部署后的模型服务在智能体调试时仅能执行当前的模型优势技能。未开启则默认可执行模型的全部技能。

    说明:

    仅添加了“模型优势技能”时有效。

  4. 单击“立即创建”,模型训练作业创建完成。

    创建完成后,系统自动返回模型训练列表页面,等待一段时间后,状态为“运行中”即为创建成功。

创建模型调优训练作业(基于空间资产-模型)

  1. 登录CloudRobo控制台
  2. 在左侧菜单栏中单击“模型开发 > 模型训练”,进入“模型训练”页面。
  3. 单击右上角“创建训练作业”,进入创建页面,参照如下参数说明配置相关信息。

    表2 创建模型调优训练作业参数说明

    参数

    说明

    基础信息

    作业名称

    模型训练作业的名称。

    命名规则:由中文、数字、字母、下划线(_)、中划线(-)、点(.)、斜线(/)组成,长度为3~64个字符。

    描述(可选)

    训练作业的简介。

    长度为512个字符以内。

    训练配置

    训练方式

    选择“模型调优”方式。

    模型调优指对已有模型的微调。

    模型

    选择“空间资产-模型”。

    说明:

    如果选择的模型是在“空间资产 > 模型”菜单中由用户创建的模型,在训练镜像中,输入模型通过系统内置的环境变量 ${MODEL_MAP} 获取对应的本地目录。

    • 输入模型根路径环境变量为${MODEL}, e.g. /tmp/data/model。
    • 输入模型到本地目录的环境变量为${MODEL_MAP}, e.g.{"modelInfo":"/tmp/data/model"}。

    调优方式

    系统会根据您选择模型自动显示调优方式,请根据实际情况自行选择调优方式。

    说明:

    如果选择的模型是在“空间资产 > 模型”菜单中由用户创建的模型,则在界面需配置“调优方式”参数,选择其他模型则在界面需配置“调优方式”参数。

    算法

    用户通过算法设置模型的调优方式。系统会根据您选择的模型来决定是否需要配置算法,算法支持“空间资产-算法”和“现在配置”2种方式。

    • 空间资产-算法:单击在弹出来的窗口中选择算法,也可以单击“创建算法”去空间资产自定义算法(参考创建自定义算法章节操作)后再进行选择。
    • 现在配置:在当前页面自定义算法,不存入空间资产-算法。
    说明:

    如果选择的模型是在“空间资产 > 模型”菜单中由用户创建的模型,则在界面需配置“算法”参数,选择其他模型则在界面无需配置“算法”参数。

    数据设置(仅当设置了“调优方式”参数才需进行数据设置)

    数据

    选择模型数据。

    • 预置数据:单击在弹出来的窗口中选择预置数据。
    • 空间资产-数据:单击在弹出来的窗口中选择空间资产-数据。
    • 对象存储服务OBS:单击OBS存储数据路径下的数据。
      说明:
      • 不支持选择跨区域(Region)的OBS桶。如果您的OBS桶中有需要特别保护的敏感数据,请自行对数据加密后再存放到OBS桶。
      • 只能选择当前工作空间下的默认存储位置OBS路径下的文件夹,不能选择到具体文件。

    资源配置

    资源池类型

    选择资源池类型,支持公共资源池和专属资源池。

    • 专属资源池:专属资源池不与其他用户共享,资源更可控。在使用专属资源池之前,您需要先创建专属资源池,然后在开发过程中选择此专属资源池。专属资源池的创建可通过订阅CloudRobo具身智能开发平台基础版或专业版纳管资源完成。不同方式创建的专属资源池应用场景有所不同,请以实际界面展示为准。
    说明:

    选择的模型、数据如果是被保护的资产,为非公开资产,无法提交到专属资源池训练,则用户无法选择“专属资源池”类型。

    • 公共资源池:公共资源池提供公共的大规模计算集群,根据用户作业参数分配使用,资源按作业隔离。用户下发训练作业、部署模型、使用开发环境实例等情况下,均可以使用公共资源池完成。开通账号并申请公测后即可使用CloudRobo的公共资源池。

    专属资源池

    当“资源池”选择“专属资源池”时,显示此参数。

    请在下拉列表选择该业务拥有的专属资源池。

    实例规格

    下拉选择资源池类型对应的实例规格。

    实例数

    输入实例数值。输入值默认为1。

    超参配置

    超参用于训练调优。

    如果选择的模型为具身广场-模型迭代训练后生成的模型,界面默认显示该模型调优方式对应的内置算法中的预置超参,用户也可根据实际业务需求修改超参值;如选择其他模型,用户可根据实际业务需求配置超参。

    • 单击“添加”,添加超参信息,总数不超过90条。
    • 如不需要可单击删除。

    环境配置(仅当设置了“算法”参数才需进行环境配置)

    镜像

    选择训练需要的容器镜像。

    代码目录

    执行本次训练作业所需的代码目录。

    勾选“代码目录”,单击右侧的,选择训练代码文件所在的OBS目录。

    需要提前将代码上传至OBS桶中,目录内文件总大小必须小于或等于5GB,文件数必须小于或等于1000个,文件深度必须小于或等于32。如果使用预训练模型,请将其放置在代码目录下。

    说明:
    • 如果您的OBS桶中有需要特别保护的敏感数据,请自行对数据加密后再存放到OBS桶。
    • 只能选择当前工作空间下的默认存储位置OBS路径下的文件夹,不能选择到具体文件。

    启动命令

    镜像的启动命令。

    运行训练作业时,当“代码目录”下载完成后,“启动命令”会被自动执行。
    • 如果训练启动脚本用的是py文件,例如“train.py”,则启动命令如下所示。
      python ${MA_JOB_DIR}/demo-code/train.py
    • 如果训练启动脚本用的是sh文件,例如“main.sh”,则启动命令如下所示。
      bash ${MA_JOB_DIR}/demo-code/main.sh

    启动命令支持使用“;”“&&”拼接多条命令,命令中的“demo-code”为存放代码目录的最后一级OBS目录,以实际情况为准。

    本地代码目录

    用于指定训练容器中代码的本地目录,启动训练时系统会将代码目录中的文件下载至此目录下,下载内容为代码目录的最小子目录。

    环境变量

    如果选择的模型为具身广场-模型迭代训练后生成的模型,界面默认该模型调优方式对应的内置算法中预置环境变量,用户也可根据实际业务需求配置环境变量;如选择其他模型,用户则需根据实际业务需求配置环境变量。

    • 单击“添加”,添加环境变量信息,总数不超过90条。
    • 如不需要可单击删除。
    说明:

    为了确保您的数据安全,在环境变量中,请勿输入敏感信息,如明文密码。

    输入输出(仅当配置了“算法”需进行输入输出配置)

    输入

    单击“添加”,配置训练作业输入信息,最多可添加10个。

    • 参数名称

      算法代码需要通过“输入”的“参数名称”去读取训练的输入数据。

      建议设置为“data_url”。训练输入参数要与所选算法的“输入”参数匹配。

    • 输入路径类型

      下拉选择输入路径类型,支持来源“OBS存储”、“预置数据”、“空间资产-数据”、“空间资产-模型”四种类型。

    • 输入路径

      单击“输入路径”右侧的,在弹窗中选择输入路径。

      训练启动时,系统将自动下载输入路径中的数据到训练运行容器。

    • 获取方式

      以参数名称为“data_path”的训练输入为例,说明获取方式的作用。

      • 当参数的“获取方式”为“超参”时,可以参考如下代码来读取数据。
        import argparseparser = argparse.ArgumentParser() parser.add_argument('--data_path') args, unknown = parser.parse_known_args() data_path = args.data_path 
      • 当参数的“获取方式”为“环境变量”时,可以参考如下代码来读取数据。
        import osdata_path = os.getenv("data_path", "")
    • 容器本地路径:数据输入的容器本地路径。

      本地路径不支持修改,此路径由系统自动设置。

    输出

    单击“添加”,配置训练作业输出信息,最多可添加5个。

    • 参数名称

      算法代码需要通过“输出”“参数名称”去读取训练的输出目录。

      建议设置为“train_url”。训练输出参数要与所选算法的“输出”参数匹配。

    • 输出路径

      单击“输出路径”参数右侧的,从OBS桶中选择训练输出数据的存储位置。文件总大小必须小于或等于1GB,文件数必须小于或等于128个,单个文件大小必须小于或等于128MB。

      训练过程中,系统将自动从训练容器的本地代码目录下同步文件到数据存储位置。

      输出数据的存储位置仅支持OBS存储。为避免和训练输入数据存储冲突,建议选择一个空目录用作输出数据存储位置。

    • 获取方式

      以参数名称为“train_url”的训练输出为例,说明获取方式的作用。

      • 当参数的“获取方式”为“超参”时,可以参考如下代码来读取数据。
        import argparse
        parser = argparse.ArgumentParser()
        parser.add_argument('--train_url')
        args, unknown = parser.parse_known_args()
        train_url = args.train_url 
      • 当参数的“获取方式”为“环境变量”时,可以参考如下代码来读取数据。
        import os
        train_url = os.getenv("train_url", "")
    • 容器本地路径:数据输入通道映射的容器本地路径。

      “输出”的本地路径不支持修改,此路径由系统自动设置。

    训练产物

    说明:

    如果选择的模型是在“空间资产 > 模型”菜单中由用户创建的模型,请确保在训练镜像中,将该模型的训练产物保存至系统内置的环境变量 ${RESULT} 指定的本地目录。系统检测到该目录内容后,将自动将其上传到模型资产中。

    保存方式

    设置训练产物的保存方式。

    • 当“保存方式”设置为“新模型”时,可自定义新模型的名称。模型训练的最终产物将发布至空间资产-模型
    • 当“保存方式”设置为“已有模型新版本”时,下拉选择已有的模型(下拉选项值为当“保存方式”设置为“新模型”时产生的模型)。模型训练的最终产物将发布至空间资产-模型
    • 当“保存方式”设置为“不发布”时,模型训练的最终产物将不发布至空间资产-模型

    模型名称

    设置调优后产生的新模型的名称。当“保存方式”设置为“不发布”该字段无效。

    模型名称长度范围为3~64个字符,由中文、数字、字母、下划线(_)、中划线(-)、点(.)、斜线(/)组成。

    说明:

    当“保存方式”设置为“不发布”该字段无效。

    模型版本号

    填写新模型版本号。

    当保存为“已有模型新版本”时,填写的模型版本号不能和该模型已有的版本号重复,如未填写版本号时,模型版本号会自动新增一个版本。当“保存方式”设置为“不发布”该字段无效。

    模型版本号长度范围为2~128个字符,以字母或数字开头,仅支持大小写字母、数字、中划线(-)、点号(.)、下划线(_)。

    说明:

    当“保存方式”设置为“不发布”该字段无效。

    模型类型

    系统自动匹配模型类型,不可修改。当“保存方式”设置为“不发布”该字段无效。

    新模型的模型类型,需要与源模型的模型类型保持一致。

    说明:

    当“保存方式”设置为“不发布”该字段无效。

    模型优势技能

    指模型经过训练后,在各项能力中表现相对优异、可作为该模型优势能力的技能。

    单击“添加”,配置模型优势技能。需配置“技能名称”和“prompt”信息。

    • 技能名称:仅支持中文、大小写字母、数字、中划线(-)、下划线(_),不能以空格开头和结尾,长度为1~64个字符。
    • prompt:长度在 1~1024个字符之间的字符串。

    如不需要可单击删除。最多添加50个模型优势技能。

    说明:
    • 如果选择的模型类型是“操作模型”和“导航模型”,才需配置模型优势技能,其他类模型则无需配置。
    • 当“保存方式”设置为“不发布”该字段无效。

    仅执行模型优势技能

    开启是否仅执行模型优势技能。

    开启后,部署后的模型服务在智能体调试时仅能执行当前的模型优势技能。未开启则默认可执行模型的全部技能。

    说明:

    仅添加了“模型优势技能”时有效。

  4. 单击“立即创建”,模型训练作业创建完成。

    创建完成后,系统自动返回模型训练列表页面,等待一段时间后,状态为“运行中”即为创建成功。

相关文档