创建模型调优训练作业

模型调优训练作业是指对已有模型的微调。模型有“具身广场-模型”（系统预置模型）和“空间资产-模型”（仅支持用户创建自定义的模型）两类。

创建模型调优训练作业（基于具身广场-模型）

登录CloudRobo控制台。
在左侧菜单栏中单击“模型开发 > 模型训练”，进入“模型训练”页面。

单击右上角“创建训练作业”，进入创建页面，参照如下参数说明配置相关信息。

表1 创建模型调优训练作业参数说明
参数	说明
基础信息
作业名称	设置训练作业的名称，建议使用具有业务含义的名称以便于识别。命名规则：由中文、数字、字母、下划线（_）、连字符（-）、点（.）、斜线（/）组成，长度为3~64个字符。
描述（可选）	训练作业的简介。长度为512个字符以内。
训练配置
训练方式	选择“模型调优”方式。模型调优指对已有模型的微调。
模型	选择“具身广场-模型”。说明：在训练镜像中，输入模型通过系统内置的环境变量 ${MODEL_MAP} 获取对应的本地目录。输入模型根路径环境变量为${MODEL}, e.g. /tmp/data/model。输入模型到本地目录的环境变量为${MODEL_MAP}, e.g.{"modelInfo":"/tmp/data/model"}。
调优方式	系统会根据您选择的模型自动显示调优方式，请根据实际情况自行选择调优方式。如果选择的模型提供配套算法，则需配置“调优方式”。
算法	用户通过算法设置模型的调优方式。如果选择的模型没有提供配套算法，用户自定义算法。算法支持“空间资产-算法”和“现在配置”2种方式。空间资产-算法：单击在弹出来的窗口中选择算法，也可以单击“创建算法”去空间资产自定义算法（参考创建自定义算法章节操作）后再进行选择。现在配置：在当前页面自定义算法，算法不存入空间资产。
数据设置（仅当模型提供配套算法才需要进行数据设置）
数据	选择模型数据。预置数据：单击在弹出来的窗口中选择预置数据。空间资产-数据：单击在弹出来的窗口中选择空间资产-数据。对象存储服务OBS：单击OBS存储数据路径下的数据。说明：不支持选择跨区域（Region）的OBS桶。如果您的OBS桶中有需要特别保护的敏感数据，请自行对数据加密后再存放到OBS桶。只能选择当前工作空间下的默认存储位置OBS路径下的文件夹，不能选择到具体文件。
环境配置（仅当模型没有提供配套算法才需进行环境配置）
镜像	选择训练需要的容器镜像。
代码目录	执行本次训练作业所需的代码目录。勾选“代码目录”，单击右侧的，选择训练代码文件所在的OBS目录。需要提前将代码上传至OBS桶中，目录内文件总大小必须小于或等于5GB，文件数必须小于或等于1000个，文件深度必须小于或等于32。如果使用预训练模型，请将其放置在代码目录下。说明：如果您的OBS桶中有需要特别保护的敏感数据，请自行对数据加密后再存放到OBS桶。只能选择当前工作空间下的默认存储位置OBS路径下的文件夹，不能选择到具体文件。
启动命令	镜像的启动命令。运行训练作业时，当“代码目录”下载完成后，“启动命令”会被自动执行。如果训练启动脚本用的是py文件，例如“train.py”，则启动命令如下所示。 python ${MA_JOB_DIR}/demo-code/train.py 如果训练启动脚本用的是sh文件，例如“main.sh”，则启动命令如下所示。 bash ${MA_JOB_DIR}/demo-code/main.sh 启动命令支持使用“;”和“&&”拼接多条命令，命令中的“demo-code”为存放代码目录的最后一级OBS目录，以实际情况为准。
本地代码目录	用于指定训练容器中代码的本地目录，启动训练时系统会将代码目录中的文件下载至此目录下，下载内容为代码目录的最小子目录。
资源配置
资源池类型	选择资源池类型，支持“公共资源池”和“专属资源池”。专属资源池：专属资源池不与其他用户共享，资源更可控。在使用专属资源池之前，您需要先创建专属资源池，然后在开发过程中选择此专属资源池。专属资源池的创建可通过订阅CloudRobo具身智能开发平台基础版或专业版或纳管资源完成。不同方式创建的专属资源池应用场景有所不同，请以实际界面展示为准。说明：选择的预置模型、镜像、数据如果是被保护的资产，为非公开资产，无法提交到专属资源池训练，则用户无法选择“专属资源池”类型。公共资源池：公共资源池提供公共的大规模计算集群，根据用户作业参数分配使用，资源按作业隔离。用户下发训练作业、部署模型、使用开发环境实例等情况下，均可以使用公共资源池完成。开通账号并申请公测后即可使用CloudRobo的公共资源池。
专属资源池	当“资源池”选择“专属资源池”时，显示此参数。请在下拉列表选择该业务拥有的专属资源池。
实例规格	下拉选择资源池类型对应的实例规格。
实例数	输入实例数值。输入值默认为1。
超参配置
超参用于训练调优。界面默认显示选中的模型调优方式对应的内置算法中的预置超参，用户也可根据实际业务需求修改超参值。如果无内置算法，则用户根据实际业务需求配置超参。单击“添加”，添加超参信息，总数不超过90条。如不需要可单击删除。
环境变量
界面默认显示选中的模型调优方式对应的内置算法中预置环境变量，用户也可根据实际业务需求配置环境变量的参数名称、值。单击“添加”，添加环境变量信息，总数不超过90条。如不需要可单击删除。说明：为了确保您的数据安全，在环境变量中，请勿输入敏感信息，如明文密码。
输入输出（仅当配置了“算法”需进行输入输出配置）
输入	单击“添加”，配置训练作业输入信息，最多可添加10个。参数名称算法代码需要通过“输入”的“参数名称”去读取训练的输入数据。建议设置为“data_url”。训练输入参数要与所选算法的“输入”参数匹配。输入路径类型下拉选择输入路径类型，支持来源“OBS存储”、“预置数据”、“空间资产-数据”、“空间资产-模型”四种类型。输入路径单击“输入路径”右侧的，在弹窗中选择输入路径。训练启动时，系统将自动下载输入路径中的数据到训练运行容器。获取方式以参数名称为“data_path”的训练输入为例，说明获取方式的作用。当参数的“获取方式”为“超参”时，可以参考如下代码来读取数据。 import argparseparser = argparse.ArgumentParser() parser.add_argument('--data_path') args, unknown = parser.parse_known_args() data_path = args.data_path 当参数的“获取方式”为“环境变量”时，可以参考如下代码来读取数据。 import osdata_path = os.getenv("data_path", "") 容器本地路径：数据输入的容器本地路径。本地路径不支持修改，此路径由系统自动设置。
输出	单击“添加”，配置训练作业输出信息，最多可添加5个。参数名称算法代码需要通过“输出”的“参数名称”去读取训练的输出目录。建议设置为“train_url”。训练输出参数要与所选算法的“输出”参数匹配。输出路径单击“输出路径”参数右侧的，从OBS桶中选择训练输出数据的存储位置。文件总大小必须小于或等于1GB，文件数必须小于或等于128个，单个文件大小必须小于或等于128MB。训练过程中，系统将自动从训练容器的本地代码目录下同步文件到数据存储位置。输出数据的存储位置仅支持OBS存储。为避免和训练输入数据存储冲突，建议选择一个空目录用作输出数据存储位置。获取方式以参数名称为“train_url”的训练输出为例，说明获取方式的作用。当参数的“获取方式”为“超参”时，可以参考如下代码来读取数据。 import argparse parser = argparse.ArgumentParser() parser.add_argument('--train_url') args, unknown = parser.parse_known_args() train_url = args.train_url 当参数的“获取方式”为“环境变量”时，可以参考如下代码来读取数据。 import os train_url = os.getenv("train_url", "") 容器本地路径：数据输入通道映射的容器本地路径。 “输出”的本地路径不支持修改，此路径由系统自动设置。
训练产物说明：请确保在训练镜像中，将模型的训练产物保存至系统内置的环境变量 ${RESULT} 指定的本地目录。系统检测到该目录内容后，将自动将其上传到模型资产中。
保存方式	设置训练产物的保存方式，模型训练的最终产物将发布至空间资产-模型。当“保存方式”设置为“新模型”时，可自定义新模型的名称。模型训练的最终产物将发布至空间资产-模型。当“保存方式”设置为“已有模型新版本”时，下拉选择已有的模型（当“保存方式”设置为“新模型”时产生的模型）。模型训练的最终产物将发布至空间资产-模型。当“保存方式”设置为“不发布”时，模型训练的最终产物将不发布至空间资产-模型。
模型名称	选择调优后产生的新模型的名称。模型名称长度范围为3~64个字符，由中文、数字、字母、下划线（_）、连字符（-）、点（.）、斜线（/）组成。说明：当“保存方式”设置为“不发布”该字段无效。
模型版本号	填写新模型版本号。当保存为“已有模型新版本”时，填写的模型版本号不能和该模型已有的版本号重复，如未填写版本号时，模型版本号会自动新增一个版本。模型版本号长度范围为2~128个字符，以字母或数字开头，仅支持大小写字母、数字、连字符（-）、点号（.）、下划线（_）。说明：当“保存方式”设置为“不发布”该字段无效。
模型类型	系统自动匹配模型类型，不可修改。新模型的模型类型，需要与源模型的模型类型保持一致。说明：当“保存方式”设置为“不发布”该字段无效。
模型优势技能	指模型经过训练后，在各项能力中表现相对优异、可作为该模型优势能力的技能。单击“添加”，配置模型优势技能。需配置“技能名称”和“prompt”信息。技能名称：仅支持中文、大小写字母、数字、连字符（-）、下划线（_），不能以空格开头和结尾，长度为1~64个字符。 prompt：长度在 1~1024个字符之间的字符串。如不需要可单击删除。最多添加50个模型优势技能。说明：如果选择的模型类型是“操作模型”和“导航模型”，才需配置模型优势技能，其他类模型则无需配置。当“保存方式”设置为“不发布”该字段无效。
仅执行模型优势技能	开启是否仅执行模型优势技能。开启后，部署后的模型服务在智能体调试时仅能执行当前的模型优势技能。未开启则默认可执行模型的全部技能。说明：仅添加了“模型优势技能”时有效。

单击“立即创建”，模型训练作业创建完成。

创建完成后，系统自动返回模型训练列表页面，等待一段时间后，状态为“运行中”即为创建成功。

创建模型调优训练作业（基于空间资产-模型）

登录CloudRobo控制台。
在左侧菜单栏中单击“模型开发 > 模型训练”，进入“模型训练”页面。

单击右上角“创建训练作业”，进入创建页面，参照如下参数说明配置相关信息。

表2 创建模型调优训练作业参数说明
参数	说明
基础信息
作业名称	设置训练作业的名称，建议使用具有业务含义的名称以便于识别。命名规则：由中文、数字、字母、下划线（_）、连字符（-）、点（.）、斜线（/）组成，长度为3~64个字符。
描述（可选）	训练作业的简介。长度为512个字符以内。
训练配置
训练方式	选择“模型调优”方式。模型调优指对已有模型的微调。
模型	选择“空间资产-模型”。说明：如果选择的模型是在“空间资产 > 模型”菜单中由用户创建的模型，在训练镜像中，输入模型通过系统内置的环境变量 ${MODEL_MAP} 获取对应的本地目录。输入模型根路径环境变量为${MODEL}, e.g. /tmp/data/model。输入模型到本地目录的环境变量为${MODEL_MAP}, e.g.{"modelInfo":"/tmp/data/model"}。
调优方式	系统会根据您选择模型自动显示调优方式，请根据实际情况自行选择调优方式。说明：如果选择的模型是在“空间资产 > 模型”菜单中由用户创建的模型，则在界面无需配置“调优方式”参数，选择其他模型则在界面需配置“调优方式”参数。
算法	用户通过算法设置模型的调优方式。系统会根据您选择的模型来决定是否需要配置算法，算法支持“空间资产-算法”和“现在配置”2种方式。空间资产-算法：单击在弹出来的窗口中选择算法，也可以单击“创建算法”去空间资产自定义算法（参考创建自定义算法章节操作）后再进行选择。现在配置：在当前页面自定义算法，不存入空间资产-算法。说明：如果选择的模型是在“空间资产 > 模型”菜单中由用户创建的模型，则在界面需配置“算法”参数，选择其他模型则在界面无需配置“算法”参数。
数据设置（仅当设置了“调优方式”参数才需进行数据设置）
数据	选择模型数据。预置数据：单击在弹出来的窗口中选择预置数据。空间资产-数据：单击在弹出来的窗口中选择空间资产-数据。对象存储服务OBS：单击OBS存储数据路径下的数据。说明：不支持选择跨区域（Region）的OBS桶。如果您的OBS桶中有需要特别保护的敏感数据，请自行对数据加密后再存放到OBS桶。只能选择当前工作空间下的默认存储位置OBS路径下的文件夹，不能选择到具体文件。
资源配置
资源池类型	选择资源池类型，支持“公共资源池”和“专属资源池”。专属资源池：专属资源池不与其他用户共享，资源更可控。在使用专属资源池之前，您需要先创建专属资源池，然后在开发过程中选择此专属资源池。专属资源池的创建可通过订阅CloudRobo具身智能开发平台基础版或专业版或纳管资源完成。不同方式创建的专属资源池应用场景有所不同，请以实际界面展示为准。说明：选择的模型、数据如果是被保护的资产，为非公开资产，无法提交到专属资源池训练，则用户无法选择“专属资源池”类型。公共资源池：公共资源池提供公共的大规模计算集群，根据用户作业参数分配使用，资源按作业隔离。用户下发训练作业、部署模型、使用开发环境实例等情况下，均可以使用公共资源池完成。开通账号并申请公测后即可使用CloudRobo的公共资源池。
专属资源池	当“资源池”选择“专属资源池”时，显示此参数。请在下拉列表选择该业务拥有的专属资源池。
实例规格	下拉选择资源池类型对应的实例规格。
实例数	输入实例数值。输入值默认为1。
超参配置
超参用于训练调优。如果选择的模型为具身广场-模型迭代训练后生成的模型，界面默认显示该模型调优方式对应的内置算法中的预置超参，用户也可根据实际业务需求修改超参值；如选择其他模型，用户可根据实际业务需求配置超参。单击“添加”，添加超参信息，总数不超过90条。如不需要可单击删除。
环境配置（仅当设置了“算法”参数才需进行环境配置）
镜像	选择训练需要的容器镜像。
代码目录	执行本次训练作业所需的代码目录。勾选“代码目录”，单击右侧的，选择训练代码文件所在的OBS目录。需要提前将代码上传至OBS桶中，目录内文件总大小必须小于或等于5GB，文件数必须小于或等于1000个，文件深度必须小于或等于32。如果使用预训练模型，请将其放置在代码目录下。说明：如果您的OBS桶中有需要特别保护的敏感数据，请自行对数据加密后再存放到OBS桶。只能选择当前工作空间下的默认存储位置OBS路径下的文件夹，不能选择到具体文件。
启动命令	镜像的启动命令。运行训练作业时，当“代码目录”下载完成后，“启动命令”会被自动执行。如果训练启动脚本用的是py文件，例如“train.py”，则启动命令如下所示。 python ${MA_JOB_DIR}/demo-code/train.py 如果训练启动脚本用的是sh文件，例如“main.sh”，则启动命令如下所示。 bash ${MA_JOB_DIR}/demo-code/main.sh 启动命令支持使用“;”和“&&”拼接多条命令，命令中的“demo-code”为存放代码目录的最后一级OBS目录，以实际情况为准。
本地代码目录	用于指定训练容器中代码的本地目录，启动训练时系统会将代码目录中的文件下载至此目录下，下载内容为代码目录的最小子目录。
环境变量
如果选择的模型为具身广场-模型迭代训练后生成的模型，界面默认该模型调优方式对应的内置算法中预置环境变量，用户也可根据实际业务需求配置环境变量；如选择其他模型，用户则需根据实际业务需求配置环境变量。单击“添加”，添加环境变量信息，总数不超过90条。如不需要可单击删除。说明：为了确保您的数据安全，在环境变量中，请勿输入敏感信息，如明文密码。
输入输出（仅当配置了“算法”需进行输入输出配置）
输入	单击“添加”，配置训练作业输入信息，最多可添加10个。参数名称算法代码需要通过“输入”的“参数名称”去读取训练的输入数据。建议设置为“data_url”。训练输入参数要与所选算法的“输入”参数匹配。输入路径类型下拉选择输入路径类型，支持来源“OBS存储”、“预置数据”、“空间资产-数据”、“空间资产-模型”四种类型。输入路径单击“输入路径”右侧的，在弹窗中选择输入路径。训练启动时，系统将自动下载输入路径中的数据到训练运行容器。获取方式以参数名称为“data_path”的训练输入为例，说明获取方式的作用。当参数的“获取方式”为“超参”时，可以参考如下代码来读取数据。 import argparseparser = argparse.ArgumentParser() parser.add_argument('--data_path') args, unknown = parser.parse_known_args() data_path = args.data_path 当参数的“获取方式”为“环境变量”时，可以参考如下代码来读取数据。 import osdata_path = os.getenv("data_path", "") 容器本地路径：数据输入的容器本地路径。本地路径不支持修改，此路径由系统自动设置。
输出	单击“添加”，配置训练作业输出信息，最多可添加5个。参数名称算法代码需要通过“输出”的“参数名称”去读取训练的输出目录。建议设置为“train_url”。训练输出参数要与所选算法的“输出”参数匹配。输出路径单击“输出路径”参数右侧的，从OBS桶中选择训练输出数据的存储位置。文件总大小必须小于或等于1GB，文件数必须小于或等于128个，单个文件大小必须小于或等于128MB。训练过程中，系统将自动从训练容器的本地代码目录下同步文件到数据存储位置。输出数据的存储位置仅支持OBS存储。为避免和训练输入数据存储冲突，建议选择一个空目录用作输出数据存储位置。获取方式以参数名称为“train_url”的训练输出为例，说明获取方式的作用。当参数的“获取方式”为“超参”时，可以参考如下代码来读取数据。 import argparse parser = argparse.ArgumentParser() parser.add_argument('--train_url') args, unknown = parser.parse_known_args() train_url = args.train_url 当参数的“获取方式”为“环境变量”时，可以参考如下代码来读取数据。 import os train_url = os.getenv("train_url", "") 容器本地路径：数据输入通道映射的容器本地路径。 “输出”的本地路径不支持修改，此路径由系统自动设置。
训练产物说明：如果选择的模型是在“空间资产 > 模型”菜单中由用户创建的模型，请确保在训练镜像中，将该模型的训练产物保存至系统内置的环境变量 ${RESULT} 指定的本地目录。系统检测到该目录内容后，将自动将其上传到模型资产中。
保存方式	设置训练产物的保存方式。当“保存方式”设置为“新模型”时，可自定义新模型的名称。模型训练的最终产物将发布至空间资产-模型。当“保存方式”设置为“已有模型新版本”时，下拉选择已有的模型（下拉选项值为当“保存方式”设置为“新模型”时产生的模型）。模型训练的最终产物将发布至空间资产-模型。当“保存方式”设置为“不发布”时，模型训练的最终产物将不发布至空间资产-模型。
模型名称	设置调优后产生的新模型的名称。当“保存方式”设置为“不发布”该字段无效。模型名称长度范围为3~64个字符，由中文、数字、字母、下划线（_）、连字符（-）、点（.）、斜线（/）组成。说明：当“保存方式”设置为“不发布”该字段无效。
模型版本号	填写新模型版本号。当保存为“已有模型新版本”时，填写的模型版本号不能和该模型已有的版本号重复，如未填写版本号时，模型版本号会自动新增一个版本。当“保存方式”设置为“不发布”该字段无效。模型版本号长度范围为2~128个字符，以字母或数字开头，仅支持大小写字母、数字、连字符（-）、点号（.）、下划线（_）。说明：当“保存方式”设置为“不发布”该字段无效。
模型类型	系统自动匹配模型类型，不可修改。当“保存方式”设置为“不发布”该字段无效。新模型的模型类型，需要与源模型的模型类型保持一致。说明：当“保存方式”设置为“不发布”该字段无效。
模型优势技能	指模型经过训练后，在各项能力中表现相对优异、可作为该模型优势能力的技能。单击“添加”，配置模型优势技能。需配置“技能名称”和“prompt”信息。技能名称：仅支持中文、大小写字母、数字、连字符（-）、下划线（_），不能以空格开头和结尾，长度为1~64个字符。 prompt：长度在 1~1024个字符之间的字符串。如不需要可单击删除。最多添加50个模型优势技能。说明：如果选择的模型类型是“操作模型”和“导航模型”，才需配置模型优势技能，其他类模型则无需配置。当“保存方式”设置为“不发布”该字段无效。
仅执行模型优势技能	开启是否仅执行模型优势技能。开启后，部署后的模型服务在智能体调试时仅能执行当前的模型优势技能。未开启则默认可执行模型的全部技能。说明：仅添加了“模型优势技能”时有效。