文档首页/ 具身智能开发平台 CloudRobo/ 快速入门/ 数据入门:一键将LeRobot V2.1转换成LeRobot V3格式数据集
更新时间:2026-06-30 GMT+08:00
分享

数据入门:一键将LeRobot V2.1转换成LeRobot V3格式数据集

场景介绍

具身广场中的模型支持LeRobot V3格式的数据集输入,而采集的数据集因历史原因,保留了LeRobot V2.1的版本。需要将LeRobot V2.1版本的数据集转换成LeRobot V3格式。

为方便您格式转换,CloudRobo内置了Huggingface标准的LeRobot V2.1转V3的处理逻辑,本案例介绍如何在CloudRobo中使用该功能。

计费影响

数据处理可以调用公共资源池或专属资源池。数据处理功能本身不收费,数据处理使用的资源计费:

  • 公共资源池:不收费,但限制个人资源配额。
  • 专属资源池:CloudRobo采用纳管客户自有计算资源方式运行,客户需要自行购买CCE资源。

前提条件

  • 已完成华为云账号注册、实名认证及相关权限授权。
  • 已将LeRobot V2.1格式的数据集上传至自己的OBS空间,并在该空间完成资产注册。

约束限制

仅“西南-贵阳一”区域支持。

创建数据处理任务

  1. 登录CloudRobo控制台
  2. 在左侧菜单栏中单击“数据准备 > 数据处理”,进入数据处理页面。
  3. 单击右上角“创建任务”,进入创建页面,参照表1配置参数,单击“确认”。

    表1 一键LeRobot V2.1转LeRobot V3格式数据集参数说明

    参数

    说明

    本案例推荐值

    任务名称

    数据处理任务名称,用于标识和管理数据处理任务。支持3-64个字符,可以包含中文、数字、字母、下划线(_)、连字符(-)、点(.)、斜线(/)组成。

    -

    描述

    本数据处理任务的描述信息,用于说明本数据处理任务的功能等。

    -

    处理算法

    本数据处理任务具体使用的算法,来源包括预置算法、空间资产-算法,其中:

    • 预置算法:CloudRobo自带的数据处理算子,仅支持标准输入、输出。当前内置的算子有:数据转换--LeRobotV21转LeRobotV3、数据转换--ros转LeRobotV21、数据转换--ros转LeRobotV3、数据处理--逆运动学求解器。
    • 空间资产-算法:客户自定义数据处理算子,客户可以根据自有业务需求开发定制。

    预置算法->数据转换--LobotV21转LeRobotV3

    启动命令

    数据处理算子的入口命令,内置算子会默认填写; 自定义算子根据实际代码位置及入口函数和参数设置。

    无需修改

    环境变量

    如果数据处理算子需要读取环境变量以便控制内部逻辑,可以在此设置。

    无需设置

    作业类型

    CloudRobo支持Ray框架和K8s两种作业类型,其中Ray框架以Ray Job方式运行,用户需要将Ray框架及作业依赖制作为容器镜像,支持大型分布式运行,需要设置header和worker节点的资源规格;K8s当前仅支持单容器运行,仅需设置worker节点的资源规格即可。

    可以选择Ray作业,也可以选择K8s作业,均支持

    动态存储

    如果数据集规模比较大,如:超过50GB,建议每个节点挂载一个动态存储,以便作业运行时本地可以有更大的存储空间。

    根据自己的实际需求申请

    数据集

    待处理数据集,可以选择 “空间资产-数据”或“对象存储服务OBS”。

    空间资产-数据

    保存路径

    处理后的数据集保存位置,可以选择 “空间资产-数据”或“对象存储服务OBS”。

    空间资产-数据

    输出数据集名称

    处理后的数据集名称。

    -

    创建完成后,系统自动返回数据处理列表页面,等待一段时间后,状态为“进行中”即为创建成功。

删除或重启任务

在数据处理页面,可以单击某个数据处理任务“操作”列的删除按钮,删除该任务。

当任务状态为“失败”时,可以单击“操作”列的重启按钮,重启该任务。

查看任务详情

在数据处理页面,单击某个数据处理任务的名称即可进入详情页面,查看数据详情及日志信息。

相关文档