数据入门:一键将LeRobot V2.1转换成LeRobot V3格式数据集
场景介绍
具身广场中的模型支持LeRobot V3格式的数据集输入,而采集的数据集因历史原因,保留了LeRobot V2.1的版本。需要将LeRobot V2.1版本的数据集转换成LeRobot V3格式。
为方便您格式转换,CloudRobo内置了Huggingface标准的LeRobot V2.1转V3的处理逻辑,本案例介绍如何在CloudRobo中使用该功能。
计费影响
数据处理可以调用公共资源池或专属资源池。数据处理功能本身不收费,数据处理使用的资源计费:
- 公共资源池:不收费,但限制个人资源配额。
- 专属资源池:CloudRobo采用纳管客户自有计算资源方式运行,客户需要自行购买CCE资源。
前提条件
- 已完成华为云账号注册、实名认证及相关权限授权。
- 已将LeRobot V2.1格式的数据集上传至自己的OBS空间,并在该空间完成资产注册。
约束限制
仅“西南-贵阳一”区域支持。
创建数据处理任务
- 登录CloudRobo控制台。
- 在左侧菜单栏中单击“数据准备 > 数据处理”,进入数据处理页面。
- 单击右上角“创建任务”,进入创建页面,参照表1配置参数,单击“确认”。
表1 一键LeRobot V2.1转LeRobot V3格式数据集参数说明 参数
说明
本案例推荐值
任务名称
数据处理任务名称,用于标识和管理数据处理任务。支持3-64个字符,可以包含中文、数字、字母、下划线(_)、连字符(-)、点(.)、斜线(/)组成。
-
描述
本数据处理任务的描述信息,用于说明本数据处理任务的功能等。
-
处理算法
本数据处理任务具体使用的算法,来源包括预置算法、空间资产-算法,其中:
- 预置算法:CloudRobo自带的数据处理算子,仅支持标准输入、输出。当前内置的算子有:数据转换--LeRobotV21转LeRobotV3、数据转换--ros转LeRobotV21、数据转换--ros转LeRobotV3、数据处理--逆运动学求解器。
- 空间资产-算法:客户自定义数据处理算子,客户可以根据自有业务需求开发定制。
预置算法->数据转换--LobotV21转LeRobotV3
启动命令
数据处理算子的入口命令,内置算子会默认填写; 自定义算子根据实际代码位置及入口函数和参数设置。
无需修改
环境变量
如果数据处理算子需要读取环境变量以便控制内部逻辑,可以在此设置。
无需设置
作业类型
CloudRobo支持Ray框架和K8s两种作业类型,其中Ray框架以Ray Job方式运行,用户需要将Ray框架及作业依赖制作为容器镜像,支持大型分布式运行,需要设置header和worker节点的资源规格;K8s当前仅支持单容器运行,仅需设置worker节点的资源规格即可。
可以选择Ray作业,也可以选择K8s作业,均支持
动态存储
如果数据集规模比较大,如:超过50GB,建议每个节点挂载一个动态存储,以便作业运行时本地可以有更大的存储空间。
根据自己的实际需求申请
数据集
待处理数据集,可以选择 “空间资产-数据”或“对象存储服务OBS”。
空间资产-数据
保存路径
处理后的数据集保存位置,可以选择 “空间资产-数据”或“对象存储服务OBS”。
空间资产-数据
输出数据集名称
处理后的数据集名称。
-
创建完成后,系统自动返回数据处理列表页面,等待一段时间后,状态为“进行中”即为创建成功。
删除或重启任务
在数据处理页面,可以单击某个数据处理任务“操作”列的删除按钮,删除该任务。
当任务状态为“失败”时,可以单击“操作”列的重启按钮,重启该任务。
查看任务详情
在数据处理页面,单击某个数据处理任务的名称即可进入详情页面,查看数据详情及日志信息。