更新时间:2026-06-30 GMT+08:00
数据准备使用流程
数据准备提供了从“数据生产 → 数据处理 → 数据标注 → 数据评测”全流程的数据管理方案。每个环节都可以独立使用,确保用户可以根据具体需求灵活选择和操作。
图1 数据准备使用流程
业务场景
数据准备是为了获得训练具身模型的数据集,适用场景如下。
- 场景1:源数据是本地的原始数据,需要导入到OBS,进行数据处理、标注、评测后,发布到资产空间。
- 场景2:源数据已发布到资产空间,需进一步处理,如数据标注、数据评测等,再发布到资产空间。
- 场景3:如果没有源数据,可以使用仿真轨迹合成,再发布到资产空间。
业务模块
- 数据生产:在仿真器中通过高保真场景重建与物理仿真,自动生成或人工遥控符合真实世界约束的机器人交互数据,为模型训练提供高质量训练数据。
- 数据处理:将多模态传感器原始数据转换为带时空对齐的标准化格式,如rosbag转换为LeRobot3.0。
- 数据标注:实现人工标注(1230:自动标注基于强化学习策略自动生成精准动作标签与状态注释),将物理交互过程转化为有效的监督信号。
- 数据评测:通过多维度量化指标(如覆盖率、分布相似度、异常检测能力)建立数据集质量评估体系,驱动数据闭环优化。
父主题: 数据准备