更新时间:2022-11-24 GMT+08:00

Manifest管理概述

在ModelArts使用过程中,需要做数据标注、模型训练、推理、数据集管理、市场发布等业务,这些业务都基于数据集进行的。为了规范对数据集的使用,适配各个使用场景,同时兼顾数据集管理的灵活性,本文档描述数据集管理的接口和描述规范——Manifest文件。

  • Manifest文件中定义了标注对象和标注内容的对应关系。Manifest文件中也可以只有原始文件信息,没有标注信息,如生成的未标注的数据集。
  • Manifest文件使用UTF-8编码,Manifest处理程序需具备UTF-8处理能力。
  • Manifest文件中文本分类的source数值可以包含中文,其他字段不建议用中文。
  • Manifest文件可以由用户、第三方工具或ModelArts标注系统生成。
  • Manifest文件名没有特殊要求,可以为任意合法文件名。