更新时间:2023-03-09 GMT+08:00

数据分析与预览

用户的原始数据的质量一般无法满足训练的要求,如存在不合法的数据、重复数据等。为了帮助用户提高数据的质量,ModelArts提供了多种能力:

  • 自动分组:通过聚类对数据进行预分类,用户可以根据预分类结果进行标注,有助于均衡不同类别的数据标注数量。
  • 数据筛选:用户可以根据样本属性,自动分组结果等进行数据筛选,帮助用户过滤数据。
  • 数据特征分析:分析数据或者标注结果的特征分布,如图像亮度分布、标注框的分布等,帮助用户分析数据的均衡性,从而提升模型训练的效果。