更新时间:2025-01-05 GMT+08:00
分享

创建CV大模型训练任务

创建CV大模型微调任务

创建CV大模型微调任务步骤如下:

  1. 登录ModelArts Studio大模型开发平台,在“我的空间”模块,单击进入所需空间。
  2. 在左侧导航栏中选择“模型开发 > 模型训练”,单击右上角“创建训练任务”。
  3. 在“创建训练任务”页面,参考表1完成训练参数设置。
    其中,“训练参数”展示了各场景涉及到的全部参数,请根据具体前端页面展示的参数进行设置。
    表1 CV大模型微调参数说明

    参数分类

    训练参数

    说明

    训练配置

    模型来源

    选择“盘古大模型”。

    模型类型

    选择“CV大模型”。

    训练类型

    选择“微调”。

    基础模型

    选择所需微调的基础模型。

    训练参数

    数据集

    训练数据集。

    自定义L1预训练模型目录

    自定义预训练模型所在的OBS路径。

    训练轮数

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    是否使用自定义L1预训练模型

    是否使用自定义预训练模型进行训练,模型为用户与服务共建,详情请联系客服。

    热身轮次

    表示在模型训练初期,逐步增加学习率到预设值的训练轮次,用于帮助模型在训练初期稳定收敛,避免大幅度的参数更新导致不稳定的学习过程。

    锚框的长边和短边的比例

    定义检测物体锚框的长宽比。通过设置不同的长短比例,模型可以更好地适应多种尺寸和形状的物体。

    锚框大小

    指锚框的初始尺寸。锚框是物体检测中的一个关键概念,通过合理设置,可以帮助模型检测出多种尺寸的目标。

    框重叠比例阈值

    用于判定模型预测的边界框与真实边界框之间是否为同一物体。该阈值用于计算IoU(交并比),影响模型的精确度。

    热身轮次

    表示在模型训练初期,逐步增加学习率到预设值的训练轮次,用于帮助模型在训练初期稳定收敛,避免大幅度的参数更新导致不稳定的学习过程。

    热身阶段学习率

    热身轮次中使用的初始学习率。

    优化器

    优化器参数用于更新模型的权重。

    • sgd(随机梯度下降法)是深度学习中常用的优化算法之一,尤其适用于大规模数据集的训练。

    权重衰减

    用于防止模型过拟合。在更新模型权重时,它会对模型参数施加惩罚,使得权重值趋于较小,从而提高模型的泛化性能。

    滑动平滑训练

    一种训练策略,通过在模型预测的标签上添加少量噪声来避免过拟合,常用于提升模型在测试数据集上的泛化能力。

    极大值抑制阈值

    在预测多个边界框时,用于去除高度重叠的边界框。此阈值控制相似的边界框保留的条件。

    类别无关极大值抑制开关

    决定是否在不同类别中应用极大值抑制阈值。

    资源配置

    训练单元

    创建当前训练任务所需的训练单元数量。

    订阅提醒

    订阅提醒

    该功能开启后,系统将在任务状态更新时,通过短信或邮件将提醒发送给用户。

    基本信息

    名称

    训练任务名称。

    描述

    训练任务描述。

  4. 参数填写完成后,单击“立即创建”。
  5. 创建好训练任务后,页面将返回“模型训练”页面,可随时查看当前任务的状态。

相关文档