更新时间:2026-03-23 GMT+08:00
分享

创建CV大模型训练任务

创建CV大模型预训练任务

创建CV大模型预训练任务步骤如下:

  1. 登录ModelArts Studio大模型开发平台首页,在“我的空间”模块,单击进入所需空间。
    图1 我的空间
  2. 在左侧导航栏中选择“模型开发 > 模型训练”,单击右上角“创建训练任务”。
  3. 在“创建训练任务”页面,参考表1完成训练参数设置。
    表1 CV大模型预训练参数说明

    参数分类

    训练参数

    说明

    训练配置

    选择模型

    可以修改如下信息:

    • 来源:选择“模型广场”或“我的资产”。
    • 类型:选择“CV大模型”,并选择训练所用的基础模型和版本。

    训练类型

    选择“预训练”。

    • 预训练:利用大量无标注图片数据进行预训练,提高模型的泛化能力和性能。

    资源配置

    计费模式

    选择训练当前任务的计费模式。

    训练单元

    选择训练模型所需的训练单元。

    当前展示的完成本次训练所需要的最低训练单元要求。

    单实例训练单元数

    选择单实例训练单元数。

    实例数

    选择实例数。

    优先级

    优先级相同的任务,先创建先执行。

    训练参数

    训练参数

    模型训练参数,参考表2

    高级设置

    checkpoints

    checkpoints:在模型训练过程中,用于保存模型权重和状态的机制。

    • 关闭:关闭后不保存checkpoints,无法基于checkpoints执行续训操作。
    • 自动:自动保存训练过程中的所有checkpoints。
    • 自定义:根据设置保存指定数量的checkpoints。

      开启断点续训后对于未训练完成的模型,可以通过单击训练任务名称,进入“训练结果”页签,单击产物列表中需要进行断点续训的checkpoints右侧的“续训”进行续训。

    订阅提醒

    订阅提醒

    该功能开启后,平台支持两种订阅类型,预置通知和SMN通知。

    预置通知:系统将在任务状态完成或失败时,通过短信或邮件将提醒发送给用户。

    SMN通知:用户可在SMN云服务创建主题并维护订阅信息,在创建训练时选择对应主题以及需要通知的状态。训练状态范围:停止,失败,完成。用户手工触发的停止操作不通知用户,而资源到期的停止需通知用户。

    发布模型

    开启自动发布

    开启自动发布后,模型训练完成的最终产物会自动发布为空间资产,以便对模型进行压缩、部署、评测等操作或共享给其他空间。

    模型可见性

    选择发布模型的可见范围。

    本空间可见:发布的模型仅当前工作空间可见。

    全空间可见:发布的模型在所有空间均可见。

    模型名称

    要发布的模型资产名称。

    描述(可选)

    要发布的模型资产的相关描述,选填。

    基本信息

    名称

    训练任务名称。

    描述(可选)

    训练任务描述。

    表2 CV大模型预训练参数说明

    模型类型

    训练参数

    说明

    Pangu-CV-物体检测-S-V3

    数据集

    训练数据集。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    单卡训练批处理大小

    单卡批量处理大小,建议取值大于等于1。建议使用默认值,如需更改时应避免学习率过大,否则会导致训练loss震荡甚至失败。

    单卡验证批处理大小

    单卡验证批量处理大小,建议取值大于等于1。

    图像分辨率

    训练和推理的统一图像分辨率尺寸,要求为32的倍数,不符合要求会自动转换为最近的32倍数尺寸。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。取值为大于0,小于等于1, 取列表中的第一个值。建议使用默认值,如需更改时应避免学习率过大,否则会导致训练loss震荡甚至失败。

    模型规格

    不同模型规格,X参数量最大,L参数量适中,S参数量最小。

    说明:

    加载已训练过的模型进行二次训练时,需要保证使用相同的模型规格进行训练。

    混合精度训练

    是否使用混合精度训练开关,开启时可降低训练显存占用但存在溢出风险,关闭时可提高训练稳定性但显存和训练速度有所增加

    标签映射

    是否增加标签映射功能,增加预训练模型的迁移效果。

    权重衰减

    用于控制参数稀疏性,防止过拟合,不建议修改。

    热身阶段初始学习率

    热身阶段的初始学习率,一般从极小值开始,避免初期梯度混乱。

    热身步长

    此参数用于控制稳定训练初期的前N次步长数,该值应小于总训练步长(训练总步长 = 训练轮次 * 训练数据量 ÷ 单卡训练批处理大小 ÷ 总卡数),建议优先使用默认值。

    优化器

    优化器用于根据损失函数对模型参数进行更新,控制收敛方向和速度,支持的优化器包括:AdamW、SGD、Adam,建议使用默认值。

    学习率调度器

    学习率调度器决定了学习率动态调整的规则,支持以下常见学习率调度器:MultiStepLR、CosineAnnealingLR、OneCycleLR,建议使用默认值。

    梯度裁剪最大范数

    梯度裁剪的最大范数,用于防止梯度爆炸。当梯度的L2范数超过该值时,会将其按比例缩放至不超过max_norm,从而提升训练稳定性。

    设置为0时表示禁用梯度裁剪。建议在使用混合精度训练(AMP)时配合启用,以平衡训练效率与数值稳定性。

    滑动平滑训练

    在训练过程中,使用参数的指数移动平均值进行更新,而非直接使用原始参数,在训练数据少且噪声大时建议开启,保持训练稳定

    日志打印间隔(迭代次数)

    在模型训练过程中,控制日志信息输出的打印间隔,单位为迭代次数。每经过指定轮数后,系统将打印一次训练状态信息,便于监控训练进程与性能表现。

    同步批量归一化

    是否使用同步批量归一化,开启时可提升多卡训练下的模型收敛稳定性与精度,但会增加一定训练时间。

    注意力机制偏移采样位置的插值方式

    设置为default时,使用双线性插值在连续空间中进行采样;设置为discrete时,将采样位置直接转换为整数像素索引进行离散采样。

    查询选择方法

    用于在模型解码阶段,从编码器输出中选取top-k初始查询的位置策略。设置为default时,按类别维度分别选取每类中得分最高的top-k位置。适用于标准多类别目标检测任务,保持类别区分性。设置为agnostic时,仅基于是否存在物体的综合置信度选择top-k位置,不考虑类别信息,适用于仅关注物体存在性的任务。

    Top-K最高置信度预测框数量

    用于控制后处理阶段保留的最高置信度预测框数量,密集检测场景可适当增大该值。

    数据增强轮次

    在训练过程中,指定进行数据增强的持续轮次。应设置为0~最大迭代轮次之间的数字。

    图像颜色扰动增强概率

    在生成训练数据集过程中,对原始图像应用颜色扰动增强的概率。当该值为1时,所有图像均进行颜色扰动增强;当值为0时,不进行独立的缩放外扩增强操作。

    图像缩放外扩增强概率

    在生成训练数据集过程中,对原始图像应用缩放外扩增强的概率。当该值为1时,所有图像均进行缩放外扩增强;当值为0时,不进行独立的缩放外扩增强操作。

    图像IoU裁剪增强概率

    在生成训练数据集过程中,对原始图像应用基于IoU裁剪增强的概率。当该值为1时,所有图像均进行IoU裁剪增强;当值为0时,不进行独立的裁剪操作。

    图像水平翻转增强概率

    在生成训练数据集过程中,对原始图像应用水平翻转增强的概率。当该值为1时,所有图像均进行水平翻转;当为0时,不进行独立的水平翻转操作。

    图像垂直翻转增强概率

    在生成训练数据集过程中,对原始图像应用垂直翻转增强的概率。当该值为1时,所有图像均进行垂直翻转;当为0时,不进行独立的垂直翻转操作。

    缩放是否保持宽高比

    对原始图像应用图像缩放时是否保持宽高比。当该值为True时,训练的图像缩放会保持宽高比;当为False时,训练的图像缩放会直接按照输入分辨率对图片进行不保持宽高比的缩放。推理时会采用和训练一致的缩放方式。

    是否添加背景类训练

    是否添加背景类训练的开关,默认关闭。开启时会对所有样本增加一个第0类的名为BACKGROUND-IIT的背景类别,用于提高空标注训练稳定性;关闭时按照原始输入的图像及其标注进行训练。在大量空标注图片训练情况下存在loss溢出风险,建议打开增加背景类训练开关。

    Pangu-CV-目标跟踪-V3

    数据集

    训练数据集。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    单卡训练批处理大小

    单卡批量处理大小,建议取值大于等于1。建议使用默认值,如需更改时应避免学习率过大,否则会导致训练loss震荡甚至失败。

    单卡验证批处理大小

    单卡验证批量处理大小,建议取值大于等于1。

    图像分辨率

    训练和推理的统一图像分辨率尺寸,要求为32的倍数,不符合要求会自动转换为最近的32倍数尺寸。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。取值为大于0,小于等于1, 取列表中的第一个值。建议使用默认值,如需更改时应避免学习率过大,否则会导致训练loss震荡甚至失败。

    模型规格

    不同模型规格,X参数量最大,L参数量适中,S参数量最小。

    说明:

    加载已训练过的模型进行二次训练时,需要保证使用相同的模型规格进行训练。

    混合精度训练

    是否使用混合精度训练开关,开启时可降低训练显存占用但存在溢出风险,关闭时可提高训练稳定性但显存和训练速度有所增加。

    标签映射

    是否增加标签映射功能,增加预训练模型的迁移效果。

    权重衰减

    用于控制参数稀疏性,防止过拟合,不建议修改。

    热身阶段初始学习率

    热身阶段的初始学习率,一般从极小值开始,避免初期梯度混乱。

    热身步长

    此参数用于控制稳定训练初期的前N次步长数,该值应小于总训练步长(训练总步长 = 训练轮次 * 训练数据量 ÷ 单卡训练批处理大小 ÷ 总卡数),建议优先使用默认值。

    优化器

    优化器用于根据损失函数对模型参数进行更新,控制收敛方向和速度,支持的优化器包括:AdamW、SGD、Adam,建议使用默认值。

    学习率调度器

    学习率调度器决定了学习率动态调整的规则,支持以下常见学习率调度器:MultiStepLR、CosineAnnealingLR、OneCycleLR,建议使用默认值。

    梯度裁剪最大范数

    梯度裁剪的最大范数,用于防止梯度爆炸。当梯度的L2范数超过该值时,会将其按比例缩放至不超过max_norm,从而提升训练稳定性。

    设置为0时表示禁用梯度裁剪。建议在使用混合精度训练(AMP)时配合启用,以平衡训练效率与数值稳定性。

    滑动平滑训练

    在训练过程中,使用参数的指数移动平均值进行更新,而非直接使用原始参数,在训练数据少且噪声大时建议开启,保持训练稳定。

    日志打印间隔(迭代次数)

    在模型训练过程中,控制日志信息输出的打印间隔,单位为迭代次数。每经过指定轮数后,系统将打印一次训练状态信息,便于监控训练进程与性能表现。

    同步批量归一化

    是否使用同步批量归一化,开启时可提升多卡训练下的模型收敛稳定性与精度,但会增加一定训练时间。

    注意力机制偏移采样位置的插值方式

    设置为default时,使用双线性插值在连续空间中进行采样;设置为discrete时,将采样位置直接转换为整数像素索引进行离散采样。

    查询选择方法

    用于在模型解码阶段,从编码器输出中选取top-k初始查询的位置策略。设置为default时,按类别维度分别选取每类中得分最高的top-k位置。适用于标准多类别目标检测任务,保持类别区分性。设置为agnostic时,仅基于是否存在物体的综合置信度选择top-k位置,不考虑类别信息,适用于仅关注物体存在性的任务。

    Top-K最高置信度预测框数量

    用于控制后处理阶段保留的最高置信度预测框数量,密集检测场景可适当增大该值。

    数据增强轮次

    在训练过程中,指定进行数据增强的持续轮次。应设置为0~最大迭代轮次之间的数字。

    图像颜色扰动增强概率

    在生成训练数据集过程中,对原始图像应用颜色扰动增强的概率。当该值为1时,所有图像均进行颜色扰动增强;当值为0时,不进行独立的缩放外扩增强操作。

    图像缩放外扩增强概率

    在生成训练数据集过程中,对原始图像应用缩放外扩增强的概率。当该值为1时,所有图像均进行缩放外扩增强;当值为0时,不进行独立的缩放外扩增强操作。

    图像IoU裁剪增强概率

    在生成训练数据集过程中,对原始图像应用基于IoU裁剪增强的概率。当该值为1时,所有图像均进行IoU裁剪增强;当值为0时,不进行独立的裁剪操作。

    图像水平翻转增强概率

    在生成训练数据集过程中,对原始图像应用水平翻转增强的概率。当该值为1时,所有图像均进行水平翻转;当为0时,不进行独立的水平翻转操作。

    图像垂直翻转增强概率

    在生成训练数据集过程中,对原始图像应用垂直翻转增强的概率。当该值为1时,所有图像均进行垂直翻转;当为0时,不进行独立的垂直翻转操作。

    缩放是否保持宽高比

    对原始图像应用图像缩放时是否保持宽高比。当该值为True时,训练的图像缩放会保持宽高比;当为False时,训练的图像缩放会直接按照输入分辨率对图片进行不保持宽高比的缩放。推理时会采用和训练一致的缩放方式。

    是否添加背景类训练

    是否添加背景类训练的开关,默认关闭。开启时会对所有样本增加一个第0类的名为BACKGROUND-IIT的背景类别,用于提高空标注训练稳定性;关闭时按照原始输入的图像及其标注进行训练。在大量空标注图片训练情况下存在loss溢出风险,建议打开增加背景类训练开关。

    Pangu-CV-物体检测-S-V2

    数据集

    训练数据集。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    批次大小

    表示每个训练步骤中使用的样本数量。较大的批量可以提供更稳定的梯度,但可能会增加计算资源的使用和训练时间。

    验证集图片保存最大数量

    用于限制验证过程中模型预测错误(与标注不符)的图片保存数量,便于后续分析错误类型,同时避免存储空间浪费。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。

    权重衰减

    通过在每次参数更新时对模型权重进行小幅度缩减,避免模型过度依赖特定数据。

    Pangu-CV-物体检测-N-V2

    数据集

    训练数据集。

    训练轮数

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    热身轮次

    表示在模型训练初期,逐步增加学习率到预设值的训练轮次,用于帮助模型在训练初期稳定收敛,避免大幅度的参数更新导致不稳定的学习过程。

    热身阶段学习率

    热身轮次中使用的初始学习率。

    权重衰减

    用于防止模型过拟合。在更新模型权重时,它会对模型参数施加惩罚,使得权重值趋于较小,从而提高模型的泛化性能。

    优化器

    选择用于训练模型的优化算法。这里选择的“sgd”是随机梯度下降法,它是深度学习中常用的优化算法之一,适合大规模数据集训练。

    锚框的长边和短边的比例

    定义检测物体锚框的长宽比。通过设置不同的长短比例,模型可以更好地适应多种尺寸和形状的物体。

    锚框大小

    指锚框的初始尺寸。锚框是物体检测中的一个关键概念,通过合理设置,可以帮助模型检测出多种尺寸的目标。

    框重叠比例阈值

    用于计算损失时区分正负样本的IoU阈值。当候选框与某个真实框的IoU大于等于该阈值时,该候选框被视为正样本;否则视为负样本。

    滑动平滑训练

    一种训练策略,通过在模型预测的标签上添加少量噪声来避免过拟合,常用于提升模型在测试数据集上的泛化能力。

    极大值抑制阈值

    在预测多个边界框时,用于去除高度重叠的边界框。此阈值控制相似的边界框保留的条件。

    类别无关极大值抑制开关

    决定是否在不同类别中应用极大值抑制阈值。

    模型大小调整因子

    用于模型抽取过程中,选择不同的模型因子来调节模型参数的多少。

    输入模型图像宽度

    用于控制模型输入图像分辨率的宽度,以此调节适应不同场景的模型识别能力。

    输入模型图像高度

    用于控制模型输入图像分辨率的高度,以此调节适应不同场景的模型识别能力。

    模型保存轮数

    模型训练时保存断点的间隔轮数。

    Pangu-CV-图像分类-V2

    数据集

    训练数据集。

    训练轮数

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    每卡批次大小

    表示每个训练步骤中使用的样本数量。较大的批量可以提供更稳定的梯度,但可能会增加计算资源的使用和训练时间。

    分类模式

    图像分类模式,支持单标签分类和多标签分类。

    超参搜索

    是否启用超参搜索获取最优的超参用于训练。

    初始学习率

    学习率决定了每次训练时模型参数更新的幅度。初始学习率是模型训练最开始阶段所设定的学习率,它是学习率的初始值。

    超参搜索训练轮数

    在超参搜索阶段,设置模型会经过几轮训练以找到最优的超参数组合。

    模型保存轮数

    模型训练时保存断点的间隔轮数,每次保存断点的同时会进行模型评估和指标计算,每次模型保存和评估预计会增加6分钟训练时长。

    热身轮数

    用于稳定训练初期的前几轮训练,小于总训练轮数,通常占总训练步数的5%~10%。

    权重衰减

    用于控制参数稀疏性,防止过拟合,不建议修改。

    图像分辨率

    训练和推理的统一图像分辨率尺寸,图像分辨率越大,显存占用越大,训练、推理速度越慢,在增大图像分辨率的同时应降低每卡批大小,避免因显存不足导致训练报错。

  4. 参数填写完成后,单击“立即创建”。
  5. 创建好训练任务后,页面将返回“模型训练”页面,可随时查看当前任务的状态。

物体检测S3.0和目标跟踪3.0的训练和推理镜像会含有gcc编译工具,版本为10.3.1,用于训练和推理阶段的tbe算子编译使用,否则对应任务会执行失败。

创建CV大模型微调任务

创建CV大模型微调任务步骤如下:

  1. 登录ModelArts Studio大模型开发平台首页,在“我的空间”模块,单击进入所需空间。
    图2 我的空间
  2. 在左侧导航栏中选择“模型开发 > 模型训练”,单击右上角“创建训练任务”。
  3. 在“创建训练任务”页面,参考表3完成训练参数设置。
    表3 CV大模型微调参数说明

    参数分类

    训练参数

    说明

    训练配置

    选择模型

    可以修改如下信息:

    • 来源:选择“模型广场”或“我的资产”。
    • 类型:选择“CV大模型”,并选择训练所用的基础模型和版本。

    训练类型

    选择“微调”。

    训练目标

    选择“全量微调”。

    • 全量微调:预训练模型作为基本框架,利用标注图片数据来微调模型的参数,提高模型在特定任务上的性能。

    资源配置

    计费模式

    选择训练当前任务的计费模式。

    训练单元

    选择训练模型所需的训练单元。

    当前展示的完成本次训练所需要的最低训练单元要求。

    单实例训练单元数

    选择单实例训练单元数。

    实例数

    选择实例数。

    优先级

    优先级相同的任务,先创建先执行。

    训练参数

    训练参数

    模型训练参数,参考表4

    高级设置

    checkpoints

    checkpoints:在模型训练过程中,用于保存模型权重和状态的机制。

    • 关闭:关闭后不保存checkpoints,无法基于checkpoints执行续训操作。
    • 自动:自动保存训练过程中的所有checkpoints。
    • 自定义:根据设置保存指定数量的checkpoints。

      开启断点续训后对于未训练完成的模型,可以通过单击训练任务名称,进入“训练结果”页签,单击产物列表中需要进行断点续训的checkpoints右侧的“续训”进行续训。

    订阅提醒

    订阅提醒

    该功能开启后,平台支持两种订阅类型,预置通知和SMN通知。

    预置通知:系统将在任务状态完成或失败时,通过短信或邮件将提醒发送给用户。

    SMN通知:用户可在SMN云服务创建主题并维护订阅信息,在创建训练时选择对应主题以及需要通知的状态。训练状态范围:停止,失败,完成。用户手工触发的停止操作不通知用户,而资源到期的停止需通知用户。

    发布模型

    开启自动发布

    开启自动发布后,模型训练完成的最终产物会自动发布为空间资产,以便对模型进行压缩、部署、评测等操作或共享给其他空间。

    模型可见性

    选择发布模型的可见范围。

    本空间可见:发布的模型仅当前工作空间可见。

    全空间可见:发布的模型在所有空间均可见。

    模型名称

    要发布的模型资产名称。

    描述(可选)

    要发布的模型资产的相关描述,选填。

    基本信息

    名称

    训练任务名称。

    描述

    训练任务描述。

    表4 CV大模型微调参数说明

    模型类型

    训练参数

    说明

    Pangu-CV-物体检测-S-V3

    数据集

    训练数据集。

    说明:数据集要求条目数不低于100条。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    单卡训练批处理大小

    单卡批量处理大小,建议取值大于等于1。建议使用默认值,如需更改时应避免学习率过大,否则会导致训练loss震荡甚至失败。

    单卡验证批处理大小

    单卡验证批量处理大小,建议取值大于等于1。

    图像分辨率

    训练和推理的统一图像分辨率尺寸, 要求为32的倍数,不符合要求会自动转换为最近的32倍数尺寸。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。取值为大于0,小于等于1, 取列表中的第一个值。建议使用默认值,如需更改时应避免学习率过大,否则会导致训练loss震荡甚至失败。

    模型规格

    不同模型规格,X参数量最大,L参数量适中,S参数量最小。

    说明:

    加载已训练过的模型进行二次训练时,需要保证使用相同的模型规格进行训练。

    混合精度训练

    是否使用混合精度训练开关,开启时可降低训练显存占用但存在溢出风险,关闭时可提高训练稳定性但显存和训练速度有所增加。

    标签映射

    是否增加标签映射功能,增加预训练模型的迁移效果。

    权重衰减

    用于控制参数稀疏性,防止过拟合,不建议修改。

    热身阶段初始学习率

    热身阶段的初始学习率,一般从极小值开始,避免初期梯度混乱。

    热身步长

    此参数用于控制稳定训练初期的前N次步长数,该值应小于总训练步长(训练总步长=训练轮次*训练数据量÷单卡训练批处理大小÷总卡数),建议优先使用默认值。

    优化器

    优化器用于根据损失函数对模型参数进行更新,控制收敛方向和速度,支持的优化器包括:AdamW、SGD、Adam,建议使用默认值。

    学习率调度器

    学习率调度器决定了学习率动态调整的规则,支持以下常见学习率调度器:MultiStepLR、CosineAnnealingLR、OneCycleLR,建议使用默认值。

    梯度裁剪最大范数

    梯度裁剪的最大范数,用于防止梯度爆炸。当梯度的L2范数超过该值时,会将其按比例缩放至不超过max_norm,从而提升训练稳定性。

    设置为0时表示禁用梯度裁剪。建议在使用混合精度训练(AMP)时配合启用,以平衡训练效率与数值稳定性。

    滑动平滑训练

    在训练过程中,使用参数的指数移动平均值进行更新,而非直接使用原始参数,在训练数据少且噪声大时建议开启,保持训练稳定。

    日志打印间隔(迭代次数)

    在模型训练过程中,控制日志信息输出的打印间隔,单位为迭代次数。每经过指定轮数后,系统将打印一次训练状态信息,便于监控训练进程与性能表现。

    同步批量归一化

    是否使用同步批量归一化,开启时可提升多卡训练下的模型收敛稳定性与精度,但会增加一定训练时间。

    注意力机制偏移采样位置的插值方式

    设置为default时,使用双线性插值在连续空间中进行采样;设置为discrete时,将采样位置直接转换为整数像素索引进行离散采样。

    查询选择方法

    用于在模型解码阶段,从编码器输出中选取top-k初始查询的位置策略。设置为default时,按类别维度分别选取每类中得分最高的top-k位置。适用于标准多类别目标检测任务,保持类别区分性。设置为agnostic时,仅基于是否存在物体的综合置信度选择top-k位置,不考虑类别信息,适用于仅关注物体存在性的任务。

    Top-K最高置信度预测框数量

    用于控制后处理阶段保留的最高置信度预测框数量,密集检测场景可适当增大该值。

    数据增强轮次

    在训练过程中,指定进行数据增强的持续轮次。应设置为0~最大迭代轮次之间的数字。

    图像颜色扰动增强概率

    在生成训练数据集过程中,对原始图像应用颜色扰动增强的概率。当该值为1时,所有图像均进行颜色扰动增强;当值为0时,不进行独立的缩放外扩增强操作。

    图像缩放外扩增强概率

    在生成训练数据集过程中,对原始图像应用缩放外扩增强的概率。当该值为1时,所有图像均进行缩放外扩增强;当值为0时,不进行独立的缩放外扩增强操作。

    图像IoU裁剪增强概率

    在生成训练数据集过程中,对原始图像应用基于IoU裁剪增强的概率。当该值为1时,所有图像均进行IoU裁剪增强;当值为0时,不进行独立的裁剪操作。

    图像水平翻转增强概率

    在生成训练数据集过程中,对原始图像应用水平翻转增强的概率。当该值为1时,所有图像均进行水平翻转;当为0时,不进行独立的水平翻转操作。

    图像垂直翻转增强概率

    在生成训练数据集过程中,对原始图像应用垂直翻转增强的概率。当该值为1时,所有图像均进行垂直翻转;当为0时,不进行独立的垂直翻转操作。

    缩放是否保持宽高比

    对原始图像应用图像缩放时是否保持宽高比。当该值为True时,训练的图像缩放会保持宽高比;当为False时,训练的图像缩放会直接按照输入分辨率对图片进行不保持宽高比的缩放。推理时会采用和训练一致的缩放方式。

    是否添加背景类训练

    是否添加背景类训练的开关,默认关闭。开启时会对所有样本增加一个第0类的名为BACKGROUND-IIT的背景类别,用于提高空标注训练稳定性;关闭时按照原始输入的图像及其标注进行训练。在大量空标注图片训练情况下存在loss溢出风险,建议打开增加背景类训练开关。

    Pangu-CV-目标跟踪-V3

    数据集

    训练数据集。

    说明:数据集要求条目数不低于100条。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    单卡训练批处理大小

    单卡批量处理大小,建议取值大于等于1。建议使用默认值,如需更改时应避免学习率过大,否则会导致训练loss震荡甚至失败。

    单卡验证批处理大小

    单卡验证批量处理大小,建议取值大于等于1。

    图像分辨率

    训练和推理的统一图像分辨率尺寸, 要求为32的倍数,不符合要求会自动转换为最近的32倍数尺寸。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。取值为大于0,小于等于1, 取列表中的第一个值。建议使用默认值,如需更改时应避免学习率过大,否则会导致训练loss震荡甚至失败。

    模型规格

    不同模型规格,X参数量最大,L参数量适中,S参数量最小。

    说明:

    加载已训练过的模型进行二次训练时,需要保证使用相同的模型规格进行训练。

    混合精度训练

    是否使用混合精度训练开关,开启时可降低训练显存占用但存在溢出风险,关闭时可提高训练稳定性但显存和训练速度有所增加。

    标签映射

    是否增加标签映射功能,增加预训练模型的迁移效果。

    权重衰减

    用于控制参数稀疏性,防止过拟合,不建议修改。

    热身阶段初始学习率

    热身阶段的初始学习率,一般从极小值开始,避免初期梯度混乱。

    热身步长

    此参数用于控制稳定训练初期的前N次步长数,该值应小于总训练步长(训练总步长=训练轮次*训练数据量÷单卡训练批处理大小÷总卡数),建议优先使用默认值。

    优化器

    优化器用于根据损失函数对模型参数进行更新,控制收敛方向和速度,支持的优化器包括:AdamW、SGD、Adam,建议使用默认值。

    学习率调度器

    学习率调度器决定了学习率动态调整的规则,支持以下常见学习率调度器:MultiStepLR、CosineAnnealingLR、OneCycleLR,建议使用默认值。

    梯度裁剪最大范数

    梯度裁剪的最大范数,用于防止梯度爆炸。当梯度的L2范数超过该值时,会将其按比例缩放至不超过max_norm,从而提升训练稳定性。

    设置为0时表示禁用梯度裁剪。建议在使用混合精度训练(AMP)时配合启用,以平衡训练效率与数值稳定性。

    滑动平滑训练

    在训练过程中,使用参数的指数移动平均值进行更新,而非直接使用原始参数,在训练数据少且噪声大时建议开启,保持训练稳定。

    日志打印间隔(迭代次数)

    在模型训练过程中,控制日志信息输出的打印间隔,单位为迭代次数。每经过指定轮数后,系统将打印一次训练状态信息,便于监控训练进程与性能表现。

    同步批量归一化

    是否使用同步批量归一化,开启时可提升多卡训练下的模型收敛稳定性与精度,但会增加一定训练时间。

    注意力机制偏移采样位置的插值方式

    设置为default时,使用双线性插值在连续空间中进行采样;设置为discrete时,将采样位置直接转换为整数像素索引进行离散采样。

    查询选择方法

    用于在模型解码阶段,从编码器输出中选取top-k初始查询的位置策略。设置为default时,按类别维度分别选取每类中得分最高的top-k位置。适用于标准多类别目标检测任务,保持类别区分性。设置为agnostic时,仅基于是否存在物体的综合置信度选择top-k位置,不考虑类别信息,适用于仅关注物体存在性的任务。

    Top-K最高置信度预测框数量

    用于控制后处理阶段保留的最高置信度预测框数量,密集检测场景可适当增大该值。

    数据增强轮次

    在训练过程中,指定进行数据增强的持续轮次。应设置为0~最大迭代轮次之间的数字。

    图像颜色扰动增强概率

    在生成训练数据集过程中,对原始图像应用颜色扰动增强的概率。当该值为1时,所有图像均进行颜色扰动增强;当值为0时,不进行独立的缩放外扩增强操作。

    图像缩放外扩增强概率

    在生成训练数据集过程中,对原始图像应用缩放外扩增强的概率。当该值为1时,所有图像均进行缩放外扩增强;当值为0时,不进行独立的缩放外扩增强操作。

    图像IoU裁剪增强概率

    在生成训练数据集过程中,对原始图像应用基于IoU裁剪增强的概率。当该值为1时,所有图像均进行IoU裁剪增强;当值为0时,不进行独立的裁剪操作。

    图像水平翻转增强概率

    在生成训练数据集过程中,对原始图像应用水平翻转增强的概率。当该值为1时,所有图像均进行水平翻转;当为0时,不进行独立的水平翻转操作。

    图像垂直翻转增强概率

    在生成训练数据集过程中,对原始图像应用垂直翻转增强的概率。当该值为1时,所有图像均进行垂直翻转;当为0时,不进行独立的垂直翻转操作。

    缩放是否保持宽高比

    对原始图像应用图像缩放时是否保持宽高比。当该值为True时,训练的图像缩放会保持宽高比;当为False时,训练的图像缩放会直接按照输入分辨率对图片进行不保持宽高比的缩放。推理时会采用和训练一致的缩放方式。

    是否添加背景类训练

    是否添加背景类训练的开关,默认关闭。开启时会对所有样本增加一个第0类的名为BACKGROUND-IIT的背景类别,用于提高空标注训练稳定性;关闭时按照原始输入的图像及其标注进行训练。在大量空标注图片训练情况下存在loss溢出风险,建议打开增加背景类训练开关。

    Pangu-CV-物体检测-S-V2

    数据集

    训练数据集。

    说明:数据集要求条目数不低于100条。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    批次大小

    表示每个训练步骤中使用的样本数量。较大的批量可以提供更稳定的梯度,但可能会增加计算资源的使用和训练时间。

    验证集图片保存最大数量

    用于限制验证过程中模型预测错误(与标注不符)的图片保存数量,便于后续分析错误类型,同时避免存储空间浪费。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。

    权重衰减

    通过在每次参数更新时对模型权重进行小幅度缩减,避免模型过度依赖特定数据。

    图像分辨率

    训练和推理时,指定统一图像分辨率尺寸。

    模型保存轮数

    模型训练时保存断点的间隔轮数。

    Pangu-CV-物体检测-N-V2

    数据集

    训练数据集。

    说明:数据集要求条目数不低于100条。

    训练轮数

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    热身轮次

    表示在模型训练初期,逐步增加学习率到预设值的训练轮次,用于帮助模型在训练初期稳定收敛,避免大幅度的参数更新导致不稳定的学习过程。

    热身阶段学习率

    热身轮次中使用的初始学习率。

    权重衰减

    用于防止模型过拟合。在更新模型权重时,它会对模型参数施加惩罚,使得权重值趋于较小,从而提高模型的泛化性能。

    优化器

    选择用于训练模型的优化算法。这里选择的“sgd”是随机梯度下降法,它是深度学习中常用的优化算法之一,适合大规模数据集训练。

    锚框的长边和短边的比例

    定义检测物体锚框的长宽比。通过设置不同的长短比例,模型可以更好地适应多种尺寸和形状的物体。

    锚框大小

    指锚框的初始尺寸。锚框是物体检测中的一个关键概念,通过合理设置,可以帮助模型检测出多种尺寸的目标。

    框重叠比例阈值

    用于计算损失时区分正负样本的IoU阈值。当候选框与某个真实框的IoU大于等于该阈值时,该候选框被视为正样本;否则视为负样本。

    滑动平滑训练

    一种训练策略,通过在模型预测的标签上添加少量噪声来避免过拟合,常用于提升模型在测试数据集上的泛化能力。

    极大值抑制阈值

    在预测多个边界框时,用于去除高度重叠的边界框。此阈值控制相似的边界框保留的条件。

    类别无关极大值抑制开关

    决定是否在不同类别中应用极大值抑制阈值。

    模型大小调整因子

    用于模型抽取过程中,选择不同的模型因子来调节模型参数的多少。

    输入模型图像宽度

    用于控制模型输入图像分辨率的宽度,以此调节适应不同场景的模型识别能力。

    输入模型图像高度

    用于控制模型输入图像分辨率的高度,以此调节适应不同场景的模型识别能力。

    模型保存轮数

    模型训练时保存断点的间隔轮数。

    Pangu-CV-图像分类-V2

    数据集

    训练数据集。

    说明:数据集要求条目数不低于100条。

    训练轮数

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    每卡批次大小

    表示每个训练步骤中使用的样本数量。较大的批量可以提供更稳定的梯度,但可能会增加计算资源的使用和训练时间。

    分类模式

    图像分类模式,支持单标签分类和多标签分类。

    超参搜索

    是否启用超参搜索获取最优的超参用于训练。

    初始学习率

    学习率决定了每次训练时模型参数更新的幅度。初始学习率是模型训练最开始阶段所设定的学习率,它是学习率的初始值。

    超参搜索训练轮数

    在超参搜索阶段,设置模型会经过几轮训练以找到最优的超参数组合。

    模型保存轮数

    模型训练时保存断点的间隔轮数,每次保存断点的同时会进行模型评估和指标计算,每次模型保存和评估预计会增加6分钟训练时长。

    热身轮数

    用于稳定训练初期的前几轮训练,小于总训练轮数,通常占总训练步数的5%~10%。

    权重衰减

    用于控制参数稀疏性,防止过拟合,不建议修改。

    图像分辨率

    训练和推理的统一图像分辨率尺寸,图像分辨率越大,显存占用越大,训练、推理速度越慢,在增大图像分辨率的同时应降低每卡批大小,避免因显存不足导致训练报错。

    Pangu-CV-实例分割-V1

    数据集

    训练数据集。

    说明:数据集要求条目数不低于100条。

    每卡批大小

    单张卡上每次前向传播使用的样本数量,每卡批大小*节点数*每节点卡数需要小于训练数据量。

    基础学习率

    用于控制参数更新的步长,学习率过大可能会导致训练过程震荡不稳,无法收敛到最优解,学习率过小,可能会导致训练过程非常缓慢。

    是否使用自定义L1预训练模型

    是否使用自定义预训练模型进行训练。

    自定义L1预训练模型目录

    自定义预训练模型所在的OBS路径。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    Pangu-CV-语义分割-V2

    数据集

    训练数据集。

    是否使用自定义L1预训练模型

    是否使用自定义预训练模型进行训练,模型为用户与服务共建可联系CV算法技术支持获取。

    自定义L1预训练模型目录

    自定义预训练模型所在的OBS路径。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    批次大小

    表示每个训练步骤中使用的样本数量。较大的批量可以提供更稳定的梯度,但可能会增加计算资源的使用和训练时间。

    是否忽略类别0

    该参数功能是为了忽略数据集类别0,具体做法是将类别0改为255,其余类别相应编号减1,同时decode head里将255设为ignore index,即不参与loss计算。

    学习率

    用于控制参数更新的步长,学习率过大可能会导致训练过程震荡不稳无法收敛到最优解,学习率过小可能会导致训练过程非常缓慢。

    是否启用梯度检查点

    梯度检查点是一种在深度学习中用于减少内存占用的技术。通过在前向传播过程中保存部分中间结果,并在反向传播过程中重新计算这些中间结果,可以显著减少模型训练时的内存消耗。

    图像分辨率

    训练和推理的统一图像分辨率尺寸, 要求为32的倍数,不符合要求会自动转换为最近的32倍数尺寸。

    优化器

    决定了模型参数更新的方式,取值范围: AdamW, Adam, SGD。

    L2正则化系数

    控制对模型权重的惩罚力度,weight_decay 越大对大权重的惩罚越大,模型倾向于更小的权重值,能有效防止模型在训练集上过拟合,提高泛化能力,取值范围: [0, 0.1]。

    Adam/AdamW动量系数

    Adam/AdamW 的动量系数,控制梯度一阶矩(均值)和二阶矩(方差)的指数移动平均衰减率。调整这些值会影响梯度的平滑度和自适应学习率的计算,进而影响收敛速度和稳定性,optimizer_type=AdamW或Adam时生效,取值范围: [0, 1]。

    学习率调度器

    决定学习率在训练过程中的变化方式。

    学习率衰减比例

    决定了学习率每次衰减的幅度,scheduler_type=StepLR时生效,取值范围: (0, 1]。

    单类别正值概率阈值

    仅有一个类别时类别预测为正值的概率阈值,取值范围: [0, 1]。

    水平翻转概率

    控制图片是否随机水平翻转,翻转可以增加数据量,让模型学习到对图像左右对称关系的不变性,减少过拟合,取值范围: (0, 1]。

    随机旋转概率

    控制图片是否进行随机小角度旋转,旋转可以增加数据量,让模型学习到对目标方向变化的不变性,增强对目标姿态变化的鲁棒性,默认0表示该增强默认禁用,取值范围: [0, 1]。

    亮度调整最大增量

    在PhotoMetricDistortion 中使用,控制亮度随机调整的范围 [-32, 32],增强模型对不同光照条件下的鲁棒性。 Delta 越大,光照变化越大,模型抗光照干扰能力越强,取值范围: [0, 100]。

    对比度调整乘数范围

    随机将图片对比度乘以0.5到1.5之间的因子,增强模型对图像灰度级分布变化的鲁棒性,范围越大扰动越强,取值范围: 大于等于0。

    饱和度调整乘数范围

    随机将图片饱和度乘以0.5到1.5之间的因子,增强模型对色彩鲜艳度变化的鲁棒性,范围越大模型对颜色干扰的容忍度越高,取值范围: 大于等于0。

    随机缩放比例范围

    在RandomResize中使用,以默认值为例图像尺寸将在0.5倍到2倍之间随机变化,这是实现随机多尺度训练的关键,迫使模型学习到对目标尺寸变化的不变性,对语义分割任务至关重要,取值范围: [0, 10]。

    缩放时是否保持宽高比

    保持宽高比可以防止目标失真,是目标检测和语义分割的标准做法,不保持则会导致图像变形,通常只在特定分类任务中使用。

    裁剪区域中某一类别的最大像素占比限制

    在RandomCrop中使用,如果当前裁剪区域中某一类占比大于这个阈值会被过滤,取值范围: (0, 1]。

    随机模糊概率

    确保并非所有样本都被模糊,从而平衡模型的鲁棒性与对清晰图像的性能,取值范围: [0, 1]。

    数据加载工作进程数

    定义了用于并行加载数据的CPU进程数量,合理的num_workers可以减少数据加载的瓶颈,提高CPU利用率,如果设置过高可能导致CPU负载过重或内存不足,取值范围:1-32。

    随机种子

    它用于初始化随机数生成器,确保每次运行代码时生成的随机数序列是相同的,这在实验的可重复性和调试过程中尤为重要。

    模型保存间隔

    定义了每隔多少个Epoch保存一次模型权重文件,取值范围:[1, training_epochs]。

    评估间隔

    定义了每隔多少个Epoch在验证集上评估模型性能,取值范围:[1, training_epochs]。

    Pangu-CV-万物检测-V2

    数据集

    训练数据集。

    说明:数据集要求条目数不低于100条。

    参数量

    模型参数量规模分3亿和44亿两种参数规模。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    批次大小

    表示每个训练步骤中使用的样本数量。较大的批量可以提供更稳定的梯度,但可能会增加计算资源的使用和训练时间。

    验证间隔

    使用验证集验证模型效果的轮次间隔,越频繁,训练时间越长。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。

    权重衰减

    通过在每次参数更新时对模型权重进行小幅度缩减,避免模型过度依赖特定数据。

    学习率调度器

    学习率调度器,支持常见调度器:cosine、reduceOnPlateau、multiStep,建议使用default即默认学习率调度器,300m参数量模型的默认调度器为reduceOnPlateau,4.4B参数量模型的默认调度器为multiStep。

    优化器

    优化器,支持两种常见优化器:AdamW、Adam,建议使用默认优化器AdamW。

    图像大小

    图像大小需要是32的倍数,图像越大训练推理越慢,占用显存越多。

    Pangu-CV-视觉交互检测-V3

    训练模式

    训练模式:开集训练或者闭集训练。开集训练得到的模型支持任务文本或者视觉提示检测,可检测没有在训练集中出现过的类目。闭集检测同传统目标检测模型,仅可检测训练过的类目。闭集检测在固定类目上表现可能更优,用户可根据实际情况选择。

    训练总epoch数

    用于调节整个训练集被完整遍历的次数,与训练时间成正比,取值范围1~1000,默认值10(小数据集一般需要更多轮次的训练)。

    每卡批大小

    单卡batch size,训练设置的图像Resize尺寸越大所需要的显存越大,batch size则需要设置偏小。

    昇腾910B典型设置:设置训练图像Resize尺寸640*640时,batch_size可以设置为6,1024*768时 batch_size可以设置为4,2048*2048时仅能设置为1。

    如果遇到报显存不足,请减小batch_size或者调小图像训练宽和高后再试。

    学习率

    用于控制参数更新的步长,学习率过大可能会导致训练过程震荡不稳,无法收敛到最优解,学习率过小,可能会导致训练过程非常缓慢。取值为大于0,小于等于1,建议使用默认学习率,0.0001。

    微调参数规模

    模型微调参数量规模,full代表全量参数更新,medium代表中等规模参数更新,small代表少量参数更新。当与预训练模型训练的数据分布接近,训练数据较少时可以减少更新参数量, 一般建议使用full效果更好。

    图像宽度

    训练时图片Resize后的宽度,Resize尺寸越大对小目标效果越好但是所需要显存更大,训练推理时延更慢。

    图像高度

    训练时图片Resize后的高度,Resize尺寸越大对小目标效果越好但是所需要显存更大,训练推理时延更慢。

    梯度累加次数

    训练过程经过多少次batch进行梯度累加回传更新模型参数,通过增加训练epoch,可以实现在不增加显存的情况下 达到更大的batch size效果。等价

    每卡批大小= 设置的每卡批大小 * 梯度累加次数。 相应的epoch 数也应该扩大。

    学习率调度器

    学习率调度器决定了学习率动态调整的规则,支持以下常见学习率调度器:cosine和multistep,建议使用默认multistep。

    优化器

    优化器用于根据损失函数对模型参数进行更新,控制收敛方向和速度,支持三种常见优化器:AdamW、SGD、Adam,建议使用默认优化器AdamW。

    权重衰减

    用于控制参数稀疏性,防止过拟合,不建议修改。

    Pangu-CV-异常检测-V3

    数据集

    训练数据集。

    数据标注模式

    label:文本标注,异常标注为abnormal,正常normal。当前数据标注模式仅支持label类型。

    训练模式

    异常检测3.0包含闭集close_train和开集open_train两个模型。其中闭集close_train轻量高效、参数极简,适合对性能要求较高场景。开集open_train强泛化能力,可实现开箱即用、零样本推理,同时支持少样本微调,在无需大量标注数据的情况下即可在多种工业场景中高效部署并保持高精度。

    训练轮次

    用于调节整个训练集被完整遍历的次数,与训练时间成正比,取值范围1~1000,默认值50(小数据集一般需要更多轮次的训练)。

    批次大小

    表示每个训练步骤中使用的样本数量。较大的批量可以提供更稳定的梯度,单卡训练批处理大小值越大需要的NPU显存越多,如果提示显存不足,请减小单卡训练批处理大小或者降低图像分辨率再试。

    学习率

    用于控制参数更新的步长,学习率过大可能会导致训练过程震荡不稳,无法收敛到最优解,学习率过小,可能会导致训练过程非常缓慢。

    图像尺寸

    训练时图片Resize后的尺寸,Resize尺寸越大对小目标效果越好但是所需要显存更大,训练推理时延更慢。默认518,图像分辨率值越大需要的NPU显存越多,如果提示显存不足,请降低图像分辨率或者减小单卡训练批处理大小再试。

    优化器

    优化器用于根据损失函数对模型参数进行更新,控制收敛方向和速度,支持的优化器包括:AdamW、Adam,该参数为高级参数用于性能优化时使用,通常建议使用默认值。

    验证集评估epoch间隔

    经过多少训练轮数epoch进行一次模型效果验证并决定是否更新最优模型;该值越小越可能选择出最佳模型,但是训练时长会增加;该参数应该大于等于1且小于等于训练轮数。

    学习率调度器

    学习率调度器决定了学习率动态调整的规则,支持以下常见学习率调度器:MultiStepLR、CosineAnnealingLR。该参数为高级参数用于性能优化时使用,通常建议使用默认值。

    权重衰减

    用于控制参数稀疏性,防止过拟合,不建议修改,该参数为高级参数用于性能优化时使用,通常建议使用默认值。

    开启高斯噪声

    该参数仅闭集训练时使用,是否在训练过程中给图像增加高斯噪声,增强模型对随机噪声的鲁棒性,适用于传感器干扰,低光照等场景;该参数为高级参数用于性能优化时使用,通常建议使用默认值。

    开启perin噪声

    该参数仅闭集训练时使用,是否在训练过程中给图像增加Perlin 噪声,增强模型对“真实世界微小扰动”的鲁棒性,适用于工业质检,医学影像等场景;该参数为高级参数用于性能优化时使用,通常建议使用默认值。

    perin噪声阈值

    该参数仅闭集训练时使用,控制Perlin 噪声的阈值,阈值越小噪声区域越大模拟大面积异常,反之则模拟的噪声区域越小。例如:普通污渍、脏点 可以考虑设置0.3-0.5,裂纹、小孔等缺陷可以考虑设置0.5-0.7,微小划痕可以考虑设置0.7-09;该参数为高级参数用于性能优化时使用,通常建议使用默认值。

    特征处理起始层

    该参数仅开集训练时使用,该参数和特征层选择列表有关联,决定特征层选择列表中从哪一层开始参与训练,最小值0,最大值为特征层选择列表的长度-1。例如当特征选择列表值为[6,12,24],特征处理起始层设置为0会选择6 12 24层特征参与训练,设置为1会选择12 24层特征训练,设置为2时仅会选择24层参与训练;当特征选择列表值为[12,24],特征处理起始层设置为0时会选择12 24层特征参与训练而设置为1时只会选择24层特征训练;当特征选择列表值为[24]时,特征处理起始层仅能设置为0。该参数为高级参数用于性能优化时使用,通常建议使用默认值。

    特征层选择列表

    该参数仅开集训练时使用,指定要提取的特征层,用于组合不同抽象程度的特征。不同的特征层会影响模型关注的特征类型。在异常检测中,某些异常(如局部缺陷)在底层特征中明显,而某些异常(如结构错误)在高层特征中更易识别。组合多种特征可以覆盖更广泛的异常类型,特征层选择列表只支持整数级组合且不超过3层组合,特征层最小值值为0,最大值为24,选择的特征层列表需要从小到大排列并用英文的逗号,进行连接并且不包含空格,例如:[24]或者[12,24]或者[6,12,24]。该参数为高级参数用于性能优化时使用,通常建议使用默认值。

    Pangu-CV-万物分割-V2

    数据集

    训练数据集。

    参数量

    模型参数量规模分3亿和44亿两种参数规模。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。

    训练轮次

    表示完成全部训练数据集训练的次数。每个轮次都会遍历整个数据集一次。

    批次大小

    表示每个训练步骤中使用的样本数量。较大的批量可以提供更稳定的梯度,但可能会增加计算资源的使用和训练时间。

    任务类型

    训练的任务类型,支持两种类型:语义分割semantic和实例分割instance, 默认为语义分割semantic, 注意需选择和该任务一致的数据集进行训练,否则会导致训练失败。实例分割instance默认仅支持300m模型训练,不一致时会转换为300m模型训练。

    Pangu-CV-开集分类-V3

    数据集

    训练数据集。

    自定义L1预训练模型目录

    用于选择预训练权重,目录模型文件存在时生效,不存在不生效。

    训练轮数

    用于调节整个训练集被完整遍历的次数,与训练时间成正比,取值范围1~1000,默认值50(小数据集一般需要更多轮次的训练)。

    热身轮数

    用于稳定训练初期的前几轮训练,小于总训练轮数,通常占总训练步数的5%~10%。

    每卡批大小

    单张卡上每次前向传播使用的样本数量,每卡批大小*节点数*每节点卡数需要小于训练数据量。

    初始学习率

    模型保存间隔

    图像分辨率

    用于控制参数更新的步长,学习率过大可能会导致训练过程震荡不稳,无法收敛到最优解。学习率过小,可能会导致训练过程非常缓慢,当打开超参搜索时该参数无效。

    模型训练时保存断点的间隔轮数,每次保存断点的同时会进行模型评估和指标计算,每次模型保存和评估预计会增加6分钟训练时长。

    训练和推理的统一图像分辨率尺寸,图像分辨率越大,显存占用越大,训练、推理速度越慢,在增大图像分辨率的同时应降低每卡批大小,避免因显存不足导致训练报错。

  4. 参数填写完成后,单击“立即创建”。
  5. 创建好训练任务后,页面将返回“模型训练”页面,可随时查看当前任务的状态。

相关文档