更新时间:2025-09-16 GMT+08:00
分享

创建视频生成大模型训练任务

创建视频生成大模型预训练任务

创建视频生成大模型预训练任务步骤如下:

  1. 登录ModelArts Studio平台,在“我的空间”模块,单击进入所需空间。
    图1 我的空间
  2. 在左侧导航栏中选择“模型开发 > 模型训练”,单击界面右上角“创建训练任务”。
  3. 在“选择模型”页面,选择“模型广场 > 多模态大模型 > 模型”,单击“确定”进入“创建训练任务”页面。
  4. 模型选择完成后,参考表1 视频生成大模型预训练参数说明完成训练参数设置。
    表1 视频生成大模型预训练参数说明

    参数分类

    训练参数

    参数说明

    训练配置

    选择模型

    可以修改如下信息:

    • 来源:选择“模型广场”。
    • 类型:选择“多模态大模型”,并选择训练所用的基础模型和版本。

    训练类型

    选择“预训练”。

    高级设置checkpoints

    断点续训,模型训练任务过程中,用于保存模型权重和状态的机制。“关闭”则不开启断点续训;“自动”保存训练过程中所有的checkpoint;“自定义”保存指定数量的checkpoint。需要注意:保存过多的checkpoint会占用较大的OBS存储。

    开启断点续训后对于未训练完成的模型,可以通过单击训练任务名称,进入“训练结果”页签,通过“编辑训练”入口选中需要进行断点续训的checkpoint进行续训。

    训练参数

    首帧能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    首尾帧能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    尾帧能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    续写能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    训练轮数

    指完成全部训练数据集训练的次数。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。选择合适的学习率非常重要:如果学习率太大,模型可能会无法收敛;如果学习率太小,模型的收敛速度会变得非常慢。

    权重衰减比率

    权重衰减比率的主要作用是通过惩罚复杂的模型参数来减少过拟合。

    模型保存步数

    训练过程中每隔多少个训练步长保存一次模型Checkpoint文件。

    是否提取首帧特征

    is_i2v,是否提取首帧特征,1为提取,0为不提取,默认提取。

    是否提取尾帧特征

    is_i2v_end,是否提取尾帧特征,1为提取,0为不提取,默认提取。

    是否提取视频续写特征

    is_v2v,是否提取视频续写特征,1为提取,0为不提取,默认提取。

    数据配置

    训练数据

    选择训练模型所需的数据集。要求数据集经过发布操作,发布数据集操作方法请参见发布数据集

    资源配置

    计费模式

    选择训练当前任务的计费模式。

    训练单元

    选择训练模型所需的训练单元。

    当前展示的完成本次训练所需要的最低训练单元要求。

    单实例训练单元数

    选择单实例训练单元数。

    实例数

    选择实例数。

    优先级

    资源调度优先级,优先级相同的任务先创建先执行。

    订阅提醒

    订阅提醒

    该功能开启后,系统将在任务状态更新时,通过短信或邮件将提醒发送给用户。

    发布模型

    开启自动发布

    开启自动发布后,模型训练完成的最终产物会自动发布为空间资产,以便对模型进行压缩、部署、评测等操作或共享给其他空间。

    故障自动重启

    自动重启

    该功能开启后,当训练作业发生故障终止本次作业时,自动从本次中断的作业继续训练。

    基本信息

    名称

    训练任务名称。

    描述

    训练任务描述。

  5. 参数填写完成后,单击“立即创建”。
  6. 创建好训练任务后,页面将返回“模型训练”页面,可随时查看当前任务的状态。

创建视频生成大模型微调任务

创建视频生成大模型全量微调任务步骤如下:

  1. 登录ModelArts Studio平台,在“我的空间”模块,单击进入所需空间。
    图2 我的空间
  2. 在左侧导航栏中选择“模型开发 > 模型训练”,单击界面右上角“创建训练任务”。
  3. 在“创建训练任务”页面,模型类型选择“多模态大模型”,选择“Pangu-MM-M2-AIGVideo”视频生成大模型,训练类型选择“微调”。模型选择完成后,设置plog日志,参考表2完成训练参数设置。
    表2 视频生成大模型微调训练参数说明

    参数分类

    训练参数

    参数说明

    训练配置

    模型类型

    选择“多模态大模型”

    训练类型

    选择“微调”。

    基础模型

    选择微调训练所用的基础模型, 可从“预置模型”或者“我的模型”中进行选择。

    高级设置checkpoints

    断点续训,模型训练任务过程中,用于保存模型权重和状态的机制。“关闭”则不开启断点续训;“自动”保存训练过程中所有的checkpoint;“自定义”保存指定数量的checkpoint。需要注意:保存过多的checkpoint会占用较大的OBS存储。

    开启断点续训后对于未训练完成的模型,可以通过单击训练任务名称,进入“训练结果”页签,通过“编辑训练”入口选中需要进行断点续训的checkpoint进行续训。

    训练参数

    首帧能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    首尾帧能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    尾帧能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    续写能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    训练轮数

    指完成全部训练数据集训练的次数。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。选择合适的学习率非常重要:如果学习率太大,模型可能会无法收敛;如果学习率太小,模型的收敛速度会变得非常慢。

    权重衰减比率

    权重衰减比率的主要作用是通过惩罚复杂的模型参数来减少过拟合。

    模型保存步数

    训练过程中每隔多少个训练步长保存一次模型Checkpoint文件。

    是否提取首帧特征

    is_i2v,是否提取首帧特征,1为提取,0为不提取,默认提取。

    是否提取尾帧特征

    is_i2v_end,是否提取尾帧特征,1为提取,0为不提取,默认提取。

    是否提取视频续写特征

    is_v2v,是否提取视频续写特征,1为提取,0为不提取,默认提取。

    数据配置

    训练数据

    选择训练模型所需的数据集。要求数据集经过发布操作,发布数据集操作方法请参见发布数据集

    资源配置

    计费模式

    选择训练当前任务的计费模式。

    训练单元

    选择训练模型所需的训练单元。

    当前展示的完成本次训练所需要的最低训练单元要求。

    单实例训练单元数

    选择单实例训练单元数。

    实例数

    选择实例数。

    优先级

    资源调度优先级,优先级相同的任务先创建先执行。

    订阅提醒

    订阅提醒

    该功能开启后,系统将在任务状态更新时,通过短信或邮件将提醒发送给用户。

    发布模型

    开启自动发布

    开启自动发布后,模型训练完成的最终产物会自动发布为空间资产,以便对模型进行压缩、部署、评测等操作或共享给其他空间。

    故障自动重启

    自动重启

    该功能开启后,当训练作业发生故障终止本次作业时,自动从本次中断的作业继续训练。

    基本信息

    名称

    训练任务名称。

    描述

    训练任务描述。

  4. 参数填写完成后,单击“立即创建”。
  5. 创建好训练任务后,页面将返回“模型训练”页面,可随时查看当前任务的状态。

创建视频生成大模型蒸馏任务

创建视频生成大模型蒸馏任务步骤如下:

  1. 登录ModelArts Studio平台,在“我的空间”模块,单击进入所需空间。
    图3 我的空间
  2. 在左侧导航栏中选择“模型开发 > 模型训练”,单击界面右上角“创建训练任务”。
  3. 在“创建训练任务”页面,模型类型选择“多模态大模型”,选择“Pangu-MM-M2-AIGVideo”视频生成大模型,训练类型选择“蒸馏”。参考表3完成训练参数设置。
    表3 视频生成大模型蒸馏训练参数说明

    参数分类

    训练参数

    参数说明

    训练配置

    选择模型

    可重新选择蒸馏训练所用的基础模型,及模型版本。

    来源:模型广场表示预置模型;我的资产表示经过训练发布的用户模型。

    类型:选择多模态大模型。

    训练类型

    选择“蒸馏”。

    高级设置checkpoints

    断点续训,模型训练任务过程中,用于保存模型权重和状态的机制。“关闭”则不开启断点续训;“自动”保存训练过程中所有的checkpoint;“自定义”保存指定数量的checkpoint。需要注意:保存过多的checkpoint会占用较大的OBS存储。

    开启断点续训后对于未训练完成的模型,可以通过单击训练任务名称,进入“训练结果”页签,通过“编辑训练”入口选中需要进行断点续训的checkpoint进行续训。

    训练参数

    首帧能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    首尾帧能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    尾帧能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    续写能力训练数据比例

    本模型具备首帧、首尾帧、尾帧、续写四项能力,可以同时进行训练,各项能力训练所使用的数据占比。注意:所有数据占比的和应为1。

    训练轮数

    指完成全部训练数据集训练的次数。

    学习率

    学习率决定了每次训练时模型参数更新的幅度。选择合适的学习率非常重要:如果学习率太大,模型可能会无法收敛;如果学习率太小,模型的收敛速度会变得非常慢。

    权重衰减比率

    权重衰减比率的主要作用是通过惩罚复杂的模型参数来减少过拟合。

    模型保存步数

    训练过程中每隔多少个训练步长保存一次模型Checkpoint文件。

    模型下载并发数

    训练初期并发多少个节点同时下载模型文件。

    模型下载预计耗时

    单次模型下载预计耗时,单位秒。

    处理后数据集路径

    处理后数据集路径。

    使用上下文并行性

    使用上下文并行性

    上下文并行性数量

    上下文并行性数量

    数据配置

    训练集

    选择训练模型所需的数据集。要求数据集经过发布操作,发布数据集操作方法请参见发布数据集

    资源配置

    计费模式

    选择训练当前任务的计费模式。

    训练单元

    选择训练模型所需的训练单元。

    当前展示的完成本次训练所需要的最低训练单元要求。

    单实例训练单元数

    选择单实例训练单元数。

    实例数

    选择实例数。

    优先级

    资源调度优先级,优先级相同的任务先创建先执行。

    订阅提醒

    订阅提醒

    该功能开启后,系统将在任务状态更新时,通过短信或邮件将提醒发送给用户。

    发布模型

    开启自动发布

    开启自动发布后,模型训练完成的最终产物会自动发布为空间资产,以便对模型进行压缩、部署、评测等操作或共享给其他空间。

    故障自动重启

    自动重启

    该功能开启后,当训练作业发生故障终止本次作业时,自动从本次中断的作业继续训练。

    基本信息

    名称

    训练任务名称。

    描述

    训练任务描述。

  4. 参数填写完成后,单击“立即创建”。
  5. 创建好训练任务后,页面将返回“模型训练”页面,可随时查看当前任务的状态。

相关文档