创建模型微调任务

模型微调是指调整大型语言模型的参数以适应特定任务的过程，适用于需要个性化定制模型或者在特定任务上追求更高性能表现的场景。这是通过在与任务相关的微调数据集上训练模型来实现的，所需的微调量取决于任务的复杂性和数据集的大小。在深度学习中，微调用于改进预训练模型的性能。

支持将平台资产中心预置的部分模型作为微调前基础模型，也可以选择微调后的新模型作为基础模型再次进行微调。

在AI原生应用引擎的左侧导航栏选择“模型中心 > 模型微调流水线”。

对于平台预置的模型，也可以在左侧导航栏单击“资产中心”，将鼠标移至大模型卡片并单击“微调”，进入模型微调页面。
在模型微调流水线页面，单击“创建微调任务”，选择“Functioncall能力增强微调”或“通用能力增强微调”。
- Functioncall能力增强微调：具备Functioncall能力的模型能够识别并执行函数调用或API调用，通过功能调用微调数据集增强模型的扩展性。
- 通用能力增强微调：广泛应用于各个领域，针对特定任务或行业需求，通过领域微调数据集增强模型领域能力。

在创建微调任务页面，参照表1配置基础信息、模型及数据。

表1 创建微调任务参数说明
参数名称		参数说明
基础信息	任务名称	自定义任务名称。支持英文、数字、中划线（-）、下划线（_），长度1-64个字符，仅支持字母或下划线开头。
基础信息	任务描述(可选)	自定义任务相关的描述。
模型配置	微调前模型	在下拉列表中选择微调的模型或平台预置的模型。
	训练模式	默认为“LoRA”。 LoRA（Low-Rank Adaptation，低秩适应），是一种将预训练模型权重冻结，并将可训练的秩分解矩阵注入Transformer架构每一层的技术，该技术可减少下游任务的可训练参数数量。
	微调后名称	自定义模型微调后的新名称。支持英文、数字、中划线（-）、下划线（_），长度1-64个字符，仅支持字母或下划线开头。
数据配置	选择微调数据集	单击“选择微调数据集”，选择“我创建的”或“我收藏的”数据集。
任务配置	资源池	选择执行任务的资源池，在下拉列表可以看到各资源池的可用卡数，根据实际情况选择。

单击“下一步”，分别参照表2和表3配置基础参数、LoRA参数。

表2 基础参数配置说明
参数英文名	参数中文名	参数说明
global_bs	各设备batch size综合	表示多个设备上使用的总样本数量。
num_train_epochs	训练epoch数	优化算法在完整训练数据集上的工作轮数。
learning_rate	学习率	学习率是每一次迭代中梯度向损失函数最优解移动的步长。
weight_decay	权重衰减因子	对模型参数进行正则化的一种因子，可以缓解模型过拟合现象。
warmup_ratio	学习率热启动比例	学习率热启动参数，一开始以较小的学习率去更新参数，然后再使用预设学习率，有效避免模型震荡。

表3 LoRA参数配置说明
参数英文名	参数中文名	参数说明
lora_rank	秩	LoRA微调中的秩。
lora_alpha	缩放系数	LoRA微调中的缩放系数。
target_modules	LoRA微调层	LoRA微调的layer名关键字。 baichuan系列：down_proj,gate_proj,up_proj,W_pack,o_proj chatglm系列：dense_4h_to_h,dense_h_to_4h,dense,query_key_value

表4 更多操作
操作	说明
查看任务详情	在“模型微调流水线”页面的任务列表中，单击任务名称或单击“操作”列“更多 > 运行日志”，查看任务的基础信息、参数信息、运行日志以及Loss曲线等详情，并支持对模型之间的关系进行溯源。
重新创建任务	在“模型微调流水线”页面的任务列表中，单击“操作”列“更多 > 重新创建”。在“修改微调任务”页面，参照3~4进行配置。
删除任务	在“模型微调流水线”页面的任务列表中，单击“操作”列“更多 > 删除”。单击“确认”。
启用任务	在“模型微调流水线”页面的任务列表中，单击“操作”列“启用”。单击“确认”。
停用任务	在“模型微调流水线”页面的任务列表中，单击“操作”列“停用”。单击“确认”。
发布任务	运行完成后，点发布完成后，生成更优的新模型。

提供反馈

提交成功！非常感谢您的反馈，我们会继续努力做到更好！您可在我的云声建议查看反馈及问题处理状态。

系统繁忙，请稍后重试

在使用文档中是否遇到以下问题

内容与产品页面不一致

内容不易理解

缺失示例代码

步骤不可操作

搜不到想要的内容

缺少最佳实践

意见反馈（选填）

0/500

请至少选择一项反馈信息并填写问题反馈

字符长度不能超过500

直接提交取消

如您有其它疑问，您也可以通过华为云社区问答频道来与我们联系探讨

7*24