盘古大模型 PanguLargeModels
盘古大模型 PanguLargeModels
- 功能总览
- 产品介绍
- 计费说明
- 快速入门
- 用户指南
- 最佳实践
- API参考
- SDK参考
-
常见问题
- 高频常见问题
- 大模型概念类
-
大模型微调训练类
- 无监督领域知识数据量无法支持增量预训练,如何进行模型学习
- 如何调整训练参数,使盘古大模型效果最优
- 如何判断盘古大模型训练状态是否正常
- 如何评估微调后的盘古大模型是否正常
- 如何调整推理参数,使盘古大模型效果最优
- 为什么微调后的盘古大模型总是重复相同的回答
- 为什么微调后的盘古大模型的回答中会出现乱码
- 为什么微调后的盘古大模型的回答会异常中断
- 为什么微调后的盘古大模型只能回答训练样本中的问题
- 为什么在微调后的盘古大模型中输入训练样本问题,回答完全不同
- 为什么微调后的盘古大模型评估结果很好,但实际场景表现很差
- 为什么多轮问答场景的盘古大模型微调效果不好
- 数据量足够,为什么盘古大模型微调效果仍然不好
- 数据量和质量均满足要求,为什么盘古大模型微调效果不好
- 大模型使用类
- 提示词工程类
- 文档下载
- 通用参考
本文导读
展开导读
链接复制成功!
微调典型问题
科学计算大模型微调典型问题见表1。
问题 |
可能原因 |
解决方法 |
---|---|---|
预训练或微调作业失败,提示训练集数据不足。 |
训练集选取时间区段是否不足。 |
训练集选择的时间区段需要至少超过模型分辨率对应时长。 |
预训练或微调作业失败,提示验证集数据不足。 |
验证集选取时间区段是否不足。 |
验证集选择的时间区段需要满足表2对应关系,请相应地延长验证集的时间区段时长。 |
数据集中盐度(S)变量在下载过程中,如图1、图2,存在数据块缺失与数据块偏移的问题,将导致训练过程中盐度损失异常,波动大且不收敛,如图3。 |
模型训练前,未对数据进行加工。 模型训练前,需要对微调数据进行加工,防止某些特征存在极端异常值或大面积错误数据,导致模型训练不稳定。可能会引发如下问题:
|
删除异常值后,盐度(S)损失收敛正常,如图4。 |
父主题: 盘古科学计算大模型微调训练实践