调优典型问题
科学计算大模型调优典型问题见表1。
问题 |
可能原因 |
解决方法 |
---|---|---|
预训练或微调作业失败,提示训练集数据不足。 |
训练集选取时间区段是否不足。 |
训练集选择的时间区段需要至少超过模型分辨率对应时长。 |
预训练或微调作业失败,提示验证集数据不足。 |
验证集选取时间区段是否不足。 |
验证集选择的时间区段需要满足表2对应关系,请相应地延长验证集的时间区段时长。 |
数据集中盐度(S)变量在下载过程中,如图1、图2,存在数据块缺失与数据块偏移的问题,将导致训练过程中盐度损失异常,波动大且不收敛,如图3。 |
模型训练前,未对数据进行加工。 模型训练前,需要对数据进行加工,防止某些特征存在极端异常值或大面积错误数据,导致模型训练不稳定。可能会引发如下问题:
|
删除异常值后,盐度(S)损失收敛正常,如图4。 |