科学计算大模型训练常见报错与解决方案
科学计算大模型训练常见报错及解决方案请详见表1。
常见报错 |
问题现象 |
原因分析 |
解决方案 |
---|---|---|---|
创建训练任务时,数据集列表为空 |
创建训练任务时,数据集选择框中显示为空,无可用的训练数据集。 |
数据集未发布。 |
请提前创建与大模型对应的训练数据集,并完成数据集发布操作。 |
训练日志提示“root: XXX valid number is 0”报错 |
日志提示“root: XXX valid number is 0”,表示训练集/验证集的有效样本量为0,例如: INFO: root: Train valid number is 0. |
该日志表示数据集中的有效样本量为0,可能有如下原因:
|
请检查数据是否已标注或标注是否符合算法要求。 |