更新时间:2025-07-30 GMT+08:00
分享

预测大模型训练流程与选择建议

预测大模型训练流程介绍

目前,预测大模型支持微调训练、预训练。

  • 微调阶段:微调阶段通过在特定领域的数据集上进一步训练,使模型能够更有效地应对具体的任务需求。在微调过程中,通过设定训练指标来监控模型的表现,确保其达到预期的效果。完成微调后,将对用户模型进行评估并进行最终优化,以确保满足业务需求,然后将其部署和调用,用于实际应用。针对部分预测大模型类型,开放增量微调,微调后的模型可以直接部署,也可以继续进行二次微调训练,以应对下游任务场景调整而引起的数据分布变化。
  • 预训练阶段:通过在大规模通用数据集上训练,使模型学习到通用特征,使得模型在面对不同类下游任务时,能够快速捕捉到关键信息,提升了模型的训练效率和泛化能力。

预测大模型选择建议

选择合适的预测大模型类型有助于提升训练任务的准确程度。您可以根据模型适用场景,选择合适的模型,从而提高模型的整体效果,详见表1

表1 预测大模型的类型

模型名称

适用场景

盘古融合推荐异常检测大模型(Pangu-Predict-Anom-Table-2.0.0)

异常检测模型用于识别数据集中的异常或离群点,常应用于安全、质量控制等领域。

  • 矿山行业:进行设备故障检测,例如监控设备运行数据,识别异常行为,防止设备故障。
  • 电力行业:进行电网异常检测,例如监控电网运行状态,识别异常情况,防止电网故障。

预测大模型提供了两种异常检测大模型,支持多种场景下的异常检测任务:

  1. 盘古时序异常检测大模型,支持时序数据的异常检测任务,支持预训练、微调、以及二次微调。
    1. 预训练:使用设备历史正常数据对时序异常检测大模型进行全量训练,使其更好地学习并重构正常数据的潜在特征分布。在推理阶段,利用模型对输入样本的重构误差作为异常判别依据:若重构效果显著下降,则表明该样本偏离正常模式,具有潜在异常趋势,从而实现对异常数据的有效检测与区分。
    2. 微调:在时序异常检测大模型基础上引入分类头,并在训练过程中冻结模型的主干网络,仅使用历史中包含正常与异常样本的混合数据对新增分类头进行微调。通过此方式,将原始问题转化为针对特定时间点的二分类任务,判断其状态为正常或异常。
  2. 盘古融合推荐异常检测大模型,支持结构化数据的异常检测二分类任务

盘古时序异常检测大模型(Pangu-Predict-Anom-TS-2.1.0)

盘古统一编码时序预测分类大模型(Pangu-Predict-Cla-TS-2.1.0)

分类模型用于预测离散类别,可以应用于各种分类任务。

  • 矿山行业:进行智能洗选,例如根据煤炭的特征,将煤炭分类,提高洗选效率,降低能耗。
  • 油气行业:进行地质分层,例如基于地质数据,对不同地层进行分类,识别储层和非储层,提高勘探和开发效率。进行岩性识别,例如对不同岩石类型进行分类,帮助识别岩石的性质和特征,指导钻井和开采。进行流体识别,例如根据测井数据,识别储层中的油、气、水等流体类型。

预测大模型提供了两种分类大模型,支持多种场景下的分类任务:

  1. 盘古统一编码时序预测/表格预测分类大模型,支持时序数据/结构化数据分类预测任务,支持二次微调功能。
  2. 盘古融合推荐分类大模型,支持结构化数据分类预测任务。极简模式提供效率优先等极简训练配置,实现高效开发。

盘古统一编码表格预测分类大模型(Pangu-Predict-Cla-Table-2.2.0)

盘古融合推荐分类大模型(Pangu-Predict-Cla-Table-2.0.0)

盘古融合推荐分类大模型-极简模式(Pangu-Predict-Cla-Table-2.1.0)

盘古统一编码时序预测回归大模型(Pangu-Predict-Reg-TS-2.1.0)

回归模型用于预测连续性数值,在工业场景中广泛用于工艺参数和性能指标的预测。

  • 矿山行业:进行智慧配煤,例如预测焦炭成分质量,优化配煤比例,提高焦炭质量,降低生产成本。进行智能浓缩,例如预测焦炭成分质量,优化配煤比例,提高焦炭质量,降低生产成本。
  • 油气行业:进行储层参数预测,例如预测储层的物理参数,如孔隙度、渗透率等,提高油气资源的开发利用效率。进行产能分级预测,例如预测油井的产能等级,优化油气生产计划。
  • 电力行业:进行电力负荷预测,例如根据历史负荷数据,预测未来的电力负荷,优化电力生产和调度。
  • 钢铁行业:进行钢水温度预测,例如预测钢水温度,提高浇注和连铸的准确性和效率。

预测大模型提供了两种回归大模型,支持不同场景下的回归任务:

  1. 盘古统一编码时序预测/表格预测回归大模型,支持时序数据/结构化数据回归预测任务,支持二次微调功能。
  2. 盘古融合推荐预测大模型,支持结构化数据回归预测任务。极简模式提供效率优先等极简训练配置,实现高效开发。

盘古统一编码表格预测回归大模型(Pangu-Predict-Reg-Table-2.2.0)

盘古融合推荐回归大模型(Pangu-Predict-Reg-Table-2.0.0)

盘古融合推荐回归大模型-极简模式(Pangu-Predict-Reg-Table-2.1.0)

相关文档