预测大模型训练流程与选择建议
预测大模型训练流程介绍
目前,预测大模型支持微调训练、预训练。
- 微调阶段:微调阶段通过在特定领域的数据集上进一步训练,使模型能够更有效地应对具体的任务需求。在微调过程中,通过设定训练指标来监控模型的表现,确保其达到预期的效果。完成微调后,将对用户模型进行评估并进行最终优化,以确保满足业务需求,然后将其部署和调用,用于实际应用。针对部分预测大模型类型,开放增量微调,微调后的模型可以直接部署,也可以继续进行二次微调训练,以应对下游任务场景调整而引起的数据分布变化。
- 预训练阶段:通过在大规模通用数据集上训练,使模型学习到通用特征,使得模型在面对不同类下游任务时,能够快速捕捉到关键信息,提升了模型的训练效率和泛化能力。支持增量训练。
预测大模型支持的平台操作
在选择和使用盘古大模型时,了解不同模型所支持的操作行为至关重要。不同模型在预训练、微调、模型评测、模型压缩、在线推理和体验中心模型调测等方面的支持程度各不相同,开发者应根据自身需求选择合适的模型。以下是盘古预测大模型支持的具体操作:
| 模型 | 预训练 | 微调 | 增量训练 | 模型评测 | 模型压缩 | 在线推理 | 边缘推理 | 体验中心 |
|---|---|---|---|---|---|---|---|---|
| 盘古融合推荐异常检测大模型(Pangu-Predict-Anom-Table-V2.0.3) | - | Y | - | - | - | Y | Y | - |
| 盘古时序异常检测大模型(Pangu-Predict-Anom-TS-V3.0.1) | Y | Y | Y | Y | - | Y | Y | - |
| 盘古统一编码时序预测分类大模型(Pangu-Predict-Cla-TS-V3.0.3) | - | Y | Y | Y | - | Y | Y | - |
| 盘古统一编码表格预测分类大模型(Pangu-Predict-Cla-Table-V3.0.1) | - | Y | Y | Y | - | Y | Y | - |
| 盘古融合推荐分类大模型(Pangu-Predict-Cla-Table-V2.0.3) | - | Y | - | Y | - | Y | Y | - |
| 盘古融合推荐分类大模型-极简模式(Pangu-Predict-Cla-Table-V2.1.4) | - | Y | - | Y | - | Y | Y | - |
| 盘古统一编码时序预测回归大模型(Pangu-Predict-Reg-TS-V3.1.1) | - | Y | Y | Y | - | Y | Y | - |
| 盘古时序预测直推回归大模型(Pangu-Predict-Reg-Zeroshot-TS-V3.0.0) | - | - | - | - | - | Y | Y | - |
| 盘古统一编码表格预测回归大模型(Pangu-Predict-Reg-Table-V3.0.1) | - | Y | Y | Y | - | Y | Y | - |
| 盘古融合推荐回归大模型(Pangu-Predict-Reg-Table-V2.0.3) | - | Y | - | Y | - | Y | Y | - |
| 盘古融合推荐回归大模型-极简模式(Pangu-Predict-Reg-Table-V2.1.4) | - | Y | - | Y | - | Y | Y | - |
| 盘古免微调直推表格预测模型Pangu-Predict-FewShot-Table-V3.0.2 | - | Y | - | - | - | Y | Y | - |
| 结构化数据预测(Pangu-Predict-Struct-V1.1.0) | - | Y | - | - | - | Y | Y | - |
| 高速交通流量预测模型(Pangu-Predict-Industry-Traffic-V3.0.0) | - | Y | - | - | - | Y | Y | - |
| 供应链需求预测模型(Pangu-Predict-Industry-Demand-V1.0.0) | - | Y | - | - | - | Y | Y | - |
预测大模型选择建议
选择合适的预测大模型类型有助于提升训练任务的准确程度。您可以根据模型适用场景,选择合适的模型,从而提高模型的整体效果,详见表1。
| 模型名称 | 适用场景 |
|---|---|
| 盘古融合推荐异常检测大模型(Pangu-Predict-Anom-Table-V2.0.3) | 异常检测模型用于识别数据集中的异常或离群点,常应用于安全、质量控制等领域。
预测大模型提供了两种异常检测大模型,支持多种场景下的异常检测任务:
|
| 盘古时序异常检测大模型(Pangu-Predict-Anom-TS-V3.0.1) | |
| 盘古统一编码时序预测分类大模型(Pangu-Predict-Cla-TS-V3.0.3) | 分类模型用于预测离散类别,可以应用于各种分类任务。
预测大模型提供了两种分类大模型,支持多种场景下的分类任务:
|
| 盘古统一编码表格预测分类大模型(Pangu-Predict-Cla-Table-V3.0.1) | |
| 盘古融合推荐分类大模型(Pangu-Predict-Cla-Table-V2.0.3) | |
| 盘古融合推荐分类大模型-极简模式(Pangu-Predict-Cla-Table-V2.1.4) | |
| 盘古统一编码时序预测回归大模型(Pangu-Predict-Reg-TS-3.0.1) | 回归模型用于预测连续性数值,在工业场景中广泛用于工艺参数和性能指标的预测。
预测大模型提供了三种回归大模型,支持不同场景下的回归任务:
|
| 盘古时序预测直推回归大模型(Pangu-Predict-Reg-Zeroshot-TS-V3.1.0) | |
| 盘古统一编码表格预测回归大模型(Pangu-Predict-Reg-Table-V3.0.1) | |
| 盘古融合推荐回归大模型(Pangu-Predict-Reg-Table-V2.0.3) | |
| 盘古融合推荐回归大模型-极简模式(Pangu-Predict-Reg-Table-V2.1.4) | |
| 盘古免微调直推表格预测模型(Pangu-Predict-FewShot-Table-V3.0.2) | 直推预测模型,适用于小型表格预测任务(小于2W条样本),当前版本支持表格数据的回归、分类预测任务。支持回归数据模型微调。 |
| 结构化数据预测(Pangu-Predict-Struct-V1.1.0) | 结构化数据预测是为了收编工业智能中枢历史预测功能,适用场景同回归模型、分类模型。 |
| 高速交通流量预测模型(Pangu-Predict-Industry-Traffic-V3.0.0) | 基于盘古llm预训练模型进行微调。通过多源异构数据融合、非线性时变参数估计以及随机过程模拟, 构建能够刻画交通流动态演化特性的预测模型。 |
| 供应链需求预测模型(Pangu-Predict-Industry-Demand-V1.0.0) | 供应链需求预测工作流,提供层次化的时序预测能力。 支持对具有层级结构的时间序列数据进行多维度预测,并通过层级协调确保预测结果在层级上的一致性。可用于供应链、库存管理、销量预测等业务场景。 典型的应用场景包括但不限于:商品销量预测(按商品分类层级,如二级分类→三级分类→SKU,预测未来销量 ),区域需求预测(按地理层级,如省份→城市→门店,预测区域需求)。 |