更新时间:2024-12-03 GMT+08:00
分享

科学计算大模型训练流程与选择建议

科学计算大模型训练流程介绍

科学计算大模型主要用于。

科学计算大模型的训练主要分为两个阶段:预训练与微调。

  • 预训练阶段:预训练是模型学习基础知识的过程,基于大规模通用数据集进行。例如,在区域海洋要素预测中,可以重新定义深海变量、海表变量,调整深度层、时间分辨率、水平分辨率以及区域范围,以适配自定义区域的模型场景。此阶段需预先准备区域的高精度数据。
  • 微调阶段:在预训练模型的基础上,微调利用特定领域的数据进一步优化模型,使其更好地满足实际任务需求。例如,区域海洋要素预测的微调是在已有模型上添加最新数据,不改变模型结构参数或引入新要素,以适应数据更新需求。

在实际流程中,通过设定训练指标对模型进行监控,以确保效果符合预期。在微调后,评估用户模型,并进行最终优化,确认其满足业务需求后,进行部署和调用,以便实际应用。

科学计算大模型选择建议

科学计算大模型支持训练的模型类型有:中期天气要素预测模型、区域中期海洋智能预测模型。

  • 中期天气要素预测模型选择建议

    科学计算大模型的中期天气要素预测模型,可以对未来一段时间的天气进行预测,具备以下优势:

    • 高时间精度:中期天气要素预测模型可以预测未来1、3、6、24小时的天气情况。高时间精度对于农业、交通、能源等领域的决策和规划非常重要。
    • 全球覆盖:中期天气要素预测模型能够在全球范围内进行预测,不仅仅局限于某个地区。它的分辨率相当于赤道附近每个点约25公里*25公里的空间。
    • 数据驱动:中期天气要素预测模型使用历史天气数据来训练模型,从而提高预测的准确性。这意味着它可以直接利用过去的观测数据,而不仅仅依赖于数值模型。

    中期天气要素预测模型信息见表1

    表1 中期天气要素预测模型信息

    模型

    预报层次

    预报高空变量

    预报表面变量

    降水

    时间分辨率

    水平分辨率

    区域范围

    中期天气要素预测模型

    13层(1000hpa, 925hpa, 850hpa, 700hpa, 600hpa, 500hpa, 400hpa, 300hpa, 250hpa, 200hpa, 150hpa, 100hpa, 50hpa)

    T:温度

    Q:比湿

    Z:重力位势

    U:U风

    V:V风

    MLSP:海平面气压

    U10:10米U风,经度方向

    V10:10米V风,纬度方向

    T2M:2米温度

    -

    1、3、6、24小时

    0.25°*0.25°

    全球

    该模型类型主要用于天气基础要素预测,支持训练的模型清单见表2,您可根据具体使用场景选择合适的模型。例如天气基础要素预测,需要时间分辨率为1小时的场景下,您可以选择Pangu-AI4S-Weather_1h-20241030模型。
    表2 中期天气要素预测模型的类型

    模型支持区域

    模型名称

    使用场景

    说明

    西南-贵阳一

    Pangu-AI4S-Weather_1h-20241030

    用于天气基础要素预测,时间分辨率为1小时。

    支持预训练、微调、在线推理、能力调测特性,基于Snt9B33,支持1个训练单元训练及1个推理单元部署。

    Pangu-AI4S-Weather_3h-20241030

    用于天气基础要素预测,时间分辨率为3小时。

    支持预训练、微调、在线推理、能力调测特性,基于Snt9B3,支持1个训练单元训练及1个推理单元部署。

    Pangu-AI4S-Weather_6h-20241030

    用于天气基础要素预测,时间分辨率为6小时。

    支持预训练、微调、在线推理、能力调测特性,基于Snt9B3,支持1个训练单元训练及1个推理单元部署。

    Pangu-AI4S-Weather_24h-20241030

    用于天气基础要素预测,时间分辨率为24小时。

    支持预训练、微调、在线推理、能力调测特性,基于Snt9B3,支持1个训练单元训练及1个推理单元部署。

  • 区域中期海洋智能预测模型选择建议

    科学计算大模型的中期海洋智能预测模型,可以对未来一段时间海洋要素进行预测。可为海上防灾减灾,指导合理开发和保护渔业等方面有着重要作用。区域中期海洋智能预测模型当前主要包括区域海洋要素模型,信息见表3

    表3 区域中期海洋智能预测模型信息

    模型

    深海层深

    预报深海变量

    预报海表变量

    时间分辨率

    水平分辨率

    区域范围

    区域海洋要素模型

    0m, 6m, 10m, 20m, 30m, 50m, 70m, 100m, 125m,

    150m, 200m, 250m, 300m, 400m, 500m

    T:海温(℃)

    S:海盐(PSU)

    U:海流经向速率 (ms-1)

    V:海流纬向速率 (ms-1)

    SSH:海表高度(m)

    24h

    1/12°

    特定区域

    该模型类型主要用于区域海洋基础要素预测,支持训练的模型清单见表4,您可根据具体使用场景选择合适的模型。例如区域海洋基础要素预测场景下,您可以选择Pangu-AI4S-Ocean_Regional_24h-20241030模型。
    表4 区域中期海洋智能预测模型的类型

    模型支持区域

    模型名称

    使用场景

    说明

    西南-贵阳一

    Pangu-AI4S-Ocean_Regional_24h-20241030

    用于区域海洋基础要素预测

    支持预训练、微调、在线推理、能力调测特性,基于Snt9B3支持1个训练单元训练及1个推理单元部署。

科学计算大模型训练类型选择建议

  • 中期天气要素预测模型的训练类型选择建议:

    中期天气要素预测模型的训练支持预训练、微调两种操作,如果直接使用平台预置的中期天气要素预测模型不满足您的使用要求时,可以进行预训练或微调。预训练、微调操作的适用场景如下:

    • 预训练:训练用于添加新的高空层次、高空变量或表面变量。如果您需要在现有模型中引入新要素,需要使用训练(重新训练模型)。在重训配置参数时,您可以选择新要素进行训练。请注意,所选的数据集必须包含您想要添加的新要素。此外,您还可以通过训练更改所有的模型参数,以优化模型性能。
    • 微调:微调是将新数据应用于已有模型的过程。它适用于不改变模型结构参数和引入新要素的情况。如果您有新的观测数据,可以使用微调来更新模型的权重,以适应新数据。
  • 区域中期海洋智能预测模型的训练类型选择建议

    区域中期海洋智能预测模型的训练支持预训练、微调两种操作,如果直接使用平台预置的区域中期海洋智能预测模型不满足您的使用要求时,可以进行预训练或微调。预训练、微调操作的适用场景如下:

    • 预训练:可以在重新指定深海变量、海表变量、以及深海层深、时间分辨率、水平分辨率以及区域范围,适用于想自定义自己的区域模型的场景,需预先准备好区域高精度数据。
    • 微调:在已有模型的基础上添加新数据,它适用于不改变模型结构参数和引入新要素的情况,添加最新数据的场景。

相关文档