更新时间:2025-07-28 GMT+08:00

压缩Deepseek大模型

模型在部署前,通过模型压缩可以降低推理显存占用,节省推理资源提高推理性能。通过对三方大模型的压缩,可以减小模型的存储大小,降低功耗,并提高计算速度。

  1. 登录ModelArts Studio平台,在“我的空间”模块,单击进入所需空间。
    图1 我的空间
  2. 在左侧导航栏中选择“模型开发 > 模型压缩”,单击界面右上角“创建压缩任务”。参考表1创建模型压缩任务。
    表1 模型压缩任务参数说明

    参数类别

    参数名称

    说明

    压缩配置

    模型来源

    选择“三方大模型”。

    基础

    选择需要进行压缩的模型,可使用来自资产的模型或作业的模型。

    压缩策略

    选择INT8压缩策略。

    资源配置

    选择资源池

    选择模型压缩任务所使用的资源池。

    订阅提醒

    订阅提醒

    该功能开启后,系统将在任务状态更新时,通过短信或邮件将提醒发送给用户。

    发布模型

    是否开启自动发布

    关闭,训练完成后手动发布到模型资产。

    开启,配置可见性、模型名称和描述。

    基本信息

    任务名称

    模型压缩任务的名称。

    压缩后模型名称

    设置压缩后的模型名称。(开启自动发布,无该配置项)

    描述

    模型压缩任务的描述。

  3. 参数填写完成后单击“立即创建”创建模型压缩任务。