更新时间:2025-07-28 GMT+08:00
压缩Deepseek大模型
模型在部署前,通过模型压缩可以降低推理显存占用,节省推理资源提高推理性能。通过对三方大模型的压缩,可以减小模型的存储大小,降低功耗,并提高计算速度。
- 登录ModelArts Studio平台,在“我的空间”模块,单击进入所需空间。
图1 我的空间
- 在左侧导航栏中选择“模型开发 > 模型压缩”,单击界面右上角“创建压缩任务”。参考表1创建模型压缩任务。
- 参数填写完成后单击“立即创建”创建模型压缩任务。
父主题: 开发Deepseek大模型