更新时间:2025-07-31 GMT+08:00

在ModelArts Studio(MaaS)模型广场查看预置模型

ModelArts Studio大模型即服务平台提供了丰富的开源大模型,在“模型广场”页面可以查看。模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型进行训练、推理,接入到企业解决方案中。

前提条件

已注册华为账号并开通华为云,详情请见注册华为账号并开通华为云

访问模型广场

  1. 登录ModelArts Studio控制台,在顶部导航栏选择目标区域。
  2. 在左侧导航栏,单击“模型广场”
  3. “模型广场”页面的“模型筛选”区域,按需选择模型系列、模型类型、支持作业和上下文长度进行筛选,或者直接输入模型名称进行搜索。

    关于模型系列的介绍,请参见模型介绍

    表1 模型筛选说明

    筛选项

    说明

    模型系列

    支持按照全部、DeepSeek等模型系列进行筛选。

    模型类型

    支持按照全部、文本生成等模型类型进行筛选。

    支持作业

    支持按照全部、部署、调优等支持作业进行筛选。

    上下文长度

    支持按照全部、16K以下、16K等上下文长度进行筛选。

  4. 单击目标模型下方的“模型详情”,进入模型详情页查看模型的介绍、基本信息和版本信息。
  5. 进入模型详情页,单击右侧“调优”“压缩”“部署”等,使用模型进行训推。

    当按钮置灰时,表示模型不支持该任务。

模型介绍

表2列举了ModelArts Studio大模型即服务平台支持的模型清单。关于模型的详细信息请在“模型详情”页面查看。

表2 模型广场的模型系列介绍

模型系列

模型类型

应用场景

支持语言

支持地域

模型介绍

DeepSeek

DeepSeek-R1

文本生成

对话问答、文本生成推理

中文、英文

香港

深度求索(DeepSeek)自主研发的DeepSeek-R1模型,基于核心技术突破,具备超长上下文理解与高效推理能力,支持多模态交互及API集成,可驱动智能客服、数据分析等场景应用,以行业领先的性价比加速企业智能化升级。

DeepSeek-V3

文本生成

对话问答、翻译

中文、英文

香港

DeepSeek-V3是一个强大的混合专家 (MoE) 语言模型,开创了一种无辅助损失的负载平衡策略,并设置了多Token预测训练目标以获得更强大的性能。

DeepSeek-R1-Distill-Qwen-14B

文本生成

对话问答、文本生成推理

中文、英文

香港

通过DeepSeek-R1的输出,蒸馏了Qwen-14B, 使得模型在多项能力上实现了对标OpenAI o1-mini的效果。DeepSeek-R1在数学、代码和推理任务中实现了与OpenAI-o1相当的性能。

DeepSeek-R1-Distill-Qwen-32B

文本生成

对话问答、文本生成推理

中文、英文

香港

通过DeepSeek-R1的输出,蒸馏了Qwen-32B, 使得模型在多项能力上实现了对标OpenAI o1-mini的效果。DeepSeek-R1在数学、代码和推理任务中实现了与OpenAI-o1相当的性能。