更新时间:2025-11-20 GMT+08:00

在ModelArts Studio(MaaS)模型广场查看预置模型

ModelArts Studio大模型即服务平台提供了丰富的开源大模型,在“模型广场”页面可以查看。模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型进行训练、推理,接入到企业解决方案中。

前提条件

已注册华为账号并开通华为云,详情请见注册华为账号并开通华为云

访问模型广场

  1. 登录ModelArts Studio(MaaS)控制台,在顶部导航栏中选择目标区域。
  2. 在左侧导航栏,单击“模型广场”
  3. “模型广场”页面的“筛选”区域,按需选择模型类型、上下文长度、高级能力、模型系列和支持作业进行筛选,或者直接在搜索框输入模型名称进行搜索。

    关于模型系列的介绍,请参见模型介绍。不同区域的筛选项可能不同,请以实际环境为准。下文以中国-香港区域为例进行说明。

    表1 模型筛选说明

    筛选项

    说明

    模型类型

    支持按照文本生成、图像理解类型进行筛选。

    如果您同时选择了多个模型类型,页面会显示所选模型类型的合集。

    上下文长度

    支持按照128K、64K、32K、16K、≤8K进行筛选。

    如果您同时选择了多个上下文长度,页面会显示所选上下文长度的模型合集。

    高级能力

    支持按照Function Call、深度思考进行筛选。

    模型系列

    支持按照DeepSeek、通义千问2.5、DeepSeek Coder等进行筛选。不同地域支持的模型系列不同,详情请参见模型介绍

    如果您同时选择了多个模型,页面会显示所选模型系列的合集。

    支持作业

    支持按照部署进行筛选。

  4. “模型广场”页面的目标模型卡片,按需选择以下操作。

    模型卡片显示了模型的简要信息,例如模型介绍、模型类型、支持的能力、上下文长度、更新时间等信息。

    图1 模型卡片示例
    • 鼠标悬浮于模型卡片,可以看到操作按钮,您可以按需单击“模型部署”等。

      模型卡片上只显示该模型支持的操作。不同模型显示的操作可能不同,请以实际环境为准。关于如何部署模型服务,请参见使用ModelArts Studio(MaaS)部署模型服务

    • 单击模型卡片,进入模型详情页面,可以查看模型的介绍、支持的版本、版本功能信息、备案信息等。不同的模型版本能力和操作可能不同,请以实际环境为准。
      • 在模型详情页面右上角,您可以按需单击“模型部署”等操作(部分操作支持选择版本),使用模型进行训练和推理。
      • 在版本卡片右侧,您可以按需单击“部署”等操作,使用模型进行训练和推理。
      • 模型详情页面默认展示模型的最新版本卡片信息。如果模型有多个版本,历史版本卡片默认折叠,您可以在历史版本卡片名称左侧,单击图标,查看历史版本的详细信息。
        图2 查看历史版本信息
      • 如果模型涉及计费,版本卡片中会显示推理定价的相关信息。您可以按需单击“切换百万tokens”“切换千tokens”,调整推理价格的单位。
        图3 推理定价

模型介绍

下表列举了ModelArts Studio大模型即服务平台支持的模型清单。关于模型的详细信息请在“模型详情”页面查看。

表2 模型广场的模型系列介绍

模型系列

模型类型

应用场景

支持语言

支持地域

模型介绍

DeepSeek

DeepSeek-R1

文本生成

对话问答、文本生成推理

中文、英文

中国-香港、中东-利雅得

深度求索(DeepSeek)自主研发的DeepSeek-R1模型,基于核心技术突破,具备超长上下文理解与高效推理能力,支持多模态交互及API集成,可驱动智能客服、数据分析等场景应用,以行业领先的性价比加速企业智能化升级。

DeepSeek-V3

文本生成

对话问答、翻译

中文、英文

中国-香港

DeepSeek-V3是一个强大的混合专家 (MoE) 语言模型,开创了一种无辅助损失的负载平衡策略,并设置了多Token预测训练目标以获得更强大的性能。

DeepSeek-V3.1

文本生成

对话问答

中文、英文

中国-香港、中东-利雅得

DeepSeek-V3.1是一个同时支持思考模式和非思考模式的混合模型,效果与DeepSeek-R1-0528相当,但响应速度更快,且在工具使用方面进行了优化。

DeepSeek-V3.2-Exp

文本生成

对话问答

中文、英文

中国-香港

V3.2-Exp版本在V3.1-Terminus的基础上引入了DeepSeek稀疏注意力机制,探索并验证了针对长文本训练和推理效率的优化方法。

DeepSeek-R1-Distill-Qwen-14B

文本生成

对话问答、文本生成推理

中文、英文

中国-香港

通过DeepSeek-R1的输出,蒸馏了Qwen-14B, 使得模型在多项能力上实现了对标OpenAI o1-mini的效果。DeepSeek-R1在数学、代码和推理任务中实现了与OpenAI-o1相当的性能。

DeepSeek-R1-Distill-Qwen-32B

文本生成

对话问答、文本生成推理

中文、英文

中国-香港

通过DeepSeek-R1的输出,蒸馏了Qwen-32B, 使得模型在多项能力上实现了对标OpenAI o1-mini的效果。DeepSeek-R1在数学、代码和推理任务中实现了与OpenAI-o1相当的性能。

Deepseek-Coder

文本生成

对话问答、文本推理

中文、英文

中国-香港

DeepSeek Coder由一系列代码语言模型组成,每个模型都从头开始在2T标记上进行训练,其中87%为代码,13%为英文和中文的自然语言。在编码能力方面,DeepSeek Coder在多种编程语言和各种基准测试中均在开源代码模型中取得了较高性能。

通义千问

QwQ

文本生成

对话问答

英文

中国-香港

QwQ是通义千问系列的推理模型。与传统的指令调优模型相比,具有思维和推理能力的QwQ在下游任务(尤其是疑难问题)中可以实现显著的性能提升。

通义千问2.5

Qwen2.5

文本生成

多语言处理、数学推理、对话问答

中文、英文

中国-香港

Qwen2.5是阿里云研发的Qwen系列的新的大型语言模型。对于Qwen2.5,发布了许多基本语言模型和指令调整的语言模型,参数范围从5亿到720亿。

Qwen2.5-VL

图像理解

图像理解、对话问答

中文、英文

中国-香港

通义千问2.5-VL是阿里云通义千问团队开源的多模态视觉语言模型,具备强大的视觉和语言理解能力。

通义千问3

Qwen3

文本生成

对话问答

中文、英文

中国-香港

Qwen3是Qwen团队研发的大语言模型和大型多模态模型系列,在大规模语言和多模态数据上进行预训练,通过高质量的数据进行后期微调。

Kimi

Kimi-K2

文本生成

对话问答

中文、英文

中国-香港

Kimi K2是一款最先进的混合专家(MoE)语言模型,拥有320亿激活参数和1万亿总参数。通过Muon优化器训练,Kimi K2在前沿知识、推理和编程任务上表现出色,同时在智能体能力方面进行了精心优化。