在ModelArts Studio(MaaS)模型广场查看预置模型
ModelArts Studio大模型即服务平台提供了丰富的开源大模型,在“模型广场”页面可以查看。模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型进行训练、推理,接入到企业解决方案中。
前提条件
已注册华为账号并开通华为云,详情请见注册华为账号并开通华为云。
访问模型广场
- 登录ModelArts Studio控制台,在顶部导航栏选择目标区域。
- 在左侧导航栏,单击“模型广场”。
- 在“模型广场”页面的“模型筛选”区域,按需选择模型系列、模型类型、支持作业和上下文长度进行筛选,或者直接输入模型名称进行搜索。
关于模型系列的介绍,请参见模型介绍。
表1 模型筛选说明 筛选项
说明
模型系列
支持按照全部、DeepSeek等模型系列进行筛选。
模型类型
支持按照全部、文本生成等模型类型进行筛选。
支持作业
支持按照全部、部署、调优等支持作业进行筛选。
上下文长度
支持按照全部、16K以下、16K等上下文长度进行筛选。
- 单击目标模型下方的“模型详情”,进入模型详情页查看模型的介绍、基本信息和版本信息。
- 进入模型详情页,单击右侧“调优”、“压缩”或“部署”等,使用模型进行训推。
当按钮置灰时,表示模型不支持该任务。
模型介绍
表2列举了ModelArts Studio大模型即服务平台支持的模型清单。关于模型的详细信息请在“模型详情”页面查看。
模型系列 |
模型类型 |
应用场景 |
支持语言 |
支持地域 |
模型介绍 |
|
---|---|---|---|---|---|---|
DeepSeek |
DeepSeek-R1 |
文本生成 |
对话问答、文本生成推理 |
中文、英文 |
香港 |
深度求索(DeepSeek)自主研发的DeepSeek-R1模型,基于核心技术突破,具备超长上下文理解与高效推理能力,支持多模态交互及API集成,可驱动智能客服、数据分析等场景应用,以行业领先的性价比加速企业智能化升级。 |
DeepSeek-V3 |
文本生成 |
对话问答、翻译 |
中文、英文 |
香港 |
DeepSeek-V3是一个强大的混合专家 (MoE) 语言模型,开创了一种无辅助损失的负载平衡策略,并设置了多Token预测训练目标以获得更强大的性能。 |
|
DeepSeek-R1-Distill-Qwen-14B |
文本生成 |
对话问答、文本生成推理 |
中文、英文 |
香港 |
通过DeepSeek-R1的输出,蒸馏了Qwen-14B, 使得模型在多项能力上实现了对标OpenAI o1-mini的效果。DeepSeek-R1在数学、代码和推理任务中实现了与OpenAI-o1相当的性能。 |
|
DeepSeek-R1-Distill-Qwen-32B |
文本生成 |
对话问答、文本生成推理 |
中文、英文 |
香港 |
通过DeepSeek-R1的输出,蒸馏了Qwen-32B, 使得模型在多项能力上实现了对标OpenAI o1-mini的效果。DeepSeek-R1在数学、代码和推理任务中实现了与OpenAI-o1相当的性能。 |