更新时间:2024-12-16 GMT+08:00
分享

在模型广场查看模型

在模型广场页面,ModelArts Studio大模型即服务平台提供了丰富的开源大模型,在模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型进行训练、推理,接入到企业解决方案中。

访问模型广场

  1. 登录ModelArts管理控制台。
  2. 在左侧导航栏中,选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。
  3. 在ModelArts Studio左侧导航栏中,单击“模型广场”
  4. “模型广场”页面的目标模型区域,单击“立即使用”进入模型详情页。

    在模型详情页可以查看模型的介绍、基本信息和版本信息。

  5. 在模型详情页右上角,单击“调优”“压缩”“部署”,可以直接使用模型进行训推。

    当按钮置灰时,表示模型不支持该任务。

模型介绍

表1列举了ModelArts Studio大模型即服务平台支持的模型清单,模型详细信息请查看界面介绍。

表1 模型广场的模型系列介绍

模型系列

模型类型

应用场景

支持语言

GLM-4

文本生成

对话问答、长文本推理、代码生成

中文、英文

ChatGLM3

文本生成

对话问答、数学推理、代码生成

中文、英文

Yi

文本生成

代码生成、数学推理、对话问答

中文、英文

通义千问1.5

文本生成

代码生成、数学推理、对话问答

英文

通义千问

文本生成

对话问答、智能创作、文本摘要、翻译、代码生成、数学推理

中文、英文

通义千问2

文本生成

多语言处理、数学推理、对话问答

英文

通义千问2.5

文本生成

多语言处理、数学推理、对话问答

中文、英文

Deepseek-Coder

文本生成

对话问答、文本推理

中文、英文

模型分为量化模型和非量化模型,其中,量化模型又包括SmoothQuant-W8A8和AWQ-W4A16两种。

  • AWQ-W4A16量化模型可以由非量化模型压缩后生成,也可以直接使用开源AWQ权重。
  • SmoothQuant-W8A8量化模型只能由非量化模型压缩生成。

ModelArts Studio大模型即服务平台已预置非量化模型与AWQ-W4A16量化模型的模型模板。

  • 非量化模型可以支持调优、压缩、部署等操作。
  • 量化模型仅支持部署操作。当需要获取SmoothQuant-W8A8量化模型时,则可以通过对非量化模型进行模型压缩获取。

相关文档