更新时间:2024-08-16 GMT+08:00
分享

在模型广场查看模型

在模型广场页面,ModelArts Studio大模型即服务平台提供了丰富的开源大模型模板,在模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型模板,用于创建模型。

访问模型广场

  1. 登录ModelArts管理控制台。
  2. 在左侧导航栏中,选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。
  3. 在ModelArts Studio左侧导航栏中,选择“模型广场”进入模型广场。
  4. 选择模型,单击“立即使用”进入模型详情页。在模型详情页可以查看模型的详细介绍。

模型介绍

表1列举了ModelArts Studio大模型即服务平台支持的模型清单,模型详细信息请查看界面介绍。

表1 模型广场的模型系列介绍

模型系列

模型类型

应用场景

支持语言

ChatGLM4

文本生成

对话问答、长文本推理、代码生成

中文、英文

ChatGLM3

文本生成

对话问答、数学推理、代码生成

中文、英文

百川

文本生成

对话问答、数学推理、代码生成、翻译

中文、英文

LLaMA 2

文本生成

对话问答、智能创作、文本摘要

英文

LLaMA 3

文本生成

对话问答、智能创作、文本摘要

英文

LLaMA 3.1

文本生成

对话问答、智能创作、文本摘要

英文

Yi

文本生成

代码生成、数学推理、对话问答

中文、英文

通义千问1.5

文本生成

代码生成、数学推理、对话问答

英文

通义千问

文本生成

对话问答、智能创作、文本摘要、翻译、代码生成、数学推理

中文、英文

通义千问2

文本生成

多语言处理、数学推理、对话问答

英文

模型分为量化模型和非量化模型,其中,量化模型又包括SmoothQuant-W8A8和AWQ-W4A16两种。

  • AWQ-W4A16量化模型可以由非量化模型压缩后生成,也可以直接使用开源AWQ权重。
  • SmoothQuant-W8A8量化模型只能由非量化模型压缩生成。

ModelArts Studio大模型即服务平台已预置非量化模型与AWQ-W4A16量化模型的模型模板。

  • 非量化模型可以支持调优、压缩、部署等操作。
  • 量化模型仅支持部署操作。当需要获取SmoothQuant-W8A8量化模型时,则可以通过对非量化模型进行模型压缩获取。

相关文档