在模型广场查看模型
在模型广场页面,ModelArts Studio大模型即服务平台提供了丰富的开源大模型,在模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型进行训练、推理,接入到企业解决方案中。
访问模型广场
- 登录ModelArts管理控制台。
- 在左侧导航栏中,选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。
- 在ModelArts Studio左侧导航栏中,单击“模型广场”。
- 在“模型广场”页面的目标模型区域,单击“立即使用”进入模型详情页。
在模型详情页可以查看模型的介绍、基本信息和版本信息。
- 在模型详情页右上角,单击“调优”、“压缩”或“部署”,可以直接使用模型进行训推。
当按钮置灰时,表示模型不支持该任务。
模型介绍
表1列举了ModelArts Studio大模型即服务平台支持的模型清单,模型详细信息请查看界面介绍。
模型系列 |
模型类型 |
应用场景 |
支持语言 |
---|---|---|---|
GLM-4 |
文本生成 |
对话问答、长文本推理、代码生成 |
中文、英文 |
ChatGLM3 |
文本生成 |
对话问答、数学推理、代码生成 |
中文、英文 |
Yi |
文本生成 |
代码生成、数学推理、对话问答 |
中文、英文 |
通义千问1.5 |
文本生成 |
代码生成、数学推理、对话问答 |
英文 |
通义千问 |
文本生成 |
对话问答、智能创作、文本摘要、翻译、代码生成、数学推理 |
中文、英文 |
通义千问2 |
文本生成 |
多语言处理、数学推理、对话问答 |
英文 |
通义千问2.5 |
文本生成 |
多语言处理、数学推理、对话问答 |
中文、英文 |
Deepseek-Coder |
文本生成 |
对话问答、文本推理 |
中文、英文 |
模型分为量化模型和非量化模型,其中,量化模型又包括SmoothQuant-W8A8和AWQ-W4A16两种。
- AWQ-W4A16量化模型可以由非量化模型压缩后生成,也可以直接使用开源AWQ权重。
- SmoothQuant-W8A8量化模型只能由非量化模型压缩生成。
ModelArts Studio大模型即服务平台已预置非量化模型与AWQ-W4A16量化模型的模型模板。
- 非量化模型可以支持调优、压缩、部署等操作。
- 量化模型仅支持部署操作。当需要获取SmoothQuant-W8A8量化模型时,则可以通过对非量化模型进行模型压缩获取。