创建模型
在DataArtsFabric部署推理服务的时候除了使用公共模型,用户也可以自己创建模型。用户可以在DataArtsFabric模型页面创建模型,这些模型是属于用户个人,其他用户不可见。
约束与限制
创建模型的通用约束如下:
- 需要是DataArtsFabric支持的基模型,否则不支持,基模型列表如下:
表1 基模型列表 基模型类型
描述
QWEN_2_72B
Qwen2在包括语言理解、生成、多语言能力、编码、数学和推理在内的多个基准测试中,超越了大多数以前的开放权重模型,与专有模型表现出竞争力,参数规模为720亿。
GLM_4_9B
GLM-4-9B是智谱AI推出的最新一代预训练模型GLM-4系列中的开源版本。在语义、数学、推理、代码和知识等多方面的数据集测评中表现出较高的性能,参数规模为90亿。
LLAMA_3_8B
作为Llama系列的第三代模型,Llama3在多个基准测试中实现了全面领先,性能较为优异。该模型参数规模为80亿。该模型使用了大规模的中文数据进行预训练,扩大了中文字符集的覆盖范围。
LLAMA_3_70B
作为Llama系列的第三代模型,Llama3在多个基准测试中实现了全面领先,性能较为优异。该模型参数规模为700亿。
LLAMA_3.1_8B
Llama3.1是首个公开可用的模型,在常识、可操纵性、数学、工具使用和多语言翻译等方面有不错的表现。它支持高级用例,例如长篇文本摘要、多语言对话智能体和编码助手。该模型使用了大规模的中文数据进行预训练,扩大了中文字符集的覆盖范围。该模型参数规模为80亿。
LLAMA_3.1_70B
Llama3.1是首个公开可用的模型,在常识、可操纵性、数学、工具使用和多语言翻译等方面已接近顶级AI模型。它支持高级用例,例如长篇文本摘要、多语言对话智能体和编码助手。该模型参数规模为700亿。
- 模型格式需要为safetensors的格式。safetensors是Huggingface推出的一种可靠、易移植的机器学习模型存储格式,用于安全地存储Tensor,而且速度快。
格式要求可以参考模型样例,地址如下:
基模型类型
模样例名称
模型来源
LLAMA_3_8B
Llama 3 8B Chinese Instruct
https://www.modelscope.cn/models/FlagAlpha/Llama3-Chinese-8B-Instruct
LLAMA_3_70B
Llama 3 70B
LLAMA_3.1_8B
Llama 3.1 8B Chinese Chat
LLAMA_3.1_70B
Llama 3.1 70B
QWEN_2_72B
Qwen 2 72B Instruct
GLM_4_9B
Glm 4 9B Chat
前提条件
- 已有可正常使用的华为云账号。
- 已有至少一个正常可用的工作空间。
- 已创建用于存储模型的OBS桶及文件夹,上传好符合要求的模型文件,并且模型存储的OBS桶与DataArtsFabric在同一区域。具体请参见创建OBS桶。
操作步骤
- 登录DataArtsFabric工作空间管理台。
- 选择已创建的工作空间,单击“进入工作空间”。
- 在左侧菜单栏中选择“模型”管理页面。 ,进入
- 单击“创建模型”,进入“创建模型”页面。
- 填写模型基本信息,包括名称、描述等,并选择模型文件的OBS路径,然后单击“立即创建”,详细描述请见:
表2 创建模型的基本信息 参数名称
说明
模型名称
必填,模型的名称。
长度为1-64,不支持重复名称。
只能包含中文、字母、数字、下划线、中划线、点、空格。
模型描述
可选,模型的描述信息。
长度为0-1024。不支持^!<>=&"'等特殊字符。
版本名称
必填,版本的名称。
长度为1-64,不支持重复名称。
只能包含中文、字母、数字、下划线、中划线、点、空格。
版本描述
可选,版本的描述信息。
长度为0-1024。不支持^!<>=&"'等特殊字符
基模型类型
必选,基模型的类型,描述具体请见基模型列表。
模型文件路径
必填,模型文件路径。目前支持OBS路径,该路径需要当前用户有读取的权限。
- 再次单击“我的模型”,即可在模型列表中看见刚创建的模型。