约束与限制
大模型LICENSE约束
不同的开源大模型有不同的LICENSE约束,详细请见下表:
模型名称 |
LICENSE地址 |
---|---|
Llama 3 8B Chinese Instruct |
https://github.com/meta-llama/llama/blob/main/LICENSE |
Llama 3 70B |
https://github.com/meta-llama/llama/blob/main/LICENSE |
Llama 3.1 8B Chinese Chat |
https://huggingface.co/meta-llama/Meta-Llama-3.1-8B/blob/main/LICENSE |
Llama 3.1 70B |
https://huggingface.co/meta-llama/Meta-Llama-3.1-8B/blob/main/LICENSE |
Qwen 2 72B Instruct |
https://huggingface.co/Qwen/Qwen2-72B-Instruct/blob/main/LICENSE |
Glm 4 9B Chat |
https://huggingface.co/THUDM/glm-4-9b-chat/blob/main/LICENSE |
公共推理服务约束与限制
- Token配额约束:每种公共推理服务都有免费配额限制,超过配额不可用,也无法再购买。每种公共推理服务的配额为当前用户在当前局点下所有工作空间共享;
- 时间约束:有效期为开通90天内,超过时间则失效。同一个推理服务在不同工作空间下面开通,以首次开通为准。
- 不同的模型有不同的上下文长度约束,请见表公共推理服务。
- 不保证SLA,如果想要更高的性能,建议创建自己的推理服务进行推理。