快速部署
操作场景
本章节帮助用户高效地部署“快速搭建DeepSeek推理系统”解决方案。一键部署该解决方案时,参照本章节中的步骤和说明进行操作,即可完成快速部署。
操作步骤
- 登录华为云解决方案实践,选择“快速搭建DeepSeek推理系统”,支持区域下拉选择部署的区域(以北京四CPU版为例),单击“一键部署(CPU版)”,跳转至解决方案创建资源栈界面。
图1 解决方案实施库
- 在选择模板界面中,单击“下一步”。
图2 选择模板
- 在配置参数界面中,参考“表1 参数填写说明”完成自定义参数填写,部分参数会自动默认填充参数值。如需修改请在参数配置页面删除文本框内的默认值后填写新的参数值,所有参数填写完成后方可单击“下一步”。
图3 配置参数
表1 参数填写说明 参数名称
类型
是否可选
参数解释
默认值
vpc_name
string
必填
虚拟私有云名称,该模板使用新建VPC,不允许重名。取值范围:1-54个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。
building-a-deepseek-Inference-system-demo
security_group_name
string
必填
安全组名称,该模板新建安全组,请参考安全组规则修改进行配置。取值范围:1-64个字符,支持字母、数字、中文、下划线(_)、中划线(-)、英文句号(.)。
building-a-deepseek-Inference-system-demo
ecs_name
string
必填
云服务器实例名称,不支持重名。取值范围:1-64个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。
building-a-deepseek-Inference-system-demo
distilled_model
string
必填
DeepSeek-R1-Distill模型。支持Qwen-1.5B、Qwen-7B、Llama-8B,默认Qwen-1.5B。GPU版支持部署Qwen-14B、Qwen-32B。
DeepSeek-R1-Distill-Qwen-1.5B
ecs_gpu_mapping
string
必填
(GPU版部署参数,涉及华北-北京四、华南-广州区域)弹性云服务器 ECS规格与GPU显卡大小的映射关系。A-1对应显存1*16、B-1对应显存1*24G、B-2对应显存2*24G、B-4对应显存4*24G、B-6对应显存6*24G,推荐显存大小16GB及以上(Qwen-32B推荐显存大小24G及以上)。当参数{ecs_flavor}有值时,此参数不生效。默认A-1。
A-1
ecs_flavor
string
必填
云服务器实例规格,CPU版部署1.5b推荐使用x1.4u.4g、7b和8b推荐使用x1.16u.16g,默认:x1.4u.4g;GPU版部署推荐显存大小16GB及以上(Qwen-32B推荐显存大小24G及以上)。规格信息具体请参考官网弹性云服务器规格清单。
x1.4u.4g
ecs_password
string
必填
云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种。管理员账户默认root。
空
system_disk_size
number
必填
云服务器系统盘大小,磁盘类型默认为通用型SSD,单位:GB,取值范围为40-1,024,不支持缩盘。
40
charging_mode
string
必填
云服务器计费模式,默认自动扣费,可选值为:postPaid(按需计费)、prePaid(包年包月)。
postPaid
charging_unit
string
必填
云服务器订购周期类型,仅当charging_mode为prePaid(包年/包月)生效,此时该参数为必填参数。取值范围:month(月),year(年)。
month
charging_period
number
必填
云服务器订购周期,仅当charging_mode为prePaid(包年/包月)生效,此时该参数为必填参数。取值范围:charging_unit=month(周期类型为月)时,取值为1-9;charging_unit=year(周期类型为年)时,取值为1-3。
1
- (可选,如果使用华为主账号或admin用户组下的IAM子账户可不选委托)在资源设置界面中,在权限委托下拉框中选择“rf_admin_trust”委托,单击“下一步”。
图4 资源栈设置
- 在配置确认界面中,单击“创建执行计划”。
图5 配置确认
- 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确定”。
图6 创建执行计划
- 单击“部署”,并且在弹出的执行计划确认框中单击“执行”。
图7 执行计划图8 执行计划确认
- (可选)如果计费模式选择“包年包月”,在余额不充足的情况下(所需总费用请参考表2)请及时登录费用中心,手动完成待支付订单的费用支付。
- 待“事件”中出现“Apply required resource success”,堆栈部署成功,表示顺利完成资源的下发和部署。堆栈部署成功后,搭建DeepSeek脚本开始执行,耐心等待5-10分钟左右(受网络波动影响)。
图9 部署完成