- 文字识别-发票识别与验真
- 内容审核-图片审核
- 人证核身解决方案
- 华为云D-Plan解决方案
- 语音识别-客服中心语音质检
- 语音识别-隐私通话内容分析
- 文字识别-网络货运解决方案
- 软通动力智能流程机器人
- AR现场作业解决方案实践
- 文字识别-快递电子面单识别
- 基于开源模型构建高可用AIGC应用
- 内容审核-视频审核
- 语义分析-情感分析
- 内容审核-音频审核
- 三电数据分析及预测
- 基于TTS快速实现文字转语音
- 基于GPT-SoVITS快速实现语音克隆
- 基于OBS+SFS Turbo实现AI云存储加速
- 汽车价值评估
- 基于关键词快速生成高清短视频
- 基于Geek-AI构建AI智能助手
- 基于PyTorch NPU快速部署开源大模型
- 快速搭建Dify-LLM应用开发平台
- 天宽昇腾云行业大模型适配服务解决方案
- 德勤AI场景化咨询与实施服务解决方案
- 快速搭建DeepSeek推理系统
- 快速搭建EvalScope模型性能评测平台
- 快速部署Embedding及Reranker模型
- 文档下载
- 通用参考
链接复制成功!
快速部署
操作场景
本章节帮助用户高效地部署“快速搭建DeepSeek推理系统”解决方案。一键部署该解决方案时,参照本章节中的步骤和说明进行操作,即可完成快速部署。
操作步骤
- 登录华为云解决方案实践,选择“快速搭建DeepSeek推理系统”,支持区域下拉选择部署的区域(以北京四CPU版为例),单击“一键部署(CPU版)”,跳转至解决方案创建资源栈界面。
图1 解决方案实施库
- 在选择模板界面中,单击“下一步”。
图2 选择模板
- 在配置参数界面中,参考“表1 参数填写说明”完成自定义参数填写,部分参数会自动默认填充参数值。如需修改请在参数配置页面删除文本框内的默认值后填写新的参数值,所有参数填写完成后方可单击“下一步”。
图3 配置参数
表1 参数填写说明 参数名称
类型
是否可选
参数解释
默认值
vpc_name
string
必填
虚拟私有云名称,该模板使用新建VPC,不允许重名。取值范围:1-54个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。
building-a-deepseek-Inference-system-demo
security_group_name
string
必填
安全组名称,该模板新建安全组,请参考安全组规则修改进行配置。取值范围:1-64个字符,支持字母、数字、中文、下划线(_)、中划线(-)、英文句号(.)。
building-a-deepseek-Inference-system-demo
ecs_name
string
必填
云服务器实例名称,不支持重名。取值范围:1-64个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。
building-a-deepseek-Inference-system-demo
distilled_model
string
必填
DeepSeek-R1-Distill模型。支持Qwen-1.5B、Qwen-7B、Llama-8B,默认Qwen-1.5B。GPU版支持部署
Qwen-14B。
DeepSeek-R1-Distill-Qwen-1.5B
ecs_gpu_mapping
string
必填
(GPU版部署参数,涉及华北-北京四、华南-广州区域)弹性云服务器 ECS规格与GPU显卡大小的映射关系。A-1对应显存1*16、B-1对应显存1*24G、B-2对应显存2*24G、B-4对应显存4*24G、B-6对应显存6*24G,推荐显存大小16GB及以上(Qwen-32B推荐显存大小24G及以上)。当参数{ecs_flavor}有值时,此参数不生效。默认A-1。
A-1
ecs_flavor
string
必填
云服务器实例规格,CPU版部署1.5b推荐使用x1.4u.4g、7b和8b推荐使用x1.16u.16g,默认:x1.4u.4g;GPU版部署推荐显存大小16GB及以上(Qwen-32B推荐显存大小24G及以上)。规格信息具体请参考官网弹性云服务器规格清单。
x1.4u.4g
ecs_password
string
必填
云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种,仅支持小写字母、数字、中划线(-)、英文句号(.)。修改密码,请参考重置云服务器密码登录ECS控制台修改密码。管理员账户默认root。
空
system_disk_size
number
必填
云服务器系统盘大小,磁盘类型默认为通用型SSD,单位:GB,取值范围为40-1,024,不支持缩盘。
40
charging_mode
string
必填
云服务器计费模式,默认自动扣费,可选值为:postPaid(按需计费)、prePaid(包年包月)。
postPaid
charging_unit
string
必填
云服务器订购周期类型,仅当charging_mode为prePaid(包年/包月)生效,此时该参数为必填参数。取值范围:month(月),year(年)。
month
charge_period
number
必填
云服务器订购周期,仅当charging_mode为prePaid(包年/包月)生效,此时该参数为必填参数。取值范围:charging_unit=month(周期类型为月)时,取值为1-9;charging_unit=year(周期类型为年)时,取值为1-3。
1
- (可选,如果使用华为主账号或admin用户组下的IAM子账户可不选委托)在资源设置界面中,在权限委托下拉框中选择“rf_admin_trust”委托,单击“下一步”。
图4 资源栈设置
- 在配置确认界面中,单击“创建执行计划”。
图5 配置确认
- 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确定”。
图6 创建执行计划
- 单击“部署”,并且在弹出的执行计划确认框中单击“执行”。
图7 执行计划图8 执行计划确认
- (可选)如果计费模式选择“包年包月”,在余额不充足的情况下(所需总费用请参考表2)请及时登录费用中心,手动完成待支付订单的费用支付。
- 待“事件”中出现“Apply required resource success”,堆栈部署成功,表示顺利完成资源的下发和部署。堆栈部署成功后,搭建DeepSeek脚本开始执行,耐心等待5-10分钟左右(受网络波动影响)。
图9 部署完成