更新时间:2025-09-22 GMT+08:00
分享

快速部署

本章节帮助用户高效地部署“快速搭建New API大模型网关”解决方案。一键部署该解决方案时,参照本章节中的步骤和说明进行操作,即可完成快速部署。

  1. 登录华为云解决方案实践,选择“快速搭建New API大模型网关”,单击“一键部署”,跳转至解决方案创建资源栈界面。

    图1 解决方案实施库

  2. 在选择模板界面中,单击“下一步”。

    图2 选择模板

  3. 在配置参数界面中,参考表1 参数说明完成自定义参数填写,单击“下一步”。

    图3 配置参数
    表1 参数说明

    参数名称

    类型

    是否可选

    参数解释

    默认值

    vpc_name

    string

    必填

    虚拟私有云名称,该模板使用新建VPC,不允许重名。取值范围:1-54个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。

    building-a-New API-llm-gateway-demo

    secgroup_name

    string

    必填

    安全组名称,该模板新建安全组,请参考安全组规则修改进行配置。取值范围:1-64个字符,支持字母、数字、中文、下划线(_)、中划线(-)、英文句号(.)。

    building-a-New API-llm-gateway-demo

    ecs_name

    string

    必填

    云服务器实例名称,不支持重名。取值范围:1-64个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。

    building-a-New API-llm-gateway-demo

    ecs_flavor

    string

    必填

    云服务器实例规格,支持弹性云服务器 ECS及华为云Flexus 云服务器X实例。Flexus 云服务器X实例规格ID命名规则为x1.?u.?g,例如2vCPUs4GiB规格ID为x1.2u.4g,具体华为云Flexus 云服务器X实例规格请参考控制台。弹性云服务器规格请参考官网弹性云服务器规格清单

    x1.8u.16g

    ecs_password

    string

    必填

    云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种。修改密码。管理员账户默认root。

    ecs_volume_size

    number

    必填

    云服务器系统盘大小,磁盘类型默认为高IO,单位:GB,取值范围为40-1,024,不支持缩盘。

    100

    bandwidth_size

    number

    必填

    弹性公网带宽大小,该模板计费方式为按流量计费。单位:Mbit/s,取值范围:1-300Mbit/s。

    300

    charging_mode

    string

    必填

    计费模式,默认自动扣费,取值为prePaid(包年包月)或postPaid(按需计费)。

    postPaid

    charge_period_unit

    string

    必填

    计费周期单位,当计费方式设置为prePaid,此参数是必填项。有效值为:month(包月)和year(包年)。

    month

    charging_period

    number

    必填

    计费周期,当计费模式设置为prePaid,此参数是必填项。可选值为:1-3(year)、1-9(month)。

    1

  4. (可选,如果使用华为主账号或admin用户组下的IAM子账户可不选委托)在资源设置界面中,在权限委托下拉框中选择“rf_admin_trust”委托,单击“下一步”。

    图4 委托设置

  5. 在配置确认界面中,单击“创建执行计划”。

    图5 配置确认

  6. 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确定”。

    图6 创建执行计划

  7. 单击“部署”,并且在弹出的执行计划确认框中单击“执行”。

    图7 执行计划
    图8 执行计划确认

  8. (可选)如果计费模式选择“包年包月”,在余额不充足的情况下(所需总费用请参考资源和成本规划中对应一键部署云服务所需的包年包月费用表)请及时登录费用中心,手动完成待支付订单的费用支付。
  9. 待“事件”中出现“Apply required resource success”,表示该解决方案已经部署完成。

    图9 部署完成

  10. 在“输出”中查看访问说明。堆栈部署成功后,New API应用部署脚本开始执行,耐心等待10分钟左右(受网络波动影响)。

    图10 说明

相关文档