通过负载均衡连接内网访问在线服务
方案概述
弹性负载均衡(Elastic Load Balance)是将访问流量根据转发策略分发到后端多台弹性云服务器的流量分发控制服务,可以通过流量分发扩展应用系统对外的服务能力,提高应用程序的容错能力。
为了确保外网用户能够安全、高效地访问ModelArts提供的在线服务,并更灵活地整合ModelArts提供的预测服务,弹性负载均衡通过SSL证书加密传输数据,并结合VPC网络隔离和访问控制列表实现安全防护;通过配置路由规则将ModelArts预测服务API发布给外部系统调用。弹性负载均衡通过自动流量分发实现高效访问,通过健康检查和故障转移保障服务可用性,通过灵活的监听器配置满足不同业务场景的整合需求。
本方案将详细描述如何通过弹性负载均衡实现外网用户访问内网中的ModelArts在线服务。

权限说明
用户在使用内网接入功能时,要保证拥有以下权限。
权限名 | action | 使用场景 |
|---|---|---|
查询工作空间详情 | modelarts:workspace:get | 访问工作空间 |
查询模型服务列表 | modelarts:service:list | 查询服务列表 |
查询专属资源池列表 | modelarts:pool:list | 查询资源池列表 |
查询虚拟私有云列表 | vpc:vpcs:list | 内网接入界面和创建内网接入申请使用 |
查询子网信息 | vpc:subnets:get | 内网接入界面和创建内网接入申请使用 |
更新服务 | modelarts:service:update | 内网接入为服务粒度,创建、操作和删除内网 |
查询内网访问列表 | modelarts:intranetConnection:list | 查询内网接入列表 |
变更内网访问 | modelarts:intranetConnection:create | 创建内网接入 |
创建内网访问 | modelarts:intranetConnection:update | 更新内网接入 |
删除内网访问 | modelarts:intranetConnection:delete | 删除内网访问 |
用户还需赋予ModelArts服务以下委托权限。ModelArts添加授权授权操作请参见快速配置ModelArts委托授权。
权限名 | action | 使用场景 |
|---|---|---|
创建终端节点 | vpcep:endpoints:create | 创建内网接入、变更内网接入 |
删除终端节点 | vpcep:endpoints:delete | 删除内网接入 |
查询终端节点详情 | vpcep:endpoints:get | 创建内网接入、变更内网接入 |
查询终端节点列表 | vpcep:endpoints:list | 创建内网接入、变更内网接入 |
步骤二:创建内网连接
- 登录ModelArts管理控制台,在左侧导航栏中选择“模型推理 > 在线推理”,默认进入“在线推理”列表。
- 单击“内网接入管理”,切换至“内网接入管理”页面。
- 在“我的申请”页签下,单击“创建”。
- 在“创建申请”弹框中填写参数,单击“确定”。 在“我的申请”查看申请状态,待申请状态为“接入成功”,即申请审批通过。
表3 内网接入申请参数说明 参数
说明
本案例推荐值
服务ID
需要内网访问的推理服务ID。
在推理服务列表单击服务名称,进入服务详情页获取在线服务ID。
申请场景
申请打通内网的VPC场景。
- 用户网络:打通当前用户指定VPC与推理服务的内网连接。
- 资源池网络:打通已创建的资源池与推理服务的内网连接。
用户网络。
VPC
当申请场景选择“用户网络”时,选择待打通内网连接的VPC。
选择步骤一:创建VPC创建的VPC。
子网
当申请场景选择“用户网络”时,选择待打通内网连接的子网。
选择步骤一:创建VPC创建的子网。
资源池
当申请场景选择“资源池网络”时,选择待打通内网连接的资源池。
不涉及。
自定义访问地址
放通用户域名,允许用户通过公网IP经过负载均衡连接内网访问在线服务。
ELB的公网IP。
步骤三:创建弹性负载均衡
步骤四:创建后端服务器组
负载均衡实例的监听器绑定后端服务器组后,才能正常转发访问请求。
- 在负载均衡实例控制台单击负载均衡实例,进入“负载均衡实例”详情页面,单击页面右上角“创建后端服务器组”按钮。
- 配置“配置后端分配策略”参数,本案例需要配置的参数详情请参见表5。更多参数说明请见创建后端服务器组。
- 单击“下一步”,配置“添加后端服务器”参数,需要配置的参数详情请参见表6。
选择IP类型后端(跨VPC后端),单击“添加IP类型后端”,填写“IP类型后端IP”、“业务端口”和“权重”,单击“确定”。
表6 后端服务器参数说明 参数
配置值
IP类型后端IP
填写为步骤二:创建内网连接中获取的“访问地址”的IP地址。
例如:获取的“访问地址”是“http://192.168.0.204/v2/infer/d64cda4f-af92-4bd3-804d-763b26201661”,配置为“192.168.0.204”。
业务端口
“后端协议”是“HTTP”,配置为“80”;
“后端协议”是“HTTPS”,配置为“443”。
权重
1
是否开启
否
- 单击“下一步”,确认配置无误后,单击“立即创建”。
步骤五:添加监听器
- 进入“负载均衡实例”详情页面,在“负载均衡实例”详情页面,单击“监听器”页签,单击“添加监听器”按钮。
- 在添加监听器对话框中配置参数,需要配置的参数请参见表7,其他配置按需进行配置,更多参数说明请见添加HTTPS监听器。
- 单击“下一步:配置后端分配策略”,配置“配置后端分配策略”参数,需要配置的参数详情请参见表8。更多参数说明请见创建后端服务器组。
- 单击右下角的“下一步:添加后端服务器”,本案例在此页面可不做任何操作。
- 单击“下一步:确认配置”,确认配置无误后,单击“提交”。
步骤六:通过公网地址访问在线服务
- 获取公网调用地址,在线服务的公网调用地址是${协议}://${负载均衡实例的IPv4公网地址}/v2/infer/${在线服务ID}/${具体的API}。
例如:http://100.85.221.69/v2/infer/d64cda4f-af92-4bd3-804d-763b26201661/v1/allrequestdata
- “在线服务ID”和“协议”:可以在ModelArts控制台的“模型推理 > 在线推理”,单击指定在线服务,在“服务”页签的“基本信息>ID”和“网络配置>服务协议”获取。
- “负载均衡实例的IPv4公网地址”:可在负载均衡控制台的负载均衡实例基本信息页签的“服务地址>IPv4公网地址”。
图2 在线服务基本信息
图3 负载均衡实例基本信息
- 使用Postman通过公网地址访问在线服务。 图4 通过公网地址访问在线服务


