更新时间:2026-02-05 GMT+08:00
分享

查看在线服务详情

当模型部署为在线服务成功后,您可以进入“在线服务”详情页面,来查看服务的详细信息。

  1. 登录ModelArts管理控制台,在左侧菜单栏中选择“模型推理 > 在线推理”,进入“在线推理”管理页面。

    在线服务列表页的搜索框中,支持根据服务名称、服务ID、服务状态、服务创建者、服务的认证方式、服务部署的资源池ID等字段搜索。

  2. 您可以单击在线服务名称,进入在线服务的详情页面,通过切换页签查看更多详细信息,详情说明请参见表1
    表1 在线服务详情

    参数

    说明

    服务

    展现服务的基础信息、调用配置、流量权重和高级配置。

    调用信息可以通过复制API调用地址,调用服务。

    部署

    展现服务的部署信息,通过切换左侧卡片,可以查看不同部署的部署信息。

    在部署信息中,单击资源池名称,可前往资源池详情页查看资源池配置信息,详情请见查看专属资源池详情

    单击部署实例数的“查看详情”,可查看服务实例详情,可根据业务情况删除实例,也可以对部署实例进行扩缩容,详情请见扩缩容在线服务部署。使用公共资源池创建的服务部署,不支持删除部署实例及Pod。

    单击流量权重的修改配置,可修改服务部署的流量权重,详情请见修改服务部署的流量权重

    单击版本数量的查看详情,可查看当前部署的版本列表,可对部署版本进行切换和删除操作。不能删除当前部署版本。

    在左侧部署小卡片中,可进行升级部署、停止部署、扩缩容等操作,详情请见管理在线服务部署的生命周期

    预测

    对在线服务进行预测。具体操作请参见使用预测功能测试在线服务

    监控

    展现当前服务的监控数据。具体监控数据请见在ModelArts平台查看在线服务性能指标

    Cloud Shell

    允许用户使用ModelArts控制台提供的CloudShell登录运行中在线服务实例容器,详情请见使用CloudShell调试在线服务实例容器

    事件

    服务事件记录了服务层面在线服务在运行过程中产生的各种事件,包括但不限于服务启动、停止、升级、故障恢复等。服务事件保存周期为1个月,1个月后自动清理数据。

    Pod事件记录了底层容器Kubernetes集群中Pod的生命周期事件和异常情况。Pod事件保存周期为1小时,1小时后自动清理数据。

    查看服务的事件类型和事件信息,请参见查看在线服务的事件

    日志

    在线服务的运行日志会输出存放到云日志服务LTS。LTS自动创建日志组和日志流,默认缓存7天内的运行日志。支持对在线服务的运行日志进行搜索和分析。

    • 日志搜索:通过输入搜索语句,在日志数据中查找包含特定关键词的日志记录。或者根据时间范围来检索日志数据,帮助您定位特定时间段内发生的事件和问题。详情请见LTS搜索日志
    • 统计图表:日志上报LTS后,支持通过SQL分析语法搜索关键日志数据,并将查询结果通过统计图表的方式进行可视化展示。详情请见使用统计图表将日志可视化
    • 日志分析:执行搜索与分析前,需要将上报的日志进行结构化配置和索引配置,方便进行搜索与分析。详情请见配置云端结构化解析规则
    • 实时日志:在线服务运行日志接入LTS后,每隔大约1分钟上报一次。因此,在实时日志页面,您最多需要等待1分钟左右,即可查看实时上报的日志,实现对日志数据的快速检索与分析。详情请见查看实时日志

    内网接入管理

    展示需要当前账号审批的内网接入申请。

    ModelArts提供内网接入功能,通过创建内网接入申请,实现自动创建VPCEP,打通VPC与推理在线服务的内网连接。详情请见通过内网访问在线服务

    标签

    展示服务已添加的标签。支持添加、修改、删除标签。

    标签详细用法请参见ModelArts如何通过标签实现资源分组管理

相关文档