查看在线服务日志
在线服务提供查看实时日志的能力,当在部署服务界面未勾选“日志对接LTS”,则查看的是服务实时日志数据,不支持查看历史日志。
同时在线服务支持日志对接LTS服务,您也可以通过LTS服务的能力查看在线服务的实时日志和历史日志。
查看在线服务实时日志
- 参考部署模型为在线服务创建一个在线服务,“高级配置”不勾选“日志对接LTS”。
图1 不勾选日志对接LTS
- 服务进入“运行中”后,单击服务名称进入服务详情页面,切换到“日志”页签,选择实例和Pod查看服务实时日志。
图2 查看服务日志
查看在线服务上报到LTS的日志
- 创建资源池时,安装云原生日志采集插件,详细操作请参考创建专属资源池。
- 参考部署模型为在线服务创建一个在线服务,“高级配置”勾选“日志对接LTS”。
图3 日志对接LTS
或修改在线服务时启用LTS服务,在在线服务列表页,单击目标服务“操作”列的“更多>修改服务”,在“高级配置”勾选“日志对接LTS”。
- 服务对接LTS日志后,进入服务详情页,切换至“日志”页签查看日志。
- 选择待查看的部署、实例和Pod(也可选择已删除的实例和Pod,用于定位实例和Pod异常退出的原因)。
图4 查看实例日志
- 选择日志的时间范围。
图5 选择查看日志的时间范围
- 查看日志信息。
可以通过配置LTS日志告警,及时发现异常日志信息,从而进一步解决异常问题。
配置LTS日志告警
- 服务对接LTS日志后,进入服务详情页,切换至“日志”页签查看日志。
- 单击“日志设置”,在设置弹框中,切换至告警规则页签。
- 单击“创建”,在“新建告警规则”弹框中配置告警规则。
更多参数说明请见配置日志告警规则。
如果需要出现告警时增加通知,请打开告警通知规则,单击创建告警通知规则,前往LTS控制台创建告警通知规则,详情请见配置日志告警通知规则。
- 单击“确定”,关键词告警规则创建成功。
创建的告警可以在日志设置弹框中修改告警配置等,详情请见告警规则后续操作。
常见问题
在线服务部署或者实例重启时,如何及时感知业务容器异常?
在云服务部署场景中,用户通常会使用对象存储服务 OBS、并行文件系统 PFS、弹性文件服务 SFS Turbo来存储和管理模型权重文件。在部署模型服务时,系统需要从这些存储服务中下载文件并挂载到业务容器中以完成服务部署。然而,在实际运行过程中,当依赖的存储服务出现异常(如网络中断、服务不可用或磁盘空间不足)时,系统无法有效感知这些异常情况,导致服务部署失败或持续处于不可用状态,且无相关事件上报,影响了服务的可靠性和用户体验。
为了解决这一问题,推理平台提供了与LTS日志系统的对接能力,通过LTS日志告警功能,开发人员可以较为及时地感知到模型权重文件读取过程中的异常,确保服务部署的顺利进行。
请参考“常见问题:在线服务部署或者实例重启时,如何及时感知业务容器异常?”进行排查处理。
