云监控服务 CES
云监控服务 CES
- 最新动态
- 功能总览
- 产品介绍
- 快速入门
- 用户指南
- 最佳实践
- API参考
- SDK参考
- 常见问题
- 视频帮助
-
更多文档
-
用户指南(阿布扎比区域)
- 产品介绍
- 快速入门
- 监控看板
- 资源分组
- 使用告警功能
- 主机监控
- 自定义监控
- 事件监控
- 任务中心
- 数据转储
- 云服务监控
- 审计云监控服务操作记录
- 权限管理
- 配额调整
- 支持监控的服务列表
-
常见问题
- 产品咨询
-
主机监控
- 什么是插件修复配置?
- 怎样让新购ECS实例中带有操作系统监控功能?
- 裸金属服务器安装Agent后,裸金属实例为何出现在“主机监控 > 弹性云服务器”列表中?
- Agent支持的系统有哪些?
- Agent不同插件状态说明及处理方式
- Agent状态切换或监控面板有断点该如何处理?
- 业务端口被Agent占用该如何处理?
- 如何创建委托?
- 不能创建委托该如何处理?
- 委托被占用该如何处理?
- 委托已失效该如何处理?
- 主机监控Agent对主机的性能会有影响吗?
- Agent插件状态显示“故障”该如何处理?
- Agent插件状态显示“已停止”该如何处理?
- Agent插件状态显示“运行中”但没有数据该如何处理?
- 如何排查Agent一键修复失败问题?
- Agent一键修复后无监控数据问题排查
- 告警通知或误告警
- 监控数据异常
- 监控指标含义
- 用户权限
- API参考(阿布扎比区域)
- 用户指南(巴黎区域)
- API参考 (巴黎区域)
- 用户指南(吉隆坡区域)
- API参考(吉隆坡区域)
- 用户指南(安卡拉区域)
- API参考(安卡拉区域)
-
用户指南(阿布扎比区域)
- 通用参考
本文导读
展开导读
链接复制成功!
支持GPU监控的环境约束
- 仅支持Linux操作系统,且仅部分Linux公共镜像版本支持GPU监控,详情见:Agent支持的系统有哪些?
- 支持的规格:G6v、G6、P2s、P2v、P2vs、G5、Pi2、Pi1、P1系列的ECS,P、Pi、G、KP系列的BMS。
- 已安装lspci工具,未安装lspci工具的云服务器不支持采集GPU指标数据及上报事件。
- 登录弹性云服务器。
- 更新镜像源,获取安装依赖。
wget http://mirrors.myhuaweicloud.com/repo/mirrors_source.sh && bash mirrors_source.sh
更多内容,请参见如何使用自动化工具配置华为云镜像源(x86_64和ARM)?
- 执行以下命令,安装lspci工具。
- 执行以下命令,查看安装结果。
图1 安装结果
- GPU指标采集需要依赖以下驱动文件,请检查环境中对应的驱动文件是否存在。
- Linux驱动文件
nvmlUbuntuNvidiaLibraryPath = "/usr/lib/x86_64-linux-gnu/libnvidia-ml.so.1" nvmlCentosNvidiaLibraryPath = "/usr/lib64/libnvidia-ml.so.1" nvmlCceNvidiaLibraryPath = "/opt/cloud/cce/nvidia/lib64/libnvidia-ml.so.1"
- Windows驱动文件
DefaultNvmlDLLPath = "C:\\Program Files\\NVIDIA Corporation\\NVSMI\\nvml.dll" WHQLNvmlDLLPath = "C:\\Windows\\System32\\nvml.dll"
- Linux驱动文件
父主题: 主机监控