异构类实例安装支持对应监控的CES Agent(Windows)
操作场景
监控与告警是保证异构云服务器(GPU加速型实例、AI加速型实例)高可靠性、高可用性和高性能的重要功能。
通过在异构类(GPU加速型)的Windows实例上安装支持对应监控的CES Agent,可以为用户提供系统级、主动式、细颗粒度的监控,包含指标收集和系统事件上报。
当前支持的异构加速卡及对应的监控指标种类为GPU监控指标,请参见操作系统监控指标:GPU。
本章节介绍如何通过安装脚本为GPU加速型实例安装新版支持GPU监控的CES Agent。
约束与限制
- 仅支持Windows操作系统,且仅部分Windows镜像版本支持GPU监控。
表1 支持GPU监控的Windows版本 类型
版本
Windows(64bit)
Windows Server 2016 标准版 64位
Windows Server 2016 数据中心版 64位
Windows Server 2019 标准版 64位
Windows Server 2019 数据中心版 64位
- 支持的规格:G6v、G6、P2s、P2v、P2vs、Pi2、Pi1、P1。
- 不支持监听Windows类型GPU加速型实例的Xid事件。
- 使用私有镜像创建的云服务器需手动安装监控组件并安装驱动。
前提条件
- 已配置DNS和安全组,配置方法参考如何配置DNS和安全组?。
- 已配置委托,配置方法参考如何配置委托?。
- 已安装GPU驱动,未安装GPU驱动的云服务器不支持采集GPU指标数据及上报事件。
如果您的弹性云服务器未安装GPU驱动,可参见(推荐)自动安装GPU加速型ECS的GPU驱动(Windows)。
- 需使用具有Administrator权限的账户进行安装,例如Administrator用户。
- 确保云服务器的安装目录都有读写权限,并且安装成功后的Telescope进程不会被其他软件关闭。
操作步骤
本操作以Windows Server 2019 标准版 64位操作系统、Pi2规格的GPU加速型实例为例,介绍单台ECS安装新版支持GPU监控的CES Agent的操作指导。
- 使用Administrator用户,远程登录弹性云服务器。
- 在浏览器地址栏输入地址,下载安装脚本。
https://uniagent-cn-east-3.obs.cn-east-3.myhuaweicloud.com/package/install_amd64.exe
其余区域的安装脚本,请参见获取安装脚本。
- (可选)在以下路径,卸载旧版本支持GPU监控的CES Agent。
- 以管理员身份打开cmd命令窗口,在“install_amd64.exe”下载目录下,执行以下命令安装支持GPU监控的CES Agent安装脚本。
install_amd64.exe [-r RegionID] [-u UniagentVersion] [-t TelescopeVersion] [-d AgentApiDomain]
命令示例:
install_amd64.exe -r cn-east-3 -u 0.1.5 -t 2.6.7.1 -d agent.ces.myhuaweicloud.com
其中,
- RegoinID:cn-east-3
- UniagentVersion:0.1.5
- TelescopeVersion:2.6.7.1
- AgentApiDomain:agent.ces.myhuaweicloud.com
如果命令执行后出现“Access is denied”,可能是由于未以管理员身份打开cmd命令窗口导致,请切换为管理员身份重新执行命令。
当界面显示“Install service success”或“Install agent successfully”时,说明支持GPU监控的CES Agent安装成功并启动。
图1 支持GPU监控的CES Agent安装成功
获取安装脚本
您可以通过以下地址,下载获取新版支持CES监控Agent的安装脚本。