智能诊断ECS
操作场景
在日常运维中,ECS云服务器可能会遇到各种异常,如远程登录失败、运行卡顿,网络丢包等。这些问题如果不及时处理,将影响业务的正常运行。盘古Doer支持对ECS云服务器的一些常见异常进行自助诊断,旨在帮助用户快速发现问题,并给出解决方案,从而大大提升ECS异常的处理响应时间,确保业务稳定运行。
诊断能力概览
|
诊断能力 |
使用场景 |
诊断内容 |
诊断场景示例 |
|---|---|---|---|
|
弹性云服务器远程登录异常 |
如果您在ECS使用过程中,发现无法通过ssh工具登录到Linux服务器,或无法登录到Windows云服务器,则可以使用该能力进行诊断。 |
检测云服务器资源状态、端口及安全组配置、网络连接等。 |
|
|
弹性云服务器运行卡顿 |
如果您在ECS使用过程中,出现运行卡顿相关的问题,则可以使用该能力进行诊断。 |
检测云服务器负载,包括CPU、内存、带宽等利用率是否过高。 |
|
|
弹性云服务器操作系统内部诊断 |
如果您在ECS使用过程中,发现一些操作系统内的异常,如时间不同步、网络丢包、带宽上不去、业务负载不稳定等,则可以使用该能力进行诊断。 |
检测云服务器内部操作系统的运行状态,深度诊断系统性能瓶颈、网络异常、服务稳定性等操作系统内部问题。 |
前提条件
- 使用盘古Doer提问之前,必须先完成登录、实名认证和服务声明签署。
- ECS云服务器状态处于“运行中”。
约束与限制
- 对于盘古Doer生成的结果,请确认后再执行。
- 在执行盘古Doer推荐的操作/命令前,确定已经了解并接受执行该操作/命令可能带来的影响。
进入智能诊断
- 方式1:从华为云官网或管理控制台唤起智能诊断。
- 方式2:在弹性云服务器列表中,对指定的ECS实例唤起智能诊断。
- 登录ECS控制台,进入弹性云服务器列表页面。
- 单击管理控制台左上角的
,选择区域和项目。 - 在弹性云服务器列表中,选择待诊断的弹性云服务器,单击“操作”列下的“更多 > 智能诊断”。
图1 在弹性云服务器列表页唤起智能诊断
- 方式3:在弹性云服务器详情页面,对指定的ECS实例唤起智能诊断。
- 登录ECS控制台,进入弹性云服务器列表页面。
- 单击管理控制台左上角的
,选择区域和项目。 - 在弹性云服务器列表中,单击待诊断的弹性云服务器“名称”,进入弹性云服务器详情页面。
- 单击详情页左上角的
唤起智能诊断。
图2 在弹性云服务器详情页面唤起智能诊断
智能诊断场景示例
本文通过SSH无法登录、服务器运行卡顿和服务器系统时间不同步三个场景,介绍如何智能诊断ECS。
SSH登录是Linux操作系统的常用能力,用户可以通过SSH远程接入Linux操作下系统内部,进行一些日常运维操作。
当出现因网络配置错误、系统配置错误导致的SSH无法成功登录的问题时,用户可以通过盘古Doer的智能诊断ECS能力进行故障快速定位,并根据提供的解决方案快速解决问题。
示例问题
- SSH方式无法登录云服务器,VNC方式可以登录
- 弹性云服务器无法SSH登录了
- SSH登录ECS,账号密码都正确,一直提示认证失败
操作步骤
- 访问盘古Doer。
在管理控制台的任何页面均可通过单击盘古Doer
唤起。如果从华为云官网进入,系统将引导您跳转至管理控制台以获得更完整的能力支持。详细步骤,请参见进入智能诊断。 - 输入问题。
在对话框中输入您的问题,例如:“ssh无法登录服务器,vnc可以登录”。盘古Doer将自动识别您的意图,并生成实例选择输入框。
- 选择云服务器ID
您可以直接输入云服务器 ID,或从下拉提示的服务器列表中选择目标实例。确认实例后,单击“确定”即可发起智能诊断。

- 同意诊断采集协议,开始智能诊断。
诊断ECS过程中需要在操作系统内执行命令,因此需要用户授权。勾选“同意安装插件并采集数据”,单击“开始诊断”。

- 等待诊断完成。
诊断ECS过程需要安装诊断插件并执行命令检查,因此需要大约2~3分钟。

- 根据诊断结果进行问题修复。
用户在日常使用ECS时,可能会遇到因为进程异常、业务冲高等因素导致的服务器运行卡顿,此时可以通过盘古Doer的智能诊断ECS能力对服务器卡顿原因进行分析,并根据提供的建议解决卡顿问题。
示例问题
- 云服务器卡顿,请帮忙排查下是什么原因造成的
- 服务器重装了好几次系统了,还是非常卡顿
- 从本周二开始,云服务器开始极其卡顿,与之前的使用情况出现严重的区别,需要排查一下
操作步骤
- 访问盘古Doer。
在弹性云服务器列表中,对卡顿的ECS实例唤起智能诊断。
- 登录ECS控制台,进入弹性云服务器列表页面。
- 单击管理控制台左上角的
,选择区域和项目。 - 在弹性云服务器列表中,找到卡顿的弹性云服务器,单击“操作”列下的“更多 > 智能诊断”。
- 选择问题。
在弹出的盘古Doer对话框中,选择“云服务器卡顿”,单击“开始诊断”。

- 同意诊断采集协议,开始智能诊断。
诊断ECS过程中需要在操作系统内执行命令,因此需要用户授权。勾选“同意安装插件并采集数据”,单击“开始诊断”。

- 等待诊断完成。
诊断ECS过程需要安装诊断插件并执行命令检查,因此需要大约2~3分钟。

- 查看诊断结果。
您可以直接查看异常分析。您可以单击诊断报告中的“立即查看”,获取更详细的异常分析和处理建议。

- 根据诊断结果中的优化建议,进行故障修复。
用户在云服务器的实际使用过程中,可能会遇到来自操作系统内部的异常,如:业务有丢包、网络时好时坏、操作系统时间不准等,此时可以通过盘古Doer的操作系统内部诊断能力,从多个维度自动进行诊断分析,快速定位问题根因,并提供对应的修复建议。
示例问题
- 服务器时间不正确,使用date命令查看时间比正常时间快
- 我购买的几台ECS时间没有同步
- ECS操作系统时间与正常时间不一致
操作步骤
- 访问盘古Doer。
在弹性云服务器详情页面,对指定的ECS实例唤起智能诊断。
- 登录ECS控制台,进入弹性云服务器列表页面。
- 单击管理控制台左上角的
,选择区域和项目。 - 在弹性云服务器列表中,单击待诊断的弹性云服务器“名称”,进入弹性云服务器详情页面。
- 单击详情页左上角的
唤起智能诊断。
- 选择问题。
在弹出的盘古Doer对话框中,选择“操作系统内部诊断”,单击“开始诊断”。

- 同意诊断采集协议,开始智能诊断。
诊断ECS过程中需要在操作系统内执行命令,因此需要用户授权。勾选“同意安装插件并采集数据”,单击“开始诊断”。

- 等待诊断完成。
诊断ECS过程需要安装诊断插件并执行命令检查,因此需要大约2~3分钟。

- 根据诊断结果进行故障修复。



