更新时间:2025-11-27 GMT+08:00
分享

智能诊断ECS

操作场景

在日常运维中,ECS云服务器可能会遇到各种异常,如远程登录失败、运行卡顿,网络丢包等。这些问题如果不及时处理,将影响业务的正常运行。盘古Doer支持对ECS云服务器的一些常见异常进行自助诊断,旨在帮助用户快速发现问题,并给出解决方案,从而大大提升ECS异常的处理响应时间,确保业务稳定运行。

诊断能力概览

表1 诊断能力介绍

诊断能力

使用场景

诊断内容

诊断场景示例

弹性云服务器远程登录异常

如果您在ECS使用过程中,发现无法通过ssh工具登录到Linux服务器,或无法登录到Windows云服务器,则可以使用该能力进行诊断。

检测云服务器资源状态、端口及安全组配置、网络连接等。

SSH无法登录

弹性云服务器运行卡顿

如果您在ECS使用过程中,出现运行卡顿相关的问题,则可以使用该能力进行诊断。

检测云服务器负载,包括CPU、内存、带宽等利用率是否过高。

服务器运行卡顿

弹性云服务器操作系统内部诊断

如果您在ECS使用过程中,发现一些操作系统内的异常,如时间不同步、网络丢包、带宽上不去、业务负载不稳定等,则可以使用该能力进行诊断。

检测云服务器内部操作系统的运行状态,深度诊断系统性能瓶颈、网络异常、服务稳定性等操作系统内部问题。

服务器系统时间不同步

前提条件

  • 使用盘古Doer提问之前,必须先完成登录、实名认证和服务声明签署。
  • ECS云服务器状态处于“运行中”。

约束与限制

  • 对于盘古Doer生成的结果,请确认后再执行。
  • 在执行盘古Doer推荐的操作/命令前,确定已经了解并接受执行该操作/命令可能带来的影响。

进入智能诊断

  • 方式1:华为云官网管理控制台唤起智能诊断。
    1. 进入华为云官网管理控制台
    2. 单击页面右侧的AI助手,唤起盘古Doer。
    3. 在对话框中输入您遇到的问题。
  • 方式2:弹性云服务器列表中,对指定的ECS实例唤起智能诊断。
    1. 登录ECS控制台,进入弹性云服务器列表页面。
    2. 单击管理控制台左上角的,选择区域和项目。
    3. 弹性云服务器列表中,选择待诊断的弹性云服务器,单击“操作”列下的“更多 > 智能诊断”。
      图1 弹性云服务器列表页唤起智能诊断
  • 方式3:弹性云服务器详情页面,对指定的ECS实例唤起智能诊断。
    1. 登录ECS控制台,进入弹性云服务器列表页面。
    2. 单击管理控制台左上角的,选择区域和项目。
    3. 弹性云服务器列表中,单击待诊断的弹性云服务器“名称”,进入弹性云服务器详情页面。
    4. 单击详情页左上角的唤起智能诊断。
      图2 弹性云服务器详情页面唤起智能诊断

智能诊断场景示例

本文通过SSH无法登录、服务器运行卡顿和服务器系统时间不同步三个场景,介绍如何智能诊断ECS。

SSH登录是Linux操作系统的常用能力,用户可以通过SSH远程接入Linux操作下系统内部,进行一些日常运维操作。

当出现因网络配置错误、系统配置错误导致的SSH无法成功登录的问题时,用户可以通过盘古Doer的智能诊断ECS能力进行故障快速定位,并根据提供的解决方案快速解决问题。

示例问题

  • SSH方式无法登录云服务器,VNC方式可以登录
  • 弹性云服务器无法SSH登录了
  • SSH登录ECS,账号密码都正确,一直提示认证失败

操作步骤

  1. 访问盘古Doer。

    在管理控制台的任何页面均可通过单击盘古Doer唤起。如果从华为云官网进入,系统将引导您跳转至管理控制台以获得更完整的能力支持。详细步骤,请参见进入智能诊断

  2. 输入问题。

    在对话框中输入您的问题,例如:“ssh无法登录服务器,vnc可以登录”。盘古Doer将自动识别您的意图,并生成实例选择输入框。

  3. 选择云服务器ID

    您可以直接输入云服务器 ID,或从下拉提示的服务器列表中选择目标实例。确认实例后,单击“确定”即可发起智能诊断。

  4. 同意诊断采集协议,开始智能诊断。

    诊断ECS过程中需要在操作系统内执行命令,因此需要用户授权。勾选“同意安装插件并采集数据”,单击“开始诊断”。

  5. 等待诊断完成。

    诊断ECS过程需要安装诊断插件并执行命令检查,因此需要大约2~3分钟。

  6. 根据诊断结果进行问题修复。

用户在日常使用ECS时,可能会遇到因为进程异常、业务冲高等因素导致的服务器运行卡顿,此时可以通过盘古Doer的智能诊断ECS能力对服务器卡顿原因进行分析,并根据提供的建议解决卡顿问题。

示例问题

  • 云服务器卡顿,请帮忙排查下是什么原因造成的
  • 服务器重装了好几次系统了,还是非常卡顿
  • 从本周二开始,云服务器开始极其卡顿,与之前的使用情况出现严重的区别,需要排查一下

操作步骤

  1. 访问盘古Doer。
    弹性云服务器列表中,对卡顿的ECS实例唤起智能诊断。
    • 登录ECS控制台,进入弹性云服务器列表页面。
    • 单击管理控制台左上角的,选择区域和项目。
    • 弹性云服务器列表中,找到卡顿的弹性云服务器,单击“操作”列下的“更多 > 智能诊断”。
  2. 选择问题。

    在弹出的盘古Doer对话框中,选择“云服务器卡顿”,单击“开始诊断”。

  3. 同意诊断采集协议,开始智能诊断。

    诊断ECS过程中需要在操作系统内执行命令,因此需要用户授权。勾选“同意安装插件并采集数据”,单击“开始诊断”。

  4. 等待诊断完成。

    诊断ECS过程需要安装诊断插件并执行命令检查,因此需要大约2~3分钟。

  5. 查看诊断结果。

    您可以直接查看异常分析。您可以单击诊断报告中的“立即查看”,获取更详细的异常分析和处理建议。

  6. 根据诊断结果中的优化建议,进行故障修复。

用户在云服务器的实际使用过程中,可能会遇到来自操作系统内部的异常,如:业务有丢包、网络时好时坏、操作系统时间不准等,此时可以通过盘古Doer的操作系统内部诊断能力,从多个维度自动进行诊断分析,快速定位问题根因,并提供对应的修复建议。

示例问题

  • 服务器时间不正确,使用date命令查看时间比正常时间快
  • 我购买的几台ECS时间没有同步
  • ECS操作系统时间与正常时间不一致

操作步骤

  1. 访问盘古Doer。
    弹性云服务器详情页面,对指定的ECS实例唤起智能诊断。
    • 登录ECS控制台,进入弹性云服务器列表页面。
    • 单击管理控制台左上角的,选择区域和项目。
    • 弹性云服务器列表中,单击待诊断的弹性云服务器“名称”,进入弹性云服务器详情页面。
    • 单击详情页左上角的唤起智能诊断。
  2. 选择问题。

    在弹出的盘古Doer对话框中,选择“操作系统内部诊断”,单击“开始诊断”。

  3. 同意诊断采集协议,开始智能诊断。

    诊断ECS过程中需要在操作系统内执行命令,因此需要用户授权。勾选“同意安装插件并采集数据”,单击“开始诊断”。

  4. 等待诊断完成。

    诊断ECS过程需要安装诊断插件并执行命令检查,因此需要大约2~3分钟。

  5. 根据诊断结果进行故障修复。

    查看诊断结果,根据诊断报告中的优化建议,进行故障修复。

相关文档