文档首页/ 主机安全服务 HSS/ 常见问题/ Agent相关/ 主机安全服务升级失败怎么处理?
更新时间:2024-08-03 GMT+08:00
分享

主机安全服务升级失败怎么处理?

Agent升级说明

  • 无论升级前还是升级后同一台主机都会同时在主机安全服务新、旧版呈现,服务器状态以使用的控制台版本为准。
  • 整个升级Agent过程均为免费。
  • 升级时查看“Agent状态”“在线”才能正常升级。
  • 升级过程中不影响您在云服务器上业务的正常使用。
  • 升级后将在新版conosle进行计费,旧版停止计费。
  • 升级后云服务器在主机安全服务(新版)继续被防护,主机安全服务(旧版)将停止防护。

升级Agent原理

主机安全服务控制台单击升级Agent后,系统将自动按照先卸载Agent1.0,然后安装Agent2.0的顺序执行,无需人为操作。

  • 升级时Agent在旧版控制台反馈的状态:
    • 升级成功:已经升级成功,可切换至主机安全服务(新版)查看防护情况。
    • 升级中:Agent正在升级。
    • 升级失败:Agent升级失败。
  • 升级时Agent在新版控制台反馈的状态:
    • 未安装:目标主机在新版控制台还未进行Agent安装。
    • 在线:Agent运行正常。
    • 离线:Agent通信异常。

失败常见原因

自动执行升级完成后,需要等待5~10分钟左右Agent才会自动刷新Agent状态。

Agent升级失败或超过等待时间仍不显示可能原因如下:

  1. DNS无法解析:Agent升级只能通过内网DNS解析,因此需要保证内网DNS地址的正确性。
  2. 10180端口被限制访问:Agent升级需要通过端口10180进行访问。
  3. 可用内存不足:Agent升级需要占用一定内存,主机剩余内存小于300M会影响正常升级。
  4. 无法正常获取metadata:Agent升级需要获取服务器的ID、名称、Region等信息。

原因排查及解决办法

  • DNS无法解析
    • 排查步骤
      1. 通过远程管理工具(如:SecureFX、WinSCP)远程登录目标云服务器。
      2. 执行以下命令,查询目标云服务器的内网DNS地址。

        cat /etc/resolv.conf

      3. 记录目标服务器已查询的DNS地址和所在Region,参照内网DNS地址对比,确认是否与标准的Region和DNS地址相匹配。
      4. 如果排查确认Region和DNS匹配,则非DNS解析问题,排查其他原因。

        如果Region和DNS不匹配,则为内网DNS解析地址有误。

    • 解决办法

      确认Region和DNS不匹配后,需要确认服务器已设置的内网DNS修改后是否影响业务。

      • 如果不影响,可参照切换服务器的DNS地址修改服务器的内网DNS,修改后执行升级。
      • 如果会影响业务,内网DNS无法进行修改,您需要建立主机名与IP地址之间的映射关系,添加信息后执行升级,操作步骤如下:
        1. 登录目标云服务器。
        2. 执行以下命令,切换至root权限。

          sudo su -

        3. 执行以下命令,编辑hosts文件。

          vi /etc/hosts

        4. 键盘键入“i”,进入编辑模式。
        5. 按照如下格式添加语句,建议映射关系。

          私有IP地址 主机名

          【示例】:

          192.168.0.1 hostname01

          192.168.0.2 hostname02

        6. 键盘键入“Esc”退出编辑模式。
        7. 执行以下命令,保存并退出。

          :wq

  • 10180端口被限制访问。
    待安装或升级Agent的线上主机需要与网段相通,要求您的服务器安全组出方向的设置允许访问100.125.X.X/16网段的10180端口。
    • 排查步骤
      1. 在页面左上角选择“区域”,单击,选择计算 > 弹性云服务器
      2. 单击目标服务器名称,进入服务器详情页面,单击“安全组”,查看安全组规则。
      3. 选择“出方向规则”,查看禁止策略中是否有10180端口。
        1. 如果没有,表示非端口被限制访问问题。
        2. 如果存在,表示端口被限制访问。
    • 解决办法

      端口被限制访问,需要将端口策略修改为允许,操作详情请参见配置安全组规则中的步骤8。

  • 可用内存不足。
    • 排查步骤
      • Linux主机
        1. 通过远程管理工具(如:SecureFX、WinSCP)远程登录目标云服务器。
        2. 执行以下命令,查看目标云服务器的内存使用情况。

          free -m

        3. 执行命令反馈信息如图1所示,查看free项的数值。
          如果available数值小于300M,则表示内存不足。
          图1 查看内存
      • Windows主机
        1. 通过远程管理工具(如:mstsc、rdp)远程登录目标云服务器。
        2. 打开任务管理器。
        3. 选择性能 > 内存,进入“内存”页面,查看剩余可用内存。

          如果可用内存小于300M,则表示内存不足。

    • 解决办法
      • 关闭一些高内存占用的应用程序。
      • 扩充内存容量后再进行安装,扩容操作详情请参见变更服务器规格
  • 无法正常获取metadata。

相关文档