弹性云服务器 ECS

 

弹性云服务器(Elastic Cloud Server)是一种可随时自助获取、可弹性伸缩的云服务器,帮助用户打造可靠、安全、灵活、高效的应用环境,确保服务持久稳定运行,提升运维效率

 
 

    检查服务器是否有异常进程 更多内容
  • 节点关键命令检查异常处理

    节点关键命令检查异常处理 检查项内容 检查节点升级依赖的一些关键命令是否能正常执行。 解决方案 问题场景一:包管理器命令执行失败 检查到包管理器命令rpm或dpkg命令执行失败,请登录节点排查下列命令的可用性。 rpm -qa 如果上述命令不可用,可通过以下命令恢复: rpm --rebuilddb

    来自:帮助中心

    查看更多 →

  • 检查节点镜像数量异常处理

    检查节点镜像数量异常处理 检查项内容 检查到您的节点上镜像数量过多(>1000个),可能导致docker启动过慢,影响docker标准输出,影响nginx等功能的正常使用。 解决方案 请手动删除残留的镜像,防止后续升级异常; 删除镜像之后请您重新进行升级前检查 父主题: 升级前检查异常问题排查

    来自:帮助中心

    查看更多 →

  • 节点镜像层数量异常检查

    节点镜像层数量异常检查 检查项内容 检查到您的节点上镜像层数量过多(>5000层),可能导致docker/containerd启动过慢,影响docker/containerd标准输出。 如果您集群中使用了nginx,可能会出现转发变慢等问题。 解决方案 请登录节点手动删除用不到的镜像,防止后续升级异常。

    来自:帮助中心

    查看更多 →

  • Agent一键修复后无监控数据问题排查

    以administrator权限用户登录弹性云 服务器 或裸金属服务器。 进入任务管理器,查看telescope进程是否存在。 当包括图5和图6两个进程时,表示telescope进程正常。 图5 agent进程-Windows 图6 telescope进程-Windows 进程正常:请执行4。 进程异常:请执行3。 双击C:\Program

    来自:帮助中心

    查看更多 →

  • 兼容性风险检查异常处理

    15版本的Kubelet存在兼容性问题。若Master节点升级成功后,节点升级失败或待升级节点发生重启,则节点有极大概率为NotReady状态。 主要原因为升级失败的节点大概率重启kubelet而触发节点注册流程,v1.15 kubelet默认注册标签(failure-domain.beta.kubernetes

    来自:帮助中心

    查看更多 →

  • 节点Python命令检查异常处理

    节点Python命令检查异常处理 检查项内容 检查Node节点中Python命令是否可用。 检查方式 /usr/bin/python --version echo $? 如果回显值不为0证明检查失败。 解决方案 可优先重置节点或手动安装Python之后再进行升级。 父主题: 升级前检查异常问题排查

    来自:帮助中心

    查看更多 →

  • 节点ID文件检查异常处理

    节点ID文件检查异常处理 检查项内容 检查节点的ID文件内容是否符合格式。 解决方案 在CCE控制台上的“节点管理”页面,单击异常节点名称进入E CS 界面。 复制节点ID,保存到本地。 图1 复制节点ID 登录异常节点,备份文件 。 cp /var/lib/cloud/data/instance-id

    来自:帮助中心

    查看更多 →

  • 节点系统参数检查异常处理

    节点系统参数检查异常处理 检查项内容 检查您节点上默认系统参数是否被修改。 解决方案 如您的bms节点上bond0网络的mtu值非默认值1500,将出现该检查异常。 非默认参数可能导致业务丢包,请改回默认值。 父主题: 升级前检查异常问题排查

    来自:帮助中心

    查看更多 →

  • 残留packageversion检查异常处理

    残留packageversion检查异常处理 检查项内容 检查当前集群中是否存在残留的packageversion。 解决方案 检查提示您的集群中存在残留的CRD资源10.12.1.109,该问题一般由于CCE早期版本节点删除后,对应的CRD资源未被清除导致。 您可以尝试手动执行以下步骤:

    来自:帮助中心

    查看更多 →

  • GPU插件关键参数检查异常处理

    GPU插件关键参数检查异常处理 检查项内容 检查CCE GPU插件中部分配置是否被侵入式修改,被侵入式修改的插件可能导致升级失败。 解决方案 使用kubectl连接集群。 执行以下命令获取插件实例详情。 kubectl get ds nvidia-driver-installer

    来自:帮助中心

    查看更多 →

  • ALM-16004 Hive服务不可用(2.x及以前版本)

    重启实例”,重启HiveServer/MetaStore进程。 在告警列表中,查看“ALM-16004 Hive服务不可用”告警是否清除。 是,处理完毕。 否,执行2。 检查ZooKeeper服务状态。 登录 MRS 集群详情页面,选择“告警管理”。 在告警列表中,查看是否ALM-12007 进程故障产生。 是,执行2

    来自:帮助中心

    查看更多 →

  • 无法登录到Linux云服务器怎么办?

    禁用或者卸载第三方杀毒软件后重试,详细操作请参考检查是否为杀毒软件拦截。 连接实例详细的报错信息提示。 远程连接有报错信息提示时,请根据详细报错信息查看操作指导。详细操作请参考远程登录是否报错信息。 检查资源状态是否正常 请在控制台检查服务器资源状态是否为“运行中”。如果云服务器状态为“关机”,请先开机再登录云服务器。

    来自:帮助中心

    查看更多 →

  • ALM-16004 Hive服务不可用

    在告警列表中,查看“Hive服务不可用”告警是否清除。 是,处理完毕。 否,执行4。 检查ZooKeeper服务状态。 在 FusionInsight Manager的告警列表中,查看是否进程故障”产生。 是,执行5。 否,执行8。 在“进程故障”,查看“服务名”是否为“ZooKeeper”。 是,执行6。

    来自:帮助中心

    查看更多 →

  • ALM-18028 TimeLineServer进程状态异常

    '{print$1}' 查看命令执行结果中是否包含D、Z、T中的任意一种。 是,执行5。 否,执行7。 切换到root用户,执行reboot命令,重启产生告警主机(重启主机风险,请确保重启后业务进程正常)。 等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行7。 收集故障信息。

    来自:帮助中心

    查看更多 →

  • ALM-18027 JobHistoryServer进程状态异常

    '{print$1}' 查看命令执行结果中是否包含D、Z、T中的任意一种。 是,执行5。 否,执行7。 切换到root用户,执行reboot命令,重启产生告警主机(重启主机风险,请确保重启后业务进程正常)。 等待5分钟,检查该告警是否恢复。 是,处理完毕。 否,执行7。 收集故障信息。

    来自:帮助中心

    查看更多 →

  • ALM-12007 进程故障(2.x及以前版本)

    对系统的影响 该进程提供的业务不可用。 可能原因 实例进程异常。 磁盘空间不足。 处理步骤 检查实例进程是否异常。 打开MRS集群详情页面,在告警管理页签的告警列表中,单击此告警所在行,在告警详情中,查看该告警的主机名称与服务名称。 在“告警管理”页面,查看是否ALM-12006

    来自:帮助中心

    查看更多 →

  • 验证DIS Agent

    处理方法:停止Agent进程检查AK/SK配置。 ConnectTimeoutException: Connect to DOMAIN[DOMAIN/IP] failed: connect timed out 可能原因:服务器连接DIS网关超时。 处理方法:检查Agent所在日志服务器的网络配置是否可以连接公网。

    来自:帮助中心

    查看更多 →

  • ALM-25004 LdapServer数据同步异常(2.x及以前版本)

    LdapServer数据同步异常”告警是否清除。 是,处理完毕。 否,执行2.e。 在MRS Manager的“告警管理”页面,查看是否LdapServer的ALM-12007 进程故障告警产生。 是,执行2.f。 否,执行3.a。 按照ALM-12007 进程故障(2.x及以前版本)提供的步骤处理该告警。

    来自:帮助中心

    查看更多 →

  • 管理控制台错误码

    请检查负荷信息快照参数中“性能视图快照开关”参数是否为开启状态,若为开启状态,请检查集群节点是否存在异常。如未解决请联系技术支持人员。 DWS.13005 负荷报告文件上传obs失败,请联系技术人员或稍后重试。 请检查OBS是否可正常使用,如OBS正常请联系技术支持人员检查进程间网络及进程是否存在异常。 DWS.13006

    来自:帮助中心

    查看更多 →

  • 管理控制台错误码

    请检查负荷信息快照参数中“性能视图快照开关”参数是否为开启状态,若为开启状态,请检查集群节点是否存在异常。如未解决请联系技术支持人员。 DWS.13005 负荷报告文件上传obs失败,请联系技术人员或稍后重试。 请检查OBS是否可正常使用,如OBS正常请联系技术支持人员检查进程间网络及进程是否存在异常。 DWS.13006

    来自:帮助中心

    查看更多 →

  • 检查仓库名称是否重名

    检查仓库名称是否重名 功能介绍 检查仓库名称是否重名 校验规则 同一个项目下的仓库名称不能存在重复,当结果为true时,校验通过,仓库名称可用,否则,校验不通过,当前项目下的仓库名称已存在,不可用 必传参数 project_id,name,region_id 调试 您可以在API

    来自:帮助中心

    查看更多 →

共105条
看了本文的人还看了